Основы корреляционного анализа презентация

Содержание


Презентации» Математика» Основы корреляционного анализа
Основы корреляционного анализаМногомерный корреляционный анализ
 При исследование реальных экономических явлений
 приходится сталкиваться сМногомерный корреляционный анализ
   Закон распределения не известен
  Многомерный корреляционный анализ
    Ковариационная матрица   Ковариация
 Ковариация
   Для устранения недостатка ковариации был введён линейныйОснователи корреляционного анализа 
 
 Карл (Чарлз) Пирсон
 (Karl (Charles) Pearson)Ковариация
 Ковариация
   Коэффициент корреляции рассчитывается по формуле:Исследование зависимости между 2 переменными
   Исследование зависимости между 2Диаграмма рассеяния (scatterplot)«Существует ли зависимость между доходом семьи и ее расходами на питание?»
Характеристики статистической связи, рассматриваемые в корреляционном анализе используются в качестве «входной»Корреляционный анализ
 Основные понятия
 Коэффициент корреляции – 
 измеритель силы линейнойКорреляционный анализ
 Основные понятия
 
 Случайные величины X и Y могутТипы зависимостей случайных величин
   Функциональной зависимостью переменной Y отТипы зависимостей случайных величин
  Пример: 
 Допустим, что на XТипы зависимостей случайных величин
  Пример: 
 Допустим, что на XТипы зависимостей случайных величин
 2.      Z1
Типы зависимостей случайных величин
 2.      Z1
Типы зависимостей случайных величин
     у
  Типы зависимостей случайных величин
    Среди множества значений YТипы зависимостей случайных величин
   Если изменение одной из СВИсследование зависимости между 2 переменными
   Исследование зависимости между 2Линейный коэффициент корреляции  Двумерная корреляционная модель
 Исходной для анализа являетсяКорреляционный анализ
 	Двумерная корреляционная модель
   Двумерная корреляционная модель определяетсяКоэффициенты корреляции
 Парный коэффициент корреляции 
    характеризует теснотуКорреляционный анализ
 Точечные оценки параметров двумерной корреляционной моделиДиаграмма рассеяния
 	 Диаграмма рассеяния
   На практике изучение зависимостиДиаграммы рассеиванияСвойства коэффициента корреляции:
    Если точки не выстраиваются поСвойства коэффициента корреляции
 Свойства коэффициента корреляции
 -1 ≤ ρ ≤ 1Свойства коэффициента корреляции
 Свойства коэффициента корреляции
 
  2. Если случайныеСвойства коэффициента корреляции
 Свойства коэффициента корреляции
 
  2. Из условияСвойства коэффициента корреляции:
 Свойства коэффициента корреляции:
   3. ρ >Свойства коэффициента корреляции:
 Свойства коэффициента корреляции:
   3. ρ >Свойства коэффициента корреляции
 Свойства коэффициента корреляции
  45. Сила корреляционной связиСвойства коэффициента корреляции
 Свойства коэффициента корреляции
  ПримерСвойства коэффициента корреляции
 Свойства коэффициента корреляции
 5.  Неважно, какую переменнуюСвойства коэффициента корреляции
 Свойства коэффициента корреляции
 7.  Коэффициент корреляции неСвойства коэффициента корреляции
 Свойства коэффициента корреляции
 8.  Если все значенияСвойства коэффициента корреляции:
 Свойства коэффициента корреляции:
 9.  Коэффициент корреляции оченьСвойства коэффициента корреляции:
 Свойства коэффициента корреляции:
 9.  Коэффициент корреляции оченьСвойства коэффициента корреляции:
 Свойства коэффициента корреляции:
 Наблюдения до и после удаленияСвойства коэффициента корреляции:
 Свойства коэффициента корреляции:
 if you cannot justify removingСвойства коэффициента корреляции:
 Свойства коэффициента корреляции:
 if you cannot justify removingСвойства коэффициента корреляции:
 Свойства коэффициента корреляции:
 if you cannot justify removingСвойства коэффициента корреляции:
 Свойства коэффициента корреляции:Пример
   Оцените значение коэффициента корреляции r для каждого изПример
   Оцените значение коэффициента корреляции r для каждого изПроверка значимости коэффициента корреляции 
   Значимость парных коэффициентов корреляцииПроверка значимости коэффициента корреляции  
   2. Нахождение критическогоКорреляционный анализ 
  II способ. С использованием критерия Фишера-Иейтса
 Проверка независимости (значимости) признаков
 1. 
 2.
 3. ВыводКоэффициент детерминации в двумерной модели
   Квадрат парного коэффициент корреляцииКоэффициент детерминации в двумерной модели
   Квадрат парного коэффициент корреляцииИнтервальные оценки параметров связи 
   I. Для значимых параметровИнтервальные оценки параметров связи
 2. Обратный переход от Z к rТрёхмерная корреляционная модель
   Пусть признаки X, Y, Z образуютТрёхмерная корреляционная модель
   Пусть признаки X, Y, Z образуютТрёхмерная корреляционная модель
   Для изучения разнообразия связей между тремяТрёхмерная (многомерная) корреляционная модель
 Исходной для анализа является матрица:
 X= 
Трёхмерная (многомерная) корреляционная модель
    
   ПарныйМатрица парных коэффициентов корреляции
 R =     Трёхмерная корреляционная модель
 Частный коэффициент корреляции, например, ρxy/z характеризует тесноту связиТрёхмерная корреляционная модель
   Частный коэффициент корреляции обладает всеми свойствамиТрёхмерная корреляционная модель
 Частный коэффициент корреляции 
 например, 
  ТочечнаяМатрица частных коэффициентов корреляцииТрёхмерная корреляционная модель
 
 Проверка значимости парного и частного КК
 Трёхмерная корреляционная модель
   
   Интервальная оценка дляТрёхмерная корреляционная модель
 Множественный коэффициент корреляции
    Множественный коэффициентТрёхмерная корреляционная модель
 Множественный коэффициент корреляции
    
 Коэффициент детерминации
   Квадрат множественного коэффициент корреляции 
  Многомерная корреляционная модель
 Многомерная корреляционная модель
    
 Множественный коэффициент корреляции и его свойства
  1. Множественный коэффициент корреляцииМножественный коэффициент корреляции и его свойства
  1. Множественный коэффициент корреляцииМножественный коэффициент корреляции и его свойства
 3. Максимальное значение  Свойства множественного коэффициента корреляции
  4. Множественный коэффициент корреляции превышает любойСвойства множественного коэффициента корреляции
  5. Присоединение любой новой предсказывающей переменнойКоэффициент детерминации
   Наибольшему множественному коэффициенту детерминации соответствуют большие частныеТрёхмерная корреляционная модель
 Множественный коэффициент детерминации
 	Проверка значимости множественного коэффициента (иТрёхмерная корреляционная модель
 Множественный коэффициент детерминации
 	
 По таблице F-распределения Фишера-СнедекораКорреляционный анализЧисло наблюдений достаточно велико
   Если число наблюдений достаточно великоПример соотношения роста (Х) и массы тела (У)Корреляционная таблица
   
   Некоторые mij=0.
  Корреляционная таблица
   Каждому числу xi соответствует целый набор значенийПример: Соотношения роста (Х) и массы тела (У)Решение
    Выборочный коэффициент корреляции в случае сгруппированных данныхРешение
   
 Суммирование распространяется в знаменателе на все возможныеКорреляционный анализ
 Точечные оценки параметров двумерной корреляционной моделиПроверка независимости (значимости) признаков
   Значимость парных коэффициентов корреляции можноКорреляционный анализ 
  IIспособ. С использованием критерия Фишера-Иейтса
  Интервальные оценки параметров связи 
    Для значимых параметровИнтервальные оценки параметров связи
 2. Обратный переход от Z к rКорреляционный анализКоэффициент детерминацииМатрица парных коэффициентов корреляции (многомерный случай)
 R =Корреляционный анализ
 	  В двумерном корреляционном анализе обычно строят 
Корреляционный анализ
 При небольших объемах выборки часто используют более предпочтительные оценкиКорреляционный анализ
  Уравнения линий регрессии 
    Корреляционный анализКорреляционный анализ
 II. Интервальные оценки генеральных коэффициентов корреляции и регрессии
 Двумерная корреляционная модель
 Остаточная дисперсия
  Выборочная дисперсия переменной Y можетКорреляционный анализ
 Точечные оценки параметров двумерной корреляционной моделиТрёхмерная корреляционная модель
 условные дисперсииТрёхмерная корреляционная модель
 Множественный коэффициент детерминации
 	Проверка значимости множественного коэффициента (иТрёхмерная корреляционная модель
 Множественный коэффициент детерминации
 	
 По таблице F-распределения Фишера-Снедекора



Слайды и текст этой презентации
Слайд 1
Описание слайда:
Основы корреляционного анализа


Слайд 2
Описание слайда:
Многомерный корреляционный анализ При исследование реальных экономических явлений приходится сталкиваться с анализом многомерной генеральной совокупности в которой каждый объект характеризуется набором признаков Исследователь располагает случайной выборкой Необходимо сделать вывод о генеральной совокупности (многомерной случайной величине)

Слайд 3
Описание слайда:
Многомерный корреляционный анализ Закон распределения не известен Обычно ограничиваются оцениваем по выборке вектора математических ожиданий ковариационной матрицы По существу вся специфика многомерной случайности сосредоточена в ковариационной матрице .

Слайд 4
Описание слайда:
Многомерный корреляционный анализ Ковариационная матрица позволяет строить и анализировать характеристики вариации характеристики статистической взаимосвязи (коррелированности) компонент многомерного признака.

Слайд 5
Описание слайда:
Ковариация Ковариация Для устранения недостатка ковариации был введён линейный коэффициент корреляции (или коэффициент корреляции Пирсона), который разработали Карл Пирсон, Фрэнсис Эджуорт и Рафаэль Уэлдон (англ.) 90-х годах XIX века.

Слайд 6
Описание слайда:
Основатели корреляционного анализа Карл (Чарлз) Пирсон (Karl (Charles) Pearson) (1857- 1936) английский математик, статистик, биолог и философ; основатель математической статистики

Слайд 7
Описание слайда:
Ковариация Ковариация Коэффициент корреляции рассчитывается по формуле:

Слайд 8
Описание слайда:
Исследование зависимости между 2 переменными Исследование зависимости между 2 переменными Пример: Преподаватель попросил студентов (n=15) записать, сколько часов они потратили на подготовку к промежуточному экзамену. Результаты приведены в табл.

Слайд 9
Описание слайда:
Диаграмма рассеяния (scatterplot)

Слайд 10
Описание слайда:
«Существует ли зависимость между доходом семьи и ее расходами на питание?» «Существует ли зависимость между доходом семьи и ее расходами на питание?» «Связан ли уровень безработицы в стране с ВВП?» «Оказывают ли влияние научные исследования на инновационную активность?» ………………….. Корреляционный анализ – один из методов статистического анализа взаимозависимости нескольких признаков на основе выборочных данных.

Слайд 11
Описание слайда:
Характеристики статистической связи, рассматриваемые в корреляционном анализе используются в качестве «входной» информации при решении следующих задач эконометрики и МСМ: Характеристики статистической связи, рассматриваемые в корреляционном анализе используются в качестве «входной» информации при решении следующих задач эконометрики и МСМ: Определение вида зависимости между переменными (РА); Снижение размерности анализируемого признакового пространства (ФА, МГК); Классификации объектов и признаков (КА). с корреляционного анализа начинаются практически все многомерные статистические исследования.

Слайд 12
Описание слайда:
Корреляционный анализ Основные понятия Коэффициент корреляции – измеритель силы линейной взаимосвязи между двумя переменными, направления линейной взаимосвязи (прямая или обратная)

Слайд 13
Описание слайда:
Корреляционный анализ Основные понятия Случайные величины X и Y могут быть либо зависимыми, либо независимыми

Слайд 14
Описание слайда:
Типы зависимостей случайных величин Функциональной зависимостью переменной Y от переменной X называют зависимость вида , где каждому допустимому значению X ставится в соответствие по определенному правилу единственно возможное значение переменной Y. На формирование значений СВ X и Y оказывают влияние различные факторы. Под воздействием этих факторов и формируются конкретные значения X и Y .

Слайд 15
Описание слайда:
Типы зависимостей случайных величин Пример: Допустим, что на X и Y влияют одни и те же факторы, например, Z1, Z2, Z3, тогда X и Y находятся в полном соответствии с друг другом и связаны ……

Слайд 16
Описание слайда:
Типы зависимостей случайных величин Пример: Допустим, что на X и Y влияют одни и те же факторы, например, Z1, Z2, Z3, тогда X и Y находятся в полном соответствии с друг другом и связаны функционально.

Слайд 17
Описание слайда:
Типы зависимостей случайных величин 2. Z1 X Z2 Z3 Y Z2

Слайд 18
Описание слайда:
Типы зависимостей случайных величин 2. Z1 X Z2 Z3 Y Z2

Слайд 19
Описание слайда:
Типы зависимостей случайных величин у х

Слайд 20
Описание слайда:
Типы зависимостей случайных величин Среди множества значений Y можно найти среднее значение , которое для каждого значения х свое. Множество этих значений на графике образуют линию вид которой может быть самым разнообразным (прямая, парабола, экспонента и т.д.) и определяется СВ X и Y.

Слайд 21
Описание слайда:
Типы зависимостей случайных величин Если изменение одной из СВ приводит к изменению среднего значения другой СВ, то такую зависимость называют корреляционной. Примеры: Урожайность зерновых культур (влажность, освещенность..); зависимость массы тела от роста; Зависимость заболеваемости от воздействия внешних факторов; уровень жизни и процент смертности и т.д.

Слайд 22
Описание слайда:
Исследование зависимости между 2 переменными Исследование зависимости между 2 переменными (bivariate date) Вопросы исследования: Существует ли линейная взаимосвязь между переменными? Как по изменению одной переменной можно предсказать изменение другой переменной?

Слайд 23
Описание слайда:
Линейный коэффициент корреляции Двумерная корреляционная модель Исходной для анализа является матрица X= - матрица «объект–свойство» размерности (n x 2), i -я строка характеризует i-е наблюдение (объект) по двум показателям (j=1, 2).

Слайд 24
Описание слайда:
Корреляционный анализ Двумерная корреляционная модель Двумерная корреляционная модель определяется 5 параметрами: ρ – генеральный парный коэффициент корреляции, характеризующий тесноту связи между переменными X и Y.

Слайд 25
Описание слайда:
Коэффициенты корреляции Парный коэффициент корреляции характеризует тесноту линейной взаимосвязи между двумя переменными (x1 и x2) на фоне действия всех остальных переменных, входящих в модель. изменяется в пределах от -1 до +1. В нашем примере r=0,81. Это индикатор сильной положительной взаимосвязи между временем, потраченным на изучение материала и экзаменационной оценкой.

Слайд 26
Описание слайда:
Корреляционный анализ Точечные оценки параметров двумерной корреляционной модели

Слайд 27
Описание слайда:
Диаграмма рассеяния Диаграмма рассеяния На практике изучение зависимости между двумя СВ необходимо начинать с построения поля корреляции (диаграммы рассеяния), с помощью которого можно установить наличие корреляционной зависимости, силу взаимосвязи, выявить аномальные наблюдения.

Слайд 28
Описание слайда:
Диаграммы рассеивания

Слайд 29
Описание слайда:

Слайд 30
Описание слайда:
Свойства коэффициента корреляции: Если точки не выстраиваются по прямой линии, а образуют «облако», коэффициент корреляции по абсолютной величине становится меньше единицы и по мере округления этого облака приближается к нулю.

Слайд 31
Описание слайда:
Свойства коэффициента корреляции Свойства коэффициента корреляции -1 ≤ ρ ≤ 1

Слайд 32
Описание слайда:
Свойства коэффициента корреляции Свойства коэффициента корреляции 2. Если случайные величины xj и xl статистически независимы, то , а в случае нормального распределения из некоррелированности xj и xl, когда , следует их независимость. (это не означает отсутствие любой зависимости между переменными, just not a linear one!)

Слайд 33
Описание слайда:
Свойства коэффициента корреляции Свойства коэффициента корреляции 2. Из условия следует наличие функциональной линейной связи между xj и xl и, наоборот, если xj и xl связаны линейной функциональной зависимостью, то Чем ближе ρ к ± 1, тем теснее связь между X и Y.

Слайд 34
Описание слайда:
Свойства коэффициента корреляции: Свойства коэффициента корреляции: 3. ρ > 0 - свидетельствует о прямой зависимости между переменными (при увеличении значений одной переменной значения другой переменной также увеличиваются). ρ < 0 свидетельствует об обратной зависимости между переменными (при увеличении значений одной переменной значения другой переменной уменьшаются).

Слайд 35
Описание слайда:
Свойства коэффициента корреляции: Свойства коэффициента корреляции: 3. ρ > 0 - свидетельствует о прямой зависимости между переменными ρ < 0 свидетельствует об обратной зависимости между переменными.

Слайд 36
Описание слайда:
Свойства коэффициента корреляции Свойства коэффициента корреляции 45. Сила корреляционной связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции. Существуют различные рекомендации по интерпретации силы корреляционной взаимосвязи.

Слайд 37
Описание слайда:
Свойства коэффициента корреляции Свойства коэффициента корреляции Пример

Слайд 38
Описание слайда:
Свойства коэффициента корреляции Свойства коэффициента корреляции 5. Неважно, какую переменную мы назовем х, а какую у. Коэффициент корреляции зависит только от выборочных данных, а не от названия переменных. 6. Парный коэффициент корреляции является симметричной характеристикой, т.е. , что непосредственно следует из определения.

Слайд 39
Описание слайда:
Свойства коэффициента корреляции Свойства коэффициента корреляции 7. Коэффициент корреляции не имеет размерности и, следовательно, его можно сопоставлять для разных выборок. (В нашем примере часы или минуты, затраченные на подготовку к экзамену, не изменят величину r).

Слайд 40
Описание слайда:
Свойства коэффициента корреляции Свойства коэффициента корреляции 8. Если все значения переменных увеличить (уменьшить) на одно и то же число или в одно и то же число раз, то величина коэффициента корреляции не изменится.

Слайд 41
Описание слайда:
Свойства коэффициента корреляции: Свойства коэффициента корреляции: 9. Коэффициент корреляции очень чувствителен к выбросам (аномальным наблюдениям). Единичное extreme значение может иметь мощное воздействие на r и привести к неправильным выводам (?) . Пример

Слайд 42
Описание слайда:
Свойства коэффициента корреляции: Свойства коэффициента корреляции: 9. Коэффициент корреляции очень чувствителен к выбросам (аномальным наблюдениям). Единичное extreme значение может иметь мощное воздействие на r и привести к неправильным выводам (так как базируется на среднем) . Пример

Слайд 43
Описание слайда:
Свойства коэффициента корреляции: Свойства коэффициента корреляции: Наблюдения до и после удаления выброса

Слайд 44
Описание слайда:
Свойства коэффициента корреляции: Свойства коэффициента корреляции: if you cannot justify removing the data point(s), you can run a non-parametric test such as Spearman's rank-order correlation or Kendall's Tau Correlation instead, which are much less sensitive to outliers. This might be your best approach if you cannot justify removing the outlier. The diagram below indicates what a potential outlier might look

Слайд 45
Описание слайда:
Свойства коэффициента корреляции: Свойства коэффициента корреляции: if you cannot justify removing the data point(s), you can run a non-parametric test such as Spearman's rank-order correlation or Kendall's Tau Correlation instead, which are much less sensitive to outliers. This might be your best approach if you cannot justify removing the outlier. The diagram below indicates what a potential outlier might look Outliers can have a very large effect on the line of best fit and the Pearson correlation coefficient, which can lead to very different conclusions regarding your data. This point is most easily illustrated by studying scatterplots of a linear relationship with an outlier included and after its removal, with respect to both the line of best fit and the correlation coefficient. This is illustrated in the diagram below:

Слайд 46
Описание слайда:
Свойства коэффициента корреляции: Свойства коэффициента корреляции: if you cannot justify removing the data point(s), you can run a non-parametric test such as Spearman's rank-order correlation or Kendall's Tau Correlation instead, which are much less sensitive to outliers. This might be your best approach if you cannot justify removing the outlier. The diagram below indicates what a potential outlier might look Outliers can have a very large effect on the line of best fit and the Pearson correlation coefficient, which can lead to very different conclusions regarding your data. This point is most easily illustrated by studying scatterplots of a linear relationship with an outlier included and after its removal, with respect to both the line of best fit and the correlation coefficient. This is illustrated in the diagram below:

Слайд 47
Описание слайда:
Свойства коэффициента корреляции: Свойства коэффициента корреляции:

Слайд 48
Описание слайда:
Пример Оцените значение коэффициента корреляции r для каждого из представленных ниже графиков:

Слайд 49
Описание слайда:
Пример Оцените значение коэффициента корреляции r для каждого из представленных ниже графиков:

Слайд 50
Описание слайда:
Проверка значимости коэффициента корреляции Значимость парных коэффициентов корреляции проверяется с помощью t-критерия Стьюдента. (двухсторонняя критическая область) 1. Расчет наблюдаемого значения статистики по формуле: tнабл = где r - оценка парного коэффициент корреляции.

Слайд 51
Описание слайда:
Проверка значимости коэффициента корреляции 2. Нахождение критического значения статистики по таблицам распределения tкр определяется по таблице распределения Стьюдента для заданного уровня значимости  и 3. Вывод по гипотезе проверяемый коэффициент корреляции считается значимым, т. е. гипотеза H0: =0 отвергается с вероятностью ошибки , если | tнабл |> tкр

Слайд 52
Описание слайда:

Слайд 53
Описание слайда:
Корреляционный анализ II способ. С использованием критерия Фишера-Иейтса 1. За rн принимается выборочное значение коэффициента корреляции r 2. rкр (α, ν=n-2) находится по таб. Фишера-Иейтса (таб.8) 3. Вывод по гипотезе Рассчитанное значение r сравнивается с rкр: Если ׀ r ׀ > rкр => гипотеза H0 отвергается => ρ – значим (с вероятностью ошибки α)

Слайд 54
Описание слайда:

Слайд 55
Описание слайда:

Слайд 56
Описание слайда:
Проверка независимости (значимости) признаков 1. 2. 3. Вывод

Слайд 57
Описание слайда:
Коэффициент детерминации в двумерной модели Квадрат парного коэффициент корреляции называется коэффициентом детерминации. характеризует долю дисперсии одной переменной (результативной), обусловленную влиянием другой переменной.

Слайд 58
Описание слайда:
Коэффициент детерминации в двумерной модели Квадрат парного коэффициент корреляции называется коэффициентом детерминации. характеризует долю дисперсии одной переменной (результативной), обусловленную влиянием другой переменной.

Слайд 59
Описание слайда:
Интервальные оценки параметров связи I. Для значимых параметров связи (коэффициентов корреляции) с надежностью  определяют интервальные оценки. Алгоритм 1. Нахождение интервальной оценки для вспомогательной статистики Z с помощью Z-преобразования Фишера t вычисляют по таблице интегральной функции Лапласа (табл. 1) из условия t Значение Z' (Zr)определяют по таблице Z - преобразования (табл. 6) по найденному значению r. ! Функция Zr нечетная: Z'(-r) = -Z'(r) нечетная

Слайд 60
Описание слайда:

Слайд 61
Описание слайда:

Слайд 62
Описание слайда:
Интервальные оценки параметров связи 2. Обратный переход от Z к r осуществляют также по таблице Z – преобразования. 3. Получение интервальной оценки для ρ с надежностью  : Таким образом, с вероятностью  гарантируется, что генеральный коэффициент корреляции ρ будет находиться в интервале от rmin до rmax. С помощью доверительного интервала можно проверить значимость коэффициента корреляции ρ: если ноль попадает в доверительный интервал, то коэффициент корреляции незначимый.

Слайд 63
Описание слайда:
Трёхмерная корреляционная модель Пусть признаки X, Y, Z образуют трехмерную нормально распределенную генеральную совокупность, которая определяется девятью параметрами: (X,Y,Z) ↔ N(μx ,μy ,μz ,σx ,σy ,σz ,ρxy ,ρyz ,ρxz)

Слайд 64
Описание слайда:
Трёхмерная корреляционная модель Пусть признаки X, Y, Z образуют трехмерную нормально распределенную генеральную совокупность, которая определяется девятью параметрами: (X,Y,Z) ↔ N(μx ,μy ,μz ,σx ,σy ,σz ,ρxy ,ρyz ,ρxz) ! Одномерные распределения X, Y, Z и двумерные [(X, Y), (X,Z), (Y, Z)] распределения компонент, а так же условные распределения при фиксированных одной [(X,Y)/Z; (X,Z)/Y; (Y,Z)/X] и двух переменных [X/(Y,Z); Y/(X,Z); z/(X,Y)] являются нормальными. Поэтому поверхности и линии регрессии являются плоскостями и прямыми соответственно.

Слайд 65
Описание слайда:
Трёхмерная корреляционная модель Для изучения разнообразия связей между тремя случайными величинами рассчитывают парные, частные множественные коэффициенты корреляции (детерминации)

Слайд 66
Описание слайда:
Трёхмерная (многомерная) корреляционная модель Исходной для анализа является матрица: X= размерности (n x 3), размерности (n x k) i-я строка которой характеризует i-е наблюдение (объект) по всем показателям (j=1, 2, 3,…,к).

Слайд 67
Описание слайда:
Трёхмерная (многомерная) корреляционная модель Парный коэффициент корреляции, например, ρxy характеризует тесноту связи между переменными X и Y на фоне действия пепеменной Z (на фоне действия всех остальных переменных, включенных в модель).

Слайд 68
Описание слайда:
Матрица парных коэффициентов корреляции R = R =

Слайд 69
Описание слайда:
Трёхмерная корреляционная модель Частный коэффициент корреляции, например, ρxy/z характеризует тесноту связи между переменными X и Y при фиксированном значении переменной Z (независимо от её влияния). Если парный коэффициент корреляции больше частного , т.е. ρxy > ρxy/z , то переменная Z усиливает связь между переменными X и Y. Если ρxy < ρxy/z , то переменная Z ослабляет связь между переменными X и Y.

Слайд 70
Описание слайда:
Трёхмерная корреляционная модель Частный коэффициент корреляции обладает всеми свойствами парного коэффициента корреляции , т.к. он является коэффициентом корреляции двумерного условного распределения. Сравнение частных коэффициентов корреляции позволяет ранжировать факторы по тесноте их связи с результатом (у). R частн =

Слайд 71
Описание слайда:
Трёхмерная корреляционная модель Частный коэффициент корреляции например, Точечная оценка частного коэффициента корреляции: где Аij - алгебраическое дополнение элемента rij корреляционной матрицы R. Аij =(-1)i+j Мij, где Mij - минор, определитель матрицы, получаемой из матрицы R путем вычеркивания i-й строки и j-го столбца.

Слайд 72
Описание слайда:
Матрица частных коэффициентов корреляции

Слайд 73
Описание слайда:

Слайд 74
Описание слайда:
Трёхмерная корреляционная модель Проверка значимости парного и частного КК I способ. t – критерий Стьюдента (таб.2) 2. Рассчитывается наблюдаемое значение статистики tн : 3. Находится критическое значение статистики tкр : tкр (α, ν= n-l-2) 4. Вывод по гипотезе II способ. Критерий Фишера-Иейтса (таб.8) с учетом порядка КК

Слайд 75
Описание слайда:
Трёхмерная корреляционная модель Интервальная оценка для значимого парного и частного коэффициента корреляции Аналогично построению ИО для парного коэффициента корреляции в двумерной модели. Отличие

Слайд 76
Описание слайда:
Трёхмерная корреляционная модель Множественный коэффициент корреляции Множественный коэффициент корреляции в трёхмерной модели служит показателем тесноты линейной связи между одной переменной и двумерным массивом двух других переменных. Например, ρу/хz (ρу ) служит показателем тесноты линейной связи между переменной У и двумерной величиной (Х,Z). Множественный коэффициент корреляции в многомерной модели служит показателем тесноты линейной связи между одной переменной и массивом других переменных.

Слайд 77
Описание слайда:
Трёхмерная корреляционная модель Множественный коэффициент корреляции Точечная оценка множественного коэффициента корреляции: где |R| - определитель матрицы парных коэффициентов корреляции, Аij - алгебраическое дополнение элемента rij корреляционной матрицы R. Аij =(-1)i+j Мij, где Mij - минор, определитель матрицы, получаемой из матрицы R путем вычеркивания i-й строки и j-го столбца.

Слайд 78
Описание слайда:
Коэффициент детерминации Квадрат множественного коэффициент корреляции называется множественным коэффициентом детерминации. Он характеризует долю дисперсии одной переменной (результативной), обусловленной влиянием всех остальных переменных (аргументов), включенных в модель.

Слайд 79
Описание слайда:
Многомерная корреляционная модель Многомерная корреляционная модель Множественный коэффициент детерминации в общем случае многомерной корреляционной модели, например, ρ21/2,3,…к показывает долю дисперсии случайной величины X1, обусловленную влиянием остальных переменных X2, X3, … Xк, включённых в корреляционную модель. Соответственно (1- ρ 21/2,3,…к ) показывает долю остаточной дисперсии случайной величины X1, обусловленную влиянием других, не включённых в корреляционную модель факторов.

Слайд 80
Описание слайда:
Множественный коэффициент корреляции и его свойства 1. Множественный коэффициент корреляции изменяется в интервале

Слайд 81
Описание слайда:
Множественный коэффициент корреляции и его свойства 1. Множественный коэффициент корреляции изменяется в интервале 2. Минимальное значение ρу =0 соответствует случаю полного отсутствия корреляционной связи между у и остальными переменными. усредненная дисперсия «регрессионных остатков» в точности равна общей вариации результирующего показателя. Если в трехмерной модели ρу =0, то одномерная случайная величина У и двумерная случайная величина (Х, Z) являются независимыми (в силу нормальности распределения).

Слайд 82
Описание слайда:
Множественный коэффициент корреляции и его свойства 3. Максимальное значение соответствует случаю полного отсутствия варьирования «регрессионных остатков»,что означает наличие функциональной связи между величиной у и остальными переменными. В этом случае мы имеем возможность точно восстановить условные значения у(X)={у/ξ=X} по значениям факторных (предикторных) переменных X.

Слайд 83
Описание слайда:
Свойства множественного коэффициента корреляции 4. Множественный коэффициент корреляции превышает любой парный или частный коэффициент корреляции, характеризующий статистическую связь результирующего показателя.

Слайд 84
Описание слайда:
Свойства множественного коэффициента корреляции 5. Присоединение любой новой предсказывающей переменной не может уменьшить величины R (независимо от порядка присоединения).

Слайд 85
Описание слайда:
Коэффициент детерминации Наибольшему множественному коэффициенту детерминации соответствуют большие частные коэффициенты корреляции. Например, если

Слайд 86
Описание слайда:
Трёхмерная корреляционная модель Множественный коэффициент детерминации Проверка значимости множественного коэффициента (и корреляции (детерминации), например, H0: ρ 1/2,3 =0, осуществляется с помощью F-критерия. 1. Вычисляется

Слайд 87
Описание слайда:
Трёхмерная корреляционная модель Множественный коэффициент детерминации По таблице F-распределения Фишера-Снедекора (таб.4) определяют Fкр : Fкр(α; ν1=2; ν2=n-3) Fкр(α; ν1= ; ν2= 3. Если Fн>Fкр , то гипотеза H0 отвергается с вероятностью ошибки α и множественный коэффициент корреляции (и соответствующий коэффициент детерминации) считается статистически значимым.

Слайд 88
Описание слайда:

Слайд 89
Описание слайда:
Корреляционный анализ

Слайд 90
Описание слайда:

Слайд 91
Описание слайда:
Число наблюдений достаточно велико Если число наблюдений достаточно велико и особенно если наблюдения объединяются поинтервально, т.е. все значения, попавшие в интервал, округляются до значения середины интервала (например, рост измеряется с точность до целых сантиметров, а вес – с точностью до целых килограммов), то каждая из наблюдаемых пар значений может встретится несколько раз. строят таблицы с учетом частот встречаемости. Такую табл. по сгруппированным данным называют корреляционной.

Слайд 92
Описание слайда:
Пример соотношения роста (Х) и массы тела (У)

Слайд 93
Описание слайда:
Корреляционная таблица Некоторые mij=0. В последней строке (столбце) показаны суммы соответствующих частот для значений X и Y. Сумма всех возможных mij равна m и сумме частот по строкам и столбцам

Слайд 94
Описание слайда:
Корреляционная таблица Каждому числу xi соответствует целый набор значений y1,y2,…,yl с конкретными частотами mi1, mi2,…,mil Среднее этих значений обозначается (условное среднее значение у при условии, что Х=xi) И находится по формуле: Условные средние значения У

Слайд 95
Описание слайда:
Пример: Соотношения роста (Х) и массы тела (У)

Слайд 96
Описание слайда:
Решение Выборочный коэффициент корреляции в случае сгруппированных данных по корреляционной таблице вычисляется следующим образом:

Слайд 97
Описание слайда:
Решение Суммирование распространяется в знаменателе на все возможные х или у, в числителе - на все возможные пары (х,у). Упростим выражение в числителе

Слайд 98
Описание слайда:
Корреляционный анализ Точечные оценки параметров двумерной корреляционной модели

Слайд 99
Описание слайда:
Проверка независимости (значимости) признаков Значимость парных коэффициентов корреляции можно проверить 2 способами: 1. С помощью t-критерия Стьюдента. Нулевая гипотеза Альтернативная гипотеза 1. Вычисление наблюдаемого значения критерия tн : где r – выборочная оценка парного коэффициента корреляции; 2. Нахождение критического значения tкр (α, ν=n-2) по таб. 2 3. Вывод по гипотезе Рассчитанное значение tн сравнивается с tкр: Если ׀ tн ׀ > t кр => гипотеза H0 отвергается => ρ - значим

Слайд 100
Описание слайда:
Корреляционный анализ IIспособ. С использованием критерия Фишера-Иейтса 1. За rн принимается выборочное значение коэффициента корреляции r 2. rкр (α, ν=n-2) находится по таб. Фишера-Иейтса (таб.8) 3. Вывод по гипотезе Рассчитанное значение r сравнивается с rкр: Если ׀ r ׀ > rкр => гипотеза H0 отвергается => ρ – значим значим (с вероятностью ошибки α)

Слайд 101
Описание слайда:
Интервальные оценки параметров связи Для значимых параметров связи (парных и частных коэффициентов корреляции находят интервальные оценки с надежностью  . 1. Нахождение интервальной оценки для вспомогательной статистики Z с помощью Z-преобразования Фишера t вычисляют по таблице интегральной функции Лапласа (табл. 1) из условия t Значение Z' (Zr)определяют по таблице Z - преобразования (табл. 6) по найденному значению r. Функция Zr нечетная: Z'(-r) = -Z'(r) нечетная

Слайд 102
Описание слайда:
Интервальные оценки параметров связи 2. Обратный переход от Z к r осуществляют также по таблице Z – преобразования. 3. Получение интервальной оценки для r с надежностью  : Таким образом, с вероятностью  гарантируется, что генеральный коэффициент корреляции ρ будет находиться в интервале от rmin до rmax. С помощью доверительного интервала можно проверить значимость ρ: если ноль попадает в доверительный интервал, то коэффициент корреляции не значимый.

Слайд 103
Описание слайда:
Корреляционный анализ

Слайд 104
Описание слайда:
Коэффициент детерминации

Слайд 105
Описание слайда:
Матрица парных коэффициентов корреляции (многомерный случай) R =

Слайд 106
Описание слайда:
Корреляционный анализ В двумерном корреляционном анализе обычно строят корреляционную таблицу, поле корреляции, рассчитывают точечные оценки параметров корреляционной модели, проверяют значимость параметров связи для значимых параметров строят интервальные оценки. Имея оценки параметров модели можно рассчитать оценки уравнений регрессии.

Слайд 107
Описание слайда:
Корреляционный анализ При небольших объемах выборки часто используют более предпочтительные оценки коэффициентов корреляции и детерминации, чем выборочные коэффициенты: более предпочтительная оценка коэффициента корреляции – более предпочтительная оценка коэффициента детерминации

Слайд 108
Описание слайда:
Корреляционный анализ Уравнения линий регрессии Если наблюдаемые значения У и Х представляют собой выборку из двумерного нормального распределения, то формально можно рассматривать два уравнения регрессии:

Слайд 109
Описание слайда:
Корреляционный анализ

Слайд 110
Описание слайда:
Корреляционный анализ II. Интервальные оценки генеральных коэффициентов корреляции и регрессии Построение с надёжностью γ доверительных интервалов для генеральных коэффициентов регрессии Y по X βyx min≤ βyx ≤ βyx max и X по Y βxy min≤ βxy ≤ βxy max

Слайд 111
Описание слайда:
Двумерная корреляционная модель Остаточная дисперсия Выборочная дисперсия переменной Y может быть представлена: S2r S2y/x выборочная дисперсия остаточная дисперсия, регрессии Y по X, объясняемая объясняемая вариацией неучтёнными в модели переменной Х факторами Остаточная (условная) дисперсия: S2y/x = S2y·(1- r2) – регрессии Y по X

Слайд 112
Описание слайда:
Корреляционный анализ Точечные оценки параметров двумерной корреляционной модели

Слайд 113
Описание слайда:
Трёхмерная корреляционная модель условные дисперсии

Слайд 114
Описание слайда:
Трёхмерная корреляционная модель Множественный коэффициент детерминации Проверка значимости множественного коэффициента (и корреляции (детерминации), например, H0: ρ 1/2,3 =0, осуществляется с помощью F-критерия. 1. Вычисляется

Слайд 115
Описание слайда:
Трёхмерная корреляционная модель Множественный коэффициент детерминации По таблице F-распределения Фишера-Снедекора (таб.4) определяют Fкр : Fкр(α; ν1=2; ν2=n-3) – для трехмерной модели Fкр(α; ν1=к-1; ν2=n-к) – для многомерной модели 3. Если Fн>Fкр , то гипотеза H0 отвергается с вероятностью ошибки α и коэффициент детерминации (и соответствующий множественный коэффициент корреляции) считается значимым.


Скачать презентацию на тему Основы корреляционного анализа можно ниже:

Похожие презентации