Тема 16. Непараметрические критерии. Факторный анализ. презентация

Содержание


Презентации» Образование» Тема 16. Непараметрические критерии. Факторный анализ.
Тема 16.  Непараметрические критерии. Факторный анализ. 
 16.1. Однофакторный непараметрическийПараметрические и непараметрические критерии
 Такие статистические критерии, как z, t и16.1.  Критерий Краскела-Уоллиса
 Kruskal-Wallis TestПример данных
 Имеется ли разница в среднем возрасте учителей, администрации иКритерий Краскела-Уоллиса
 В дисперсионном анализе используется F-критерий, чтобы сравнивать средние трехУсловия применения
 Выборки независимы и получены случайным образом.
 Размер каждой выборкиСуть критерия
 1. В критерии Краскела–Уоллиса все выборки перемешиваются и значенияВычисления в таблицеКритическая область
 Критерий использует правостороннюю критическую область. 
 Для нахождения критическихСтатистика
 Формула статистики Краскела-Уоллиса:Вычисляем значение статистикиНаходим границу критической области
 Снова воспользуемся таблицами EXCEL для нахождения границыСравниваем и делаем вывод
 Полученное значение статистики не попало в критическуюНаходим в SPSSСтатистика – вторая формула
 Формула статистики Краскела-Уоллиса:Вычисления в таблице
 Ранжируем выборки от 1 до 19 и затемВычисляем значение статистики
 Очевидно, мы получили то же самое значение статистики16.2.  Критерий Джонкхиера
 Jonckheere TestКритерий Джонкхиера16.3.  Критерий Фридмана
 Friedman TestФакторы A и B
 На результаты наблюдений могут оказывать два иТаблица двухфакторного анализа
 Фактор А имеет n уровней, фактор В имеетМодель двухфакторного анализа
 Результат наблюдения является суммой самостоятельных вкладов соответствующих уровнейГипотезы
 Проверяемая гипотеза:
 		H0: влияние фактора A отсутствует
 		H1: влияние фактораПереход к таблице рангов
 Ранжируем значения в каждой строке. Переходим кСуть критерия
 При ранжировании результатов наблюдений по строкам, мы устраняем влияниеСтатистика Фридмана
 Формула статистики Фридмана:Статистика Фридмана – вторая формула
 Формула статистики Фридмана:Пример
 На уровне =0,05 проверить влияние каждого из факторов на результатыРешение. Ранжируем по строкамХорошо ли перемешаны ранги?Находим средние ранги по столбцамХорошо ли перемешаны ранги?Вычисляем статистикуСчитаем в SPSS
 Критическое значение равно 5,99.
 Это означает, что нетВторая проверка
 Критерий Фридмана используется для второй проверки. В этом случае,Решение. Ранжируем по столбцамРешение. Ранжируем по столбцам17. Как проводить исследование
 Классификация методов курсаВыбор метода1.1. Интервальные данные, одна совокупность1.1. Интервальные данные, одна совокупность1.2. Интервальные данные, две совокупности1.2. Интервальные данные, две совокупностиПорядковые данныеПорядковые данныеНоминальные данныеНоминальные данныеПонятия и терминыЗадание на 5 минут
 Чем коэффициент Спирмена отличается от коэффициента Пирсона?Задачи 
 16-1. Измеряется самооценка в трех различных выборках индивидов поЗадачи
 16-2. Крупный овощной магазин решает начать рекламировать продукт тремя различнымиЗадачи
 16-3. Клубнику выращивают на трех различных типах почвы. Урожай (вЗадачи
 16-4. Недавно проведенное исследование установило количество предложений о работе, принимаемых



Слайды и текст этой презентации
Слайд 1
Описание слайда:
Тема 16. Непараметрические критерии. Факторный анализ. 16.1. Однофакторный непараметрический анализ. Критерий Краскела-Уоллиса 16.2. Двухфакторный непараметрический анализ. Критерий Фридмана


Слайд 2
Описание слайда:
Параметрические и непараметрические критерии Такие статистические критерии, как z, t и F называются параметрическими. Параметрические критерии предназначены для проверки гипотез о параметрах генеральной совокупности - среднем, дисперсии, доли; либо гипотез о типе распределения. Кроме этого, статистики разработали направление, которое развивает непараметрические критерии. В этом случае вид и параметры распределения не рассматриваются. Эти критерии используют, в частности, для исследования генеральных совокупностей, которые не распределены нормально.

Слайд 3
Описание слайда:
16.1. Критерий Краскела-Уоллиса Kruskal-Wallis Test

Слайд 4
Описание слайда:
Пример данных Имеется ли разница в среднем возрасте учителей, администрации и обслуживающего персонала школы? Взяты выборки из трех генеральных совокупностей.

Слайд 5
Описание слайда:
Критерий Краскела-Уоллиса В дисперсионном анализе используется F-критерий, чтобы сравнивать средние трех и более совокупностей. Для критерия ANOVA предполагается, что совокупности нормально распределены и что дисперсии совокупностей равны. Когда эти условия не выполняются, то для сравнения трех и более средних может использоваться непараметрический критерий Краскeла–Уоллиса. Критерий Краскела-Уоллиса – непараметрический тест, который использует ранги трех и более независимых выборок. Применяется для проверки гипотезы о том, что выборки получены из генеральных совокупностей, имеющих одинаковый закон распределения: H0: распределения генеральных совокупностей совпадают H1: распределения отличаются

Слайд 6
Описание слайда:
Условия применения Выборки независимы и получены случайным образом. Размер каждой выборки должен быть не меньше пяти. В этом случае исследуемое распределение приближается к 2-распределению с (k – 1) степенями свободы, где k – число градаций признака. Для выборок меньшего размера требуются специальные таблицы. Нет ограничений на то, что генеральная совокупность имеет нормальный закон распределения или любой иной определенный закон.

Слайд 7
Описание слайда:
Суть критерия 1. В критерии Краскела–Уоллиса все выборки перемешиваются и значения ранжируются. Далее вычисляются средние ранги для каждой выборки и средний ранг по всем данным. 2. Если выборки взяты из различных совокупностей, средние ранги выборок будут сильно различаться, значение Н будет велико, нулевая гипотеза будет отвергнута. 3. Для двух выборок критерий совпадает с критерием Вилкоксона.

Слайд 8
Описание слайда:
Вычисления в таблице

Слайд 9
Описание слайда:
Критическая область Критерий использует правостороннюю критическую область. Для нахождения критических значений используем таблицу 2-распределения с количеством степеней свободы df = (k – 1).

Слайд 10
Описание слайда:
Статистика Формула статистики Краскела-Уоллиса:

Слайд 11
Описание слайда:
Вычисляем значение статистики

Слайд 12
Описание слайда:
Находим границу критической области Снова воспользуемся таблицами EXCEL для нахождения границы критической области: ХИ2ОБР (0,05; 2) = 5,991

Слайд 13
Описание слайда:
Сравниваем и делаем вывод Полученное значение статистики не попало в критическую область: Вывод. Мы не имеем оснований отклонить основную гипотезу. Значит, не существует значимого различия между выборками.

Слайд 14
Описание слайда:
Находим в SPSS

Слайд 15
Описание слайда:
Статистика – вторая формула Формула статистики Краскела-Уоллиса:

Слайд 16
Описание слайда:
Вычисления в таблице Ранжируем выборки от 1 до 19 и затем суммируем ранги каждой выборки отдельно.

Слайд 17
Описание слайда:
Вычисляем значение статистики Очевидно, мы получили то же самое значение статистики H.

Слайд 18
Описание слайда:
16.2. Критерий Джонкхиера Jonckheere Test

Слайд 19
Описание слайда:
Критерий Джонкхиера

Слайд 20
Описание слайда:
16.3. Критерий Фридмана Friedman Test

Слайд 21
Описание слайда:
Факторы A и B На результаты наблюдений могут оказывать два и более факторов. Рассмотрим двухфакторную модель. Будем считать, что: A – главный фактор B – мешающий фактор Уровни основного фактора – обработки уровни мешающего фактора – блоки Влияние основного фактора – эффекты обработки Влияние мешающего фактора – эффекты блоков

Слайд 22
Описание слайда:
Таблица двухфакторного анализа Фактор А имеет n уровней, фактор В имеет k уровней. Таблица содержит nk наблюдений – по одному наблюдению в каждой клетке.

Слайд 23
Описание слайда:
Модель двухфакторного анализа Результат наблюдения является суммой самостоятельных вкладов соответствующих уровней каждого фактора и случайности эксперимента:

Слайд 24
Описание слайда:
Гипотезы Проверяемая гипотеза: H0: влияние фактора A отсутствует H1: влияние фактора имеется В другой формулировке: H0: 1 = 2 = … = k = 0 H1: не все i равны нулю

Слайд 25
Описание слайда:
Переход к таблице рангов Ранжируем значения в каждой строке. Переходим к таблице рангов.

Слайд 26
Описание слайда:
Суть критерия При ранжировании результатов наблюдений по строкам, мы устраняем влияние мешающего фактора В, значение которого для каждой строки таблицы постоянно. Если гипотеза верна и воздействие фактора А отсутствует, то любая последовательность рангов в строке одинаково вероятна.

Слайд 27
Описание слайда:
Статистика Фридмана Формула статистики Фридмана:

Слайд 28
Описание слайда:
Статистика Фридмана – вторая формула Формула статистики Фридмана:

Слайд 29
Описание слайда:
Пример На уровне =0,05 проверить влияние каждого из факторов на результаты измерений.

Слайд 30
Описание слайда:
Решение. Ранжируем по строкам

Слайд 31
Описание слайда:
Хорошо ли перемешаны ранги?

Слайд 32
Описание слайда:
Находим средние ранги по столбцам

Слайд 33
Описание слайда:
Хорошо ли перемешаны ранги?

Слайд 34
Описание слайда:
Вычисляем статистику

Слайд 35
Описание слайда:
Считаем в SPSS Критическое значение равно 5,99. Это означает, что нет оснований отвергать основную гипотезу. Мы получили, что такой фактор как «тип коробки передач» не оказывает существенного влияния на время разгона автомобилей. Задача составлена в учебных целях. Данные взяты «с потолка».

Слайд 36
Описание слайда:
Вторая проверка Критерий Фридмана используется для второй проверки. В этом случае, мы считаем уже, что: A – мешающий фактор B – главный фактор Ранжирование приводим по столбцам, чтобы устранить влияние мешающего фактора.

Слайд 37
Описание слайда:
Решение. Ранжируем по столбцам

Слайд 38
Описание слайда:
Решение. Ранжируем по столбцам

Слайд 39
Описание слайда:
17. Как проводить исследование Классификация методов курса

Слайд 40
Описание слайда:
Выбор метода

Слайд 41
Описание слайда:
1.1. Интервальные данные, одна совокупность

Слайд 42
Описание слайда:
1.1. Интервальные данные, одна совокупность

Слайд 43
Описание слайда:
1.2. Интервальные данные, две совокупности

Слайд 44
Описание слайда:
1.2. Интервальные данные, две совокупности

Слайд 45
Описание слайда:
Порядковые данные

Слайд 46
Описание слайда:
Порядковые данные

Слайд 47
Описание слайда:
Номинальные данные

Слайд 48
Описание слайда:
Номинальные данные

Слайд 49
Описание слайда:
Понятия и термины

Слайд 50
Описание слайда:
Задание на 5 минут Чем коэффициент Спирмена отличается от коэффициента Пирсона?

Слайд 51
Описание слайда:
Задачи 16-1. Измеряется самооценка в трех различных выборках индивидов по порядку рождения. Количество набранных баллов ранжируется от 0 до 50. Существует ли разница в количестве набранных баллов на уровне значимости  = 0,05?

Слайд 52
Описание слайда:
Задачи 16-2. Крупный овощной магазин решает начать рекламировать продукт тремя различными способами: по радио, по телевидению, в газетах. По результатам продаж в течение одной недели в случайно выбранных магазинах были получены следующие данные. Существует ли разница в продажах в связи с типом рекламирования товара на уровне значимости  = 0,01?

Слайд 53
Описание слайда:
Задачи 16-3. Клубнику выращивают на трех различных типах почвы. Урожай (в квартах) на одинаковых участках представлен ниже. Существует ли различие в количестве урожая для трех участков на уровне значимости  = 0,01?

Слайд 54
Описание слайда:
Задачи 16-4. Недавно проведенное исследование установило количество предложений о работе, принимаемых выпускниками инженерами-химиками в трех различных колледжах. Существует ли на уровне значимости  = 0,01 различие между средним количеством принятых предложений о работе в этих колледжах ?


Скачать презентацию на тему Тема 16. Непараметрические критерии. Факторный анализ. можно ниже:

Похожие презентации