Первый слайд презентации
Занятие 8 ТЕМА: ДИСПЕРСИОННЫЙ АНАЛИЗ ( ANOVA ). Понятие об ортогональном и неортогональном комплексах. Предпосылки, задачи и техника проведения одно- и двухфакторного дисперсионного анализа. Критерий Бартлета. Сила влияния фактора.
Слайд 2
Анализ статистических связей Дисперсионный анализ Корреляционный анализ Регрессионный анализ Изучение закономерных проявлений в поведении варьирующих признаков статистических комплексов и роли остатков - случайного варьирования
Слайд 3
Дисперсионный анализ Основан на разложении общей дисперсии статистического комплекса на составляющие ее компоненты. Сравнивая их друг с другом с помощью f-критерия, можно определить, какую долю общей вариации изучаемого признака, обуславливает действие на него организованных и случайных воздействий.
Слайд 4
Дисперсионный анализ Основан на разложении общей дисперсии статистического комплекса на составляющие ее компоненты. Сравнивая их друг с другом с помощью f-критерия, можно определить, какую долю общей вариации изучаемого признака, обуславливает действие на него организованных и случайных воздействий. Организованные воздействия обычно трактуются как факторы
Слайд 5
1. Есть m-выборок, полученных из одной генеральной по определенному порядку - статистический комплекс. , 2. Общяя вариация признака - сумма квадратов отклонений отдельных вариант от средней арифметической
Слайд 6
1. Есть m-выборок, полученных из одной генеральной по определенному порядку - статистический комплекс. , 2. Общяя вариация признака - сумма квадратов отклонений отдельных вариант от средней арифметической Её можно разложить на доли: одна отражает влияние на признак учитываемого в опыте фактора (или факторов) другая определяется влиянием на тот же признак неучитываемых (случайных) причин.
Слайд 7
1. Есть m-выборок, полученных из одной генеральной по определенному порядку - статистический комплекс. , 2. Общяя вариация признака - сумма квадратов отклонений отдельных вариант от средней арифметической Её можно разложить на доли: одна отражает влияние на признак учитываемого в опыте фактора (или факторов) другая определяется влиянием на тот же признак неучитываемых (случайных) причин.
Слайд 8
1.Случайность выборок (независимость вариант каждой выборки от вариант других выборок, т.е. отсутствие корреляций внутри комплекса); Нормальное распределение вариант в каждой из сравниваемых выборок; ПРИ N <30 НЕОБХОДИМО ПРЕОБРАЗОВАНИЕ ВАРИАНТ!!!. Равенство дисперсий сравниваемых отдельных выборок ОСНОВНЫЕ ПРЕДПОСЫЛКИ КОРРЕКТНОСТИ ПРОЦЕДУРЫ ДИСПЕРСИОННОГО АНАЛИЗА :
Слайд 9
Проверка гипотезы о равенстве выборочных дисперсий с помощью критерия Бартлета УСЛОВИЕ КОРРЕКТНОСТИ ПРОЦЕДУРЫ: СЛУЧАЙНОСТЬ ВАРИАНТ ВЫБОРОК И НОРМАЛЬНОСТЬ ИХ РАСПРЕДЕЛЕНИЯ. РАВЕНСТВО ДИСПЕРСИЙ
Слайд 10
Проверка гипотезы о равенстве выборочных дисперсий с помощью критерия Бартлета Нулевая гипотеза - выборки относятся к одной генеральной совокупности и, следовательно, наблюдаемые различия между выборочными вариансами случайны Альтернативная гипотеза - наблюдаемые различия между выборочными дисперсиями неслучайны УСЛОВИЕ КОРРЕКТНОСТИ ПРОЦЕДУРЫ: СЛУЧАЙНОСТЬ ВАРИАНТ ВЫБОРОК И НОРМАЛЬНОСТЬ ИХ РАСПРЕДЕЛЕНИЯ. РАВЕНСТВО ДИСПЕРСИЙ
Слайд 11
Проверка гипотезы о равенстве выборочных дисперсий с помощью критерия Бартлета Нулевая гипотеза - выборки относятся к одной генеральной совокупности и, следовательно, наблюдаемые различия между выборочными вариансами случайны Альтернативная гипотеза - наблюдаемые различия между выборочными дисперсиями неслучайны Д ля проверки нулевой гипотезы строим односторонний критерий УСЛОВИЕ КОРРЕКТНОСТИ ПРОЦЕДУРЫ: СЛУЧАЙНОСТЬ ВАРИАНТ ВЫБОРОК И НОРМАЛЬНОСТЬ ИХ РАСПРЕДЕЛЕНИЯ. РАВЕНСТВО ДИСПЕРСИЙ
Слайд 12
ПРОВЕРЯЕТСЯ УСЛОВИЕ: m - количество выборок Принимается нулевая гипотеза
Слайд 13
5. АДДИТИВНОСТЬ КОМПОНЕНТ ВАРИАНСЫ КОМПЛЕКСА. АДДИТИВНОСТЬ МОДЕЛИ слагаемость компонент общей вариансы статистического комплекса, обусловленных главными эффектами воздействий. АДДИТИВНЫЙ ЭФФЕКТ - отсутствие взаимодействия. 4. НЕЗАВИСИМОСТЬ СРЕДНЕЙ ОТ ДИСПЕРСИИ В ВЫБОРКАХ КОМПЛЕКСА ОСНОВНЫЕ ПРЕДПОСЫЛКИ КОРРЕКТНОСТИ ПРОЦЕДУРЫ ДИСПЕРСИОННОГО АНАЛИЗА :
Слайд 14
n i n i n i n i Один организованный фактор: (4 градации по фактору А : а =4 ) Однофакторный дисперсионный комплекс А1 А2 А3 А4 По условиям формирования статистические комплексы могут быть: ОДНО-, ДВУХ-, ТРЕХ - И БОЛЕЕ- ФАКТОРНЫМИ.
Слайд 15
n i n i n i n i n i n i n i n i n i n i n i n i А и B - градации организованных воздействий Один организованный фактор: (4 градации по фактору А : а =4 ) Однофакторный дисперсионный комплекс А1 А2 А3 А4 Два организованных фактора (Двухфакторный дисперсионный комплекс: (4 градации по фактору А : а =4 ; 2 градации по фактору В : b =2 ) А1 А2 А3 А4 В1 В2 По условиям формирования статистические комплексы могут быть: ОДНО-, ДВУХ-, ТРЕХ - И БОЛЕЕ- ФАКТОРНЫМИ.
Слайд 16
По условиям формирования статистические комплексы (или дисперсионные) могут быть: ОРТОГОНАЛЬНЫМИ и НЕОРТОГОНАЛЬНЫМИ число вариант в каждой ячейке или по градациям каждого из факторов выровнено. 2 3 4 3 5 7 3 3 3 или 5 5 5 4 3 2 7 5 3 РАВНОМЕРНЫЙ КОМПЛЕКС 3 3 3 5 5 5 3 3 3 или 5 5 5 3 3 3 5 5 5 НЕРАВНОМЕРНЫЙ КОМПЛЕКС 3 5 9 4 2 2 5 7 4 или 2 3 8 4 2 2 7 9 8 ПРОПОРЦИОНАЛЬНЫЙ КОМПЛЕКС
заполнение всех ячеек комплекса вариантами; число вариант в ячейке должно быть не ниже 2.
Слайд 18
ТЕХНИКА ПРОВЕДЕНИЯ ДИСПЕРСИОННОГО АНАЛИЗА АНАЛИЗ РАВНОМЕРНОГО КОМПЛЕКСА т.е. различия между выборочными средними случайны средняя выборочная хотя бы ОДНОЙ ВЫБОРКИ отличается от генеральной средней.
Слайд 20
ТЕХНИКА ПРОВЕДЕНИЯ ДИСПЕРСИОННОГО АНАЛИЗА АНАЛИЗ РАВНОМЕРНОГО КОМПЛЕКСА т.е. различия между выборочными средними случайны средняя выборочная хотя бы ОДНОЙ ВЫБОРКИ отличается от генеральной средней. ОДНОФАКТОРНЫЙ АНАЛИЗ SS A - межгрупповая сумма квадратов (ДЕВИАТА) обусловлена различиями между выборками; SS W - внутригрупповая (остаточная, необъясненная) сумма квадратов, обусловленная варьированием признака внутри выборок.
Слайд 22
ПРОВЕРЯЕТСЯ УСЛОВИЕ ОДНОСТОРОННЕГО ТЕСТА: Нулевая гипотеза сохраняется, если F Fкрит ( , А, W ).
Слайд 23: Возможные выводы
Влияние организованного фактора достоверно. Это означает, что средняя по крайней мере одной из сравниваемых выборок достоверно отличается от остальных. В этом случае остается только определить – какая? или найти общий тренд. Влияние организованного фактора не достоверно. Такая ситуация вполне реальна. В данном случае при проведении дисперсионного анализа необходимо до конца соблюдать правила игры: следует признать случайным отклонения вариант от средней для всего статистического комплекса и отнести их к одной генеральной совокупности - т.е. объединить все сравниваемые выборки.
Слайд 24
Пример. Изучаем влияние глубины на величину плотности моллюсков Macoma calcarea. Для этого на 6 станциях на глубинах от 0.5 до 3 м взято по 5 выборочных площадок площадью 0.1 м2, в каждой из которых посчитали количество моллюсков (таблица). Таким образом, имеется 6 выборок, в каждой выборке по 5 вариант, т.е. имеются все условия для создания однофакторного дисперсионного равномерного комплекса. В роли фактора выступает глубина. Фактор А- глубина; Число градаций фактора -6 ( a); Равномерный комплекс (в каждой выборке 5 вариант)
Слайд 25
Нулевая гипотеза : 1 = 2 = 3 =... 6 =, (т.е. различия между выборочными средними рядов случайны). Альтернативная гипотеза : средняя выборочная хотя бы одной выборки отличается от генеральной средней.
Допустим: нормальность распределения вариант в каждой из сравниваемых выборок случайность выборок независимость средних от дисперсий в выборках комплекса. Оценим значимость различий дисперсий отдельных выборок с помощью критерия Бартлета.
Слайд 27
ПРОВЕРКА ГИПОТЕЗЫ О РАВЕНСТВЕ ВЫБОРОЧНЫХ ДИСПЕРСИЙ С ПОМОЩЬЮ КРИТЕРИЯ БАРТЛЕТА Нулевая гипотеза -… Альтернативная гипотеза -… .
Слайд 28
ПРОВЕРКА ГИПОТЕЗЫ О РАВЕНСТВЕ ВЫБОРОЧНЫХ ДИСПЕРСИЙ С ПОМОЩЬЮ КРИТЕРИЯ БАРТЛЕТА Нулевая гипотеза - выборки относятся к одной генеральной совокупности и, следовательно, наблюдаемые различия между выборочными вариансами случайны Альтернативная гипотеза - наблюдаемые различия между выборочными дисперсиями неслучайны . УСЛОВИЕ КОРРЕКТНОСТИ ПРОЦЕДУРЫ: СЛУЧАЙНОСТЬ ВАРИАНТ ВЫБОРОК И НОРМАЛЬНОСТЬ ИХ РАСПРЕДЕЛЕНИЯ.
Слайд 29
ПРОВЕРКА ГИПОТЕЗЫ О РАВЕНСТВЕ ВЫБОРОЧНЫХ ДИСПЕРСИЙ С ПОМОЩЬЮ КРИТЕРИЯ БАРТЛЕТА Нулевая гипотеза - выборки относятся к одной генеральной совокупности и, следовательно, наблюдаемые различия между выборочными вариансами случайны Альтернативная гипотеза - наблюдаемые различия между выборочными дисперсиями неслучайны Д ля проверки нулевой гипотезы строим односторонний критерий . УСЛОВИЕ КОРРЕКТНОСТИ ПРОЦЕДУРЫ: СЛУЧАЙНОСТЬ ВАРИАНТ ВЫБОРОК И НОРМАЛЬНОСТЬ ИХ РАСПРЕДЕЛЕНИЯ.
Слайд 30
ПРОВЕРЯЕТСЯ УСЛОВИЕ: m - количество выборок Принимается нулевая гипотеза
Слайд 31
Где S i 2 – дисперсия i-ой выборки Чтобы оценить критерий Бартлета рассчитаем несколько величин для каждой отдельной выборки:
Слайд 32
Где S i 2 – дисперсия i-ой выборки Чтобы оценить критерий Бартлета рассчитаем несколько величин для каждой отдельной выборки:
Слайд 33
Где S i 2 – дисперсия i-ой выборки Чтобы оценить критерий Бартлета рассчитаем несколько величин для каждой отдельной выборки:
Слайд 41
Следовательно, в пределах исследуемого комплекса отсутствуют значимые различия между дисперсиями отдельных выборок, и вполне правомочно использовать для сравнения выборок аппарат дисперсионного анализа.
Слайд 42
Однофакторный дисперсионный анализ – сумма вариант отдельной выборки - Сумма вариант всего комплекса Но: Наблюдаемые различия между выборочные средними случайны На: Средняя выборочная хотя бы одной выборки отличается от генеральной средней.
Слайд 43
ДИСПЕРСИЯ (ВАРИАНСА) SS = (X i -M) 2 = X 2 -( X) 2 /n ДЕВИАТА S 2 = X 2 -( X) 2 /n n - 1 SS n - 1 =
Слайд 44
ДИСПЕРСИЯ (ВАРИАНСА) SS = (X i -M) 2 = X 2 -( X) 2 /n ДЕВИАТА S 2 = X 2 -( X) 2 /n n - 1 SS n - 1 = SS a = n i ( X i - M ) 2
Слайд 45
ДИСПЕРСИЯ (ВАРИАНСА) SS = (X i -M) 2 = X 2 -( X) 2 /n ДЕВИАТА S 2 = X 2 -( X) 2 /n n - 1 SS n - 1 = X i – среднее значение переменной в каждой отдельной выборке SS a = n i ( X i - M ) 2
Слайд 46
ДИСПЕРСИЯ (ВАРИАНСА) SS = (X i -M) 2 = X 2 -( X) 2 /n ДЕВИАТА S 2 = X 2 -( X) 2 /n n - 1 SS n - 1 = SS a = n i ( X i - M ) 2 = 3 (X a1 -M) 2 + 3 (X a2 -M) 2 +3(X a3 -M) 2 +3(X a4 -M) 2 X i – среднее значение переменной в каждой отдельной выборке Х1 Х2 Х3 Х 4 Х 5 Х 6 Х 7 Х 8 Х 9 Х 10 Х 11 Х 12
Слайд 47
ДИСПЕРСИЯ (ВАРИАНСА) SS = (X i -M) 2 = X 2 -( X) 2 /n ДЕВИАТА S 2 = X 2 -( X) 2 /n n - 1 SS n - 1 = SS a = n i ( X i - M ) 2 = 3 (X a1 -M) 2 + 3 (X a2 -M) 2 +3(X a3 -M) 2 +3(X a4 -M) 2 X i – среднее значение переменной в каждой отдельной выборке Х1 Х2 Х3 Х 4 Х 5 Х 6 Х 7 Х 8 Х 9 Х 10 Х 11 Х 12 X а1 = (Х1+Х2+Х3)/3 = Xi/ni
Слайд 48
ДИСПЕРСИЯ (ВАРИАНСА) SS = (X i -M) 2 = X 2 -( X) 2 /n ДЕВИАТА S 2 = X 2 -( X) 2 /n n - 1 SS n - 1 = SS a = n i ( X i - M ) 2 = 3 (X a1 -M) 2 + 3 (X a2 -M) 2 +3(X a3 -M) 2 +3(X a4 -M) 2 X i – среднее значение переменной в каждой отдельной выборке Х1 Х2 Х3 Х 4 Х 5 Х 6 Х 7 Х 8 Х 9 Х 10 Х 11 Х 12 X а1 = (Х1+Х2+Х3)/3 = Xi/ni
Слайд 49
ДИСПЕРСИЯ (ВАРИАНСА) SS = (X i -M) 2 = X 2 -( X) 2 /n ДЕВИАТА S 2 = X 2 -( X) 2 /n n - 1 SS n - 1 = SS a = n i ( X i - M ) 2 = 3 (X a1 -M) 2 + 3 (X a2 -M) 2 +3(X a3 -M) 2 +3(X a4 -M) 2 X i – среднее значение переменной в каждой отдельной выборке Х1 Х2 Х3 Х 4 Х 5 Х 6 Х 7 Х 8 Х 9 Х 10 Х 11 Х 12 X а1 = (Х1+Х2+Х3)/3 = Xi/ni
Слайд 50
Однофакторный дисперсионный анализ – сумма вариант отдельной выборки - Сумма вариант всего комплекса SSa=
Слайд 51
Однофакторный дисперсионный анализ – сумма вариант отдельной выборки - Сумма вариант всего комплекса
Слайд 52
Однофакторный дисперсионный анализ – сумма вариант отдельной выборки - Сумма вариант всего комплекса
Слайд 53
Однофакторный дисперсионный анализ – сумма вариант отдельной выборки - Сумма вариант всего комплекса
Слайд 54
Однофакторный дисперсионный анализ Сумма значений вариант всего комплекса Сумма квадратов значений вариант всего комплекса
Слайд 55
Однофакторный дисперсионный анализ Сумма значений вариант всего комплекса Сумма квадратов значений вариант всего комплекса
Слайд 56
Однофакторный дисперсионный анализ Сумма значений вариант всего комплекса Сумма квадратов значений вариант всего комплекса
Слайд 57
Однофакторный дисперсионный анализ Сумма значений вариант всего комплекса Сумма квадратов значений вариант всего комплекса
Слайд 71
Однофакторный дисперсионный анализ ( A ) ( w ) ( t ) Так как F>Fкрит, на выбранном уровне значимости отвергается нулевая гипотеза. Это означает, что средняя по крайней мере одной из сравниваемых выборок достоверно отличается от остальных. Поскольку каждая выборка приурочена к определенной градации фактора А (глубина), можно делать вывод о достоверном влиянии фактора на исследуемый признак, т.е. о достоверном влиянии глубины на распределение численности моллюсков
Слайд 72
СИЛА ВЛИЯНИЯ ФАКТОРА Определение силы влияния фактора по Снедекору ОЦЕНКА ДОСТОВЕРНОСТИ СИЛЫ ВЛИЯНИЯ ФАКТОРА ПРОВОДИТСЯ ПО КРИТЕРИЮ ФИШЕРА влияние фактора соизмеримо с ошибкой оценки и потому вывод о достоверности силы влияния не надежен. влияние фактора достоверно. ПРОВЕРЯЕТСЯ УСЛОВИЕ ОДНОСТОРОННЕГО ТЕСТА:
Слайд 73
СИЛА ВЛИЯНИЯ ФАКТОРА Определение силы влияния фактора по Фишеру = ОЦЕНКА ДОСТОВЕРНОСТИ СИЛЫ ВЛИЯНИЯ ФАКТОРА ПРОВОДИТСЯ ПО КРИТЕРИЮ ФИШЕРА влияние фактора соизмеримо с ошибкой оценки и потому вывод о достоверности силы влияния не надежен. влияние фактора достоверно. ПРОВЕРЯЕТСЯ УСЛОВИЕ ОДНОСТОРОННЕГО ТЕСТА: СТАТИСТИКА: ОШИБКА:
Слайд 80
СИЛА ВЛИЯНИЯ ФАКТОРА В результате мы отвергаем нулевую гипотезу и делаем вывод о достоверности отличия от 0 силы влиянии фактора.
Слайд 91
Анализ комплекса данных на соответствие условиям проведения дисперсионного анализа
Слайд 92
Анализ комплекса данных на соответствие условиям проведения дисперсионного анализа
Слайд 93
Анализ комплекса данных на соответствие условиям проведения дисперсионного анализа
Слайд 94
Анализ комплекса данных на соответствие условиям проведения дисперсионного анализа
Слайд 96
Анализ комплекса данных на соответствие условиям проведения дисперсионного анализа
Слайд 98
Анализ комплекса данных на соответствие условиям проведения дисперсионного анализа
Слайд 99
Анализ комплекса данных на соответствие условиям проведения дисперсионного анализа
Слайд 101
Анализ комплекса данных на соответствие условиям проведения дисперсионного анализа
Слайд 104
Анализ комплекса данных на соответствие условиям проведения дисперсионного анализа