Первый слайд презентации: Нормальный закон распределения и его применение
1 Нормальный закон распределения и его применение Нормальное распределение ( распределение Гаусса) характеризуется тем, что крайние значения признака в нем встречаются достаточно редко, а значения, близкие к средней величине – достаточно часто. Это распределение следует закону, открытому тремя учеными в разное время: Муавром в 1733 г. в Англии, Гауссом в 1809 г. в Германии и Лапласом в 1812 г. во Франции. Нормальным такое распределение называется потому, что оно очень часто встречалось в естественно-научных исследованиях и казалось "нормой" всякого массового случайного проявления признаков. Оно применимо только для метрических данных! Это распределение описывается формулой: где f отн. – относительные частоты появления каждого конкретного значения случайной величины хi. Предполагается, что переменная хi, может принимать бесконечно большие и бесконечно малые значения, количество измерений бесконечно.
Слайд 2: Нормальное распределение
2 Нормальное распределение График нормального распределения представляет собой колоколообразную кривую ( симметричен относительно среднего арифметического значения ). Характерное свойство нормального распределения состоит в том, что 68,2 6 % из всех его наблюдений всегда лежат в диапазоне «плюс - минус» одно стандартное отклонение от среднего арифметического (какова бы ни была величина стандартного отклонения). 95,4 4 % - в пределах двух стандартных отклонений и 99,7 2 % - в пределах трех стандартных отклонений.
Слайд 4: Проверка нормальности распределения
4 Проверка нормальности распределения 1. Среднее арифметическое, мода и медиана равны. 2. Нормальность распределения результативного признака можно проверить путем расчета показателей асимметрии и эксцесса и сопоставления их с критическими значениями (формулы Н.А. Плохинского и Е.И. Пустыльника ). 3. Нормальным распределением может быть только распределение с числом наблюдений не менее 30 (при наличии и других условий соответствий).
Слайд 5: Нормальное распределение
Частота Среднее, мода и медиана Значение переменной
Слайд 7: Асимметрия
7 Асимметрия Асимметрия - это показатель симметричности/ скошенности кривой распределения. Для симметричного распределения асимметрия равна 0. Если чаще встречаются значения меньше среднего, то говорят о левосторонней, или положительной асимметрии (As > 0). Если же чаще встречаются значения больше среднего, то асимметрия – правосторонняя, или отрицательная ( As<0). Чем больше отклонение от нуля, тем больше асимметрия.
Слайд 8: Эксцесс
8 Эксцесс Эксцесс - показатель плосковершинности или остроконечности графика распределения измеренного признака. Островершинное распределение характеризуется положительным эксцессом ( Ех > 0) Плосковершинное - отрицательным ( Ех < 0) « Средневершинное » (нормальное) распределение имеет нулевой эксцесс ( Ех = 0).
Слайд 9: Эксцесс (Е, Ех)
Если в распределении преобладают крайние значения, причем одновременно и более низкие, и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться впадина, превращающая его в двувершинное :
Слайд 10: Асимметрия, эксцесс
10 Асимметрия, эксцесс Формула показателя асимметрии следующая: Показатель эксцесса определяется по формуле:
Слайд 11: Проверка нормальности распределения
11 Проверка нормальности распределения Рассмотрим применение метода Е.И. Пустыльника. Действовать будем по следующему алгоритму: 1) рассчитаем критические значения показателей асимметрии и эксцесса по формулам Е.И. Пустыльника и сопоставим с ними эмпирические значения; 2) если эмпирические значения показателей окажутся ниже критических, сделаем вывод о том, что распределение признака не отличается от нормального. Формулы для определения критических значений асимметрии и эксцесса (формулы Е.И. Пустыльника ): Для обработки данных понадобятся такие последовательные шаги: вычисление Мх, σ, A, E и подсчет п. | А |<A кр } → распределение совпадает с нормальным | Е |< Екр}
Слайд 12: Проверка нормальности распределения (пример)
12 Проверка нормальности распределения (пример)
Слайд 13: Проверка нормальности распределения (пример)
13 Проверка нормальности распределения (пример)
Слайд 14: Проверка нормальности распределения (пример)
14 Проверка нормальности распределения (пример)
Слайд 15: Проверка нормальности распределения (пример)
15 Проверка нормальности распределения (пример)
Слайд 16: Процедура стандартизации
Приведение распределения к стандартной форме. Любое множество значений показателя со средним значением Мх и стандартным показателем σ можно преобразовать в другое множество, среднее значение которого равно 0, а стандартное отклонение - равно1. Необходимость в таком преобразовании возникает когда требуется сопоставить значения показателей, имеющих разную размеренность, т.е. измеренных по шкалам с различными единицами измерения (баллы, секунды, см и т.д.). Такое преобразование называется стандартизация или нормирование и позволяет получить стандартизированные или нормированные значения исходных данных. 16
19
Слайд 20: Статистическая норма
20 Статистическая норма Принято считать, что в пределах Мх ± 2 σ располагаются значения, относящиеся к статистической норме, то есть те значения, которые включены в так называемый 95%-ный доверительный интервал. Знание Мх и σ можно использовать для выведения статистической нормы. Обязательные для этой процедуры условия: соответствие распределения нормальному и п ≥ 30. Например, необходимо определить границы нормы для российской выборки у переведенного недавно с английского языка теста. После перевода и адаптации мы проводим исследование на оптантах, чьим родным языком является русский. По окончании обработки результатов получаем: п = 80, Мх = 30, σ = 5,9. Границы статистической нормы для теста лежат в диапазоне Мх ± 2 σ, то есть 30 ±11,8. Таким образом, верхняя граница нормы = 18, нижняя = 42.
Слайд 21: Схема деления выборки на подгруппы
Деление выборки на три подгруппы. Первая центральная подгруппа образуется из испытуемых, имеющих значение показателя в пределах Мх ± σ. Во вторую подгруппу выделяются испытуемые со значениями показателя, превышающего Мх + σ. Третью группу образуют испытуемые, у которых значение показателя ниже Мх - σ. Значения показателей центральной подгруппы испытуемых рассматривают в качестве нормы ; второй и третье подгрупп – соответственно, выше и ниже нормы. 21
Слайд 23
Выбор типа шкалы зависит от исходных данных. Если сырой балл принимает значения от 0 до 100 и мы стандартизируем его в стены, то явно теряем слишком много информации, т.к. внутри одного стандартного интервала может находиться достаточно много сырых баллов. Это неприемлемо. Поэтому, при большом диапазоне сырых баллов используются Т-баллы. В тестах интеллекта традиционно используется IQ, если интервал значений сырых баллов невелик, то можно использовать стены. 23
Слайд 24: Нормализация исходных данных
Процедура приведения распределения к нормальному виду носит название нормализация, а преобразованные исходные данные называются нормализованными. Нормализованные значения могут быть найдены с помощью таблиц, в которых приводится процент случаев (процентили) разных отклонений в единицах σ от среднего значения для нормальной кривой. Алгоритм: сначала определяется процент испытуемых в исследуемой выборке с тем же или более высоким исходным значением показателя (вычисляются соответствующие кумуляты распределения - распределение признака в вариационном ряду по накопленным частотам). Затем этот процент отыскивается в таблице нормального распределения частот и по нему находится соответствующее значение нормализованного стандартного показателя. Далее распределению этих нормализованных значений путем соответствующего линейного преобразования можно придать любую удобную для последующего анализа форму. 24
Слайд 25: Примеры
Процедура нормализации исходного распределения испытуемых по возрасту. 25 Возраст испытуемого (лет) 17 18 19 20 21 22 23 Кол-во испытуемых данного возраста 2 15 14 6 6 5 2 Доля испытуемых данного возраста (%) 4 30 28 12 12 10 4 Кумулята распределения (%) 4 34 62 74 86 96 100