1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ — презентация
logo
1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • Понятие выборочного наблюдения
  • Цель выборочного наблюдения
  • Классификация выборок
  • Статистический ряд и его характеристики
  • Классификация выборок
  • Классификация отборов
  • Классификация выборок
  • Классификация выборок
  • Классификация выборок
  • Классификация выборок
  • Понятие статистического ряда
  • Понятие статистического ряда
  • Статистический ряд и его характеристики
  • Ошибки выборки:
  • Ошибки выборки:
  • Ошибки выборки:
  • Ошибки выборки:
  • Ошибки выборки:
  • Ошибки выборки:
  • Ошибки выборки:
  • Задача:
  • Определение объема выборки:
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • Задача:
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • Статистическая гипотеза
  • Статистическая гипотеза
  • Статистическая гипотеза
  • Статистическая гипотеза
  • Статистическая гипотеза
  • Статистические критерии
  • Статистические критерии
  • Статистические критерии
  • Теоретические и эмпирические частоты
  • Критерии нормальности
  • Критерии нормальности
  • Критерий согласия Пирсона χ 2
  • Критерий согласия Пирсона χ 2
  • Критерий согласия Пирсона χ 2
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • Ряды распределения
  • Вариационные ряды
  • Изучение вариации
  • Этапы анализа вариации
  • Этапы анализа вариации
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • Этапы анализа вариации
  • Этапы анализа вариации
  • Этапы анализа вариации
  • Этапы анализа вариации
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 2. Графическое изображение вариационного ряда
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 2. Графическое изображение вариационного ряда
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • Этапы анализа вариации
  • 2. Графическое изображение вариационного ряда
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 2. Графическое изображение вариационного ряда
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
  • 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
1/89

Первый слайд презентации

1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ

Изображение слайда

2 Понятие выборочного наблюдения Выборочное наблюдение — это такой вид статистического наблюдения, при котором обследованию подвергается не вся изучаемая совокупность, а лишь часть ее единиц, отобранных в определенном порядке. При этом вся исследуемая совокупность называется генеральной, а единицы, подлежащие наблюдению, составляют выборочную совокупность, или выборку.

Изображение слайда

Слайд 3: Цель выборочного наблюдения

3 Цель выборочного наблюдения Цель выборочного наблюдения - определение параметров генеральной совокупности (генеральной средней — х и генеральной доли р ) на основе параметров выборочной совокупности (выборочной средней и выборочной доли ω ). Разница между генеральными и выборочными параметрами называется ошибкой выборки или ошибкой репрезентативности.

Изображение слайда

Слайд 4: Классификация выборок

4 Классификация выборок Выборкой называют часть изделий, отобранных из общей их совокупности для получения информации о всей массе изделий, называемой общей или генеральной совокупностью. Генеральная совокупность подразумевает однородную совокупность параметров качества контролируемых изделий. Если выборка достаточно хорошо представляет соответствующие характеристики генеральной совокупности, то такую выборку называют представительной или репрезентативной.

Изображение слайда

5 Статистический ряд и его характеристики При проведении выборочного наблюдения возможны три способа отбора: случайный, отбор единиц по определенной схеме, сочетание первого и второго способов.

Изображение слайда

Слайд 6: Классификация выборок

6 Классификация выборок При анализе и контроле технологических процессов выборку классифицируют по ряду признаков: по способу образования : повторные; бесповторные; по преднамеренности отбора : пристрастные; случайные; по отношению ко времени образования : единовременные; текущие; по целевому назначению : общепроизводственные; одноагрегатные и т. д.

Изображение слайда

Слайд 7: Классификация отборов

7 Классификация отборов повторный - соответствует схеме «возвращенного шара»: после отбора какой-либо единицы она возвращается в генеральную совокупность и снова может быть выбранной. Таким образом, вероятность попадания каждой отдельной единицы в выборку остается постоянной на всем протяжении отбора бесповторный - отобранная единица не возвращается в генеральную совокупность, и тем самым вероятность попасть в выборку для оставшихся единиц увеличивается с каждым шагом отбора.

Изображение слайда

Слайд 8: Классификация выборок

8 Классификация выборок Повторная выборка образуется путем извлечения изделий из генеральной совокупности с последующим возвращением в последнюю после измерения параметров качества. Такое извлечение и возвращение может быть проведено многократно. При бесповторной выборке извлеченные изделия не возвращаются в генеральную совокупность, при этом дается гарантия, что ни одно изделие не попадет дважды в выборку.

Изображение слайда

Слайд 9: Классификация выборок

9 Классификация выборок Если при отборе изделий из генеральной совокупности одним отдaeтся прeдпoчтeние пo отношению к другим, например отбор изделий с заранее оговоренным признаком, то такую выборку называют пристрастной. Случайная выборка образуется при отборе изделий из генеральной совокупности, если возможность попадания в выборку каждого из них равновероятна. Например, изделие отбирается наугад из разных источников (разные поточные линии, разные единицы оборудования и т. д.).

Изображение слайда

Слайд 10: Классификация выборок

10 Классификация выборок Единовременная выборка образуется из партии изделий после их изготовления независимо от того, в какой момент времени изготовлено каждое из них. В отличие от единовременной текущая выборка состоит из изделий, последовательно изготовленных за определенный промежуток времени.

Изображение слайда

Слайд 11: Классификация выборок

11 Классификация выборок Общепроизводственные выборки преследуют цель получения общей оценки технологического процесса независимо от того, сколько поточных линий, единиц оборудования и т. п. занято в производстве продукции. Одноагрегатная выборка образуется из изделий, изготовленных на определенном оборудовании (агрегате).

Изображение слайда

12 Понятие статистического ряда Значение параметров качества изделий выборки представляет собой первичный статистический материал, подлежащий обработке, осмыслению и научному анализу. Такая однородная совокупность называется « простой статистической совокупностью » или « простым статистическим рядом ». Обычно простая статистическая совокупность оформляется в виде таблицы с одним входом, в первом столбце которой стоит номер опыта, а во втором—замеренное значение параметра.

Изображение слайда

13 Понятие статистического ряда Если расположить замеренные значения параметра в возрастающем или убывающем порядке, то получится так называемый упорядоченный (ранжированный) ряд или упорядоченное распределение различных значений одного и того же параметра качества. Для группирования одинаковых значений параметра статистический материал должен быть подвергнут дополнительной обработке—строится так называемый « статистический ряд ».

Изображение слайда

Слайд 14: Статистический ряд и его характеристики

14 Статистический ряд и его характеристики Ошибки выборки: средняя (стандартная); предельная; относительная.

Изображение слайда

Слайд 15: Ошибки выборки:

15 средняя ошибка выборки для средней величины (п ри случайном и механическом отборах ) при повторном отборе: при бесповторном отборе: Ошибки выборки: — дисперсия признака в генеральной совокупности; n — численность выборки; N — численность генеральной совокупности

Изображение слайда

Слайд 16: Ошибки выборки:

16 Ошибки выборки: Соотношение дисперсии признака в генеральной совокупности σ 2 и выборочной дисперсии S 2

Изображение слайда

Слайд 17: Ошибки выборки:

17 Ошибки выборки: Величина дисперсии доли в генеральной совокупности р — доля единиц, обладающих каким-либо значением признака в генеральной совокупности

Изображение слайда

Слайд 18: Ошибки выборки:

18 Ошибки выборки: Дисперсия доли в генеральной совокупности заменяется дисперсией доли в выборочной совокупности ω — доля единиц, обладающих каким-либо значением признака в выборочной совокупности

Изображение слайда

Слайд 19: Ошибки выборки:

19 Ошибки выборки: Средняя ошибка выборочной доли для повторного отбора бесповторного отбора

Изображение слайда

Слайд 20: Ошибки выборки:

20 Ошибки выборки: Предельная ошибка выборки t — коэффициент доверия, который определяется по таблице значений интегральной функции Лапласа при заданной доверительной вероятности Н аиболее часто употребляемые уровни доверительной вероятности и соответствующие им значения t p(t) 0.683 0.950 0.954 0,990 0,997 t 1,00 1.96 2,00 2,58 3.00

Изображение слайда

Слайд 21: Ошибки выборки:

21 Ошибки выборки: Зная величину выборочной средней ( ) или доли ( ω ), а также предельную ошибку выборки ( Δ ), можно определить доверительные интервалы, в которых находятся значения генеральных параметров

Изображение слайда

Слайд 22: Задача:

22 Задача: Для определения среднего срока пользования краткосрочным кредитом в банке была произведена 5%-я механическая выборка, в которую попали 200 счетов. По результатам выборки установлено, что средний срок пользования кредитом составляет 60 дней при среднеквадратическом отклонении 20 дней. В 8 счетах срок пользования кредитом превышал 6 месяцев. Необходимо с вероятностью 0,99 определить пределы, в которых находятся срок пользования краткосрочными кредитами банка и доля краткосрочных кредитов со сроком пользования более полугода.

Изображение слайда

Слайд 23: Определение объема выборки:

23 Определение объема выборки: Расчет объема выборки для повторного отбора Если полученный объем выборки превышает 5% численности генеральной совокупности, расчеты корректируют «на бесповторность»

Изображение слайда

Слайд 24

24 Для оценки величины генеральной дисперсии можно использовать: выборочную дисперсию по данным прошлых или пробных обследований; дисперсию, найденную из соотношения для среднего квадратического отклонения: 3) дисперсию, определенную из соотношения для асимметричного распределения 4 ) дисперсию, вычисленную из соотношения для нормального распределения x max, x min — соответственно максимальное и минимальное значения признака в генеральной совокупности x — среднее значение признака в генеральной совокупности;

Изображение слайда

Слайд 25

25 Относительная ошибка выборки - отношение предельной ошибки выборки к среднему значению признака, характеризует относительную погрешность выборочного наблюдения Тогда объем выборки: v - коэффициент вариации

Изображение слайда

Слайд 26: Задача:

26 Задача: В городе зарегистрировано 30 тыс. безработных. Для определения средней продолжительности безработицы организуется выборочное обследование. По данным прошлых лет известно, что коэффициент вариации продолжительности безработицы составляет 40%. Какое число безработных необходимо охватить выборочным наблюдением, чтобы с вероятностью 0,997 утверждать, что полученная предельная ошибка выборки не превышает 5% средней продолжительности безработицы?

Изображение слайда

Слайд 27

27 СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ

Изображение слайда

Слайд 28: Статистическая гипотеза

28 Статистическая гипотеза Статистической гипотезой  называется любое предположение о виде неизвестного  закона распределения или о параметрах известных распределений. Предположим, что на основании имеющихся данных есть основания выдвинуть предположения о законе распределения или о параметре закона распределения случайной величины (или генеральной совокупности, на множестве объектов которой определена эта случайная величина). Задача проверки статистической гипотезы заключается в подтверждении или опровержении этого предположения на основании выборочных (экспериментальных) данных.

Изображение слайда

Слайд 29: Статистическая гипотеза

29 Статистическая гипотеза Проверка статистической гипотезы  означает проверку соответствия выборочных данных выдвинутой гипотезе. Параллельно с выдвигаемой основной гипотезой, рассматривают и противоречащую ей гипотезу, которая называется конкурирующей или  альтернативной. Альтернативная гипотеза считается справедливой, если основная выдвинутая гипотеза отвергается.

Изображение слайда

Слайд 30: Статистическая гипотеза

30 Статистическая гипотеза Параметрической гипотезой  называется гипотеза о значениях параметров распределения или о сравнительной величине параметров двух распределений. Примером параметрической статистической гипотезы является гипотеза о равенстве математических ожиданий двух нормальных совокупностей. Непараметрическими гипотезами  называются гипотезы о виде распределения случайной величины.

Изображение слайда

Слайд 31: Статистическая гипотеза

31 Статистическая гипотеза Нулевой, основной или проверяемой гипотезой называется первоначально выдвинутая гипотеза, которая обозначается  Н 0. Конкурирующей или альтернативной гипотезой называется гипотеза, которая противоречит основной гипотезе   Н 0  и обозначается  Н 1. Например, основная гипотеза   Н 0  состоит в том, что математическое ожидание  μ  равно какому-то значению μ 0. В этом случае конкурирующая гипотеза  Н 1  может состоять в предположении, что математическое ожидание  μ  не равно (больше или меньше) значения μ 0 : Н 0 : μ=μ 0 ;   Н 1 : μ≠μ 0,  или  Н 1 : μ>μ 0,  Н 1 : μ<μ 0.

Изображение слайда

Слайд 32: Статистическая гипотеза

32 Статистическая гипотеза При проверке статистических гипотез существует вероятность допустить ошибку, приняв или опровергнув верную гипотезу. Уровнем значимости (  )  называется вероятность совершения ошибки первого рода. Значение уровня значимости а обычно задается близким к нулю (например, 0,05; 0,01; 0,02 и т. д.) - чем меньше значение уровня значимости, тем меньше вероятность совершить ошибку первого рода, состоящую в опровержении верной гипотезы  Н 0.

Изображение слайда

Слайд 33: Статистические критерии

33 Статистические критерии Проверка справедливости статистических гипотез осуществляется с помощью различных статистических критериев. В статистике чаще всего пользуются тремя уровнями значимости: α=0,10,  тогда Р=0,90 (в 10 случаях из 100) α=0,05,   тогда Р=0,95 ( в 5 случаях из 100) α=0,01, тогда Р=0,99 (в 1 случае из 100) может быть отвергнута правильная гипотеза

Изображение слайда

Слайд 34: Статистические критерии

34 Статистические критерии Статистическим критерием  называется случайная величина, которая используется с целью проверки нулевой гипотезы. Статистические критерии называются соответственно по тому закону распределения, которому они подчиняются: F-критерий подчиняется распределению Фишера-Снедекора, χ 2 -критерий подчиняется χ 2 -распределению, t -критерий подчиняется распределению Стьюдента, U-критерий подчиняется нормальному распределению.

Изображение слайда

Слайд 35: Статистические критерии

35 Статистические критерии Областью принятия гипотезы  или областью допустимых значений называется множество возможных значений статистического критерия, при которых основная гипотеза принимается. Если наблюдаемое значение статистического критерия, рассчитанное по данным выборочной совокупности, принадлежит критической области, то основная гипотеза отвергается. Если наблюдаемое значение статистического критерия принадлежит области принятия гипотезы, то основная гипотеза принимается.

Изображение слайда

Слайд 36: Теоретические и эмпирические частоты

36 Теоретические и эмпирические частоты При анализе вариационных рядов распределения большое значение имеет, насколько эмпирическое распределение признака соответствует нормальному. Для этого частоты фактического распределения нужно сравнить с теоретическими, которые характерны для нормального распределения. Значит, нужно по фактическим данным вычислить теоретические частоты кривой нормального распределения, являющиеся функцией нормированных отклонений. Иначе говоря, эмпирическую кривую распределения нужно выровнять кривой нормального распределения.

Изображение слайда

Слайд 37: Критерии нормальности

37 Критерии нормальности Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия. Критерием согласия  называют критерий, который позволяет установить, является ли расхождение эмпирического и теоретического распределений случайным или значимым, т. е. согласуются ли данные наблюдений с выдвинутой статистической гипотезой или не согласуются. Распределение генеральной совокупности, которое она имеет в силу выдвинутой гипотезы, называют  теоретическим.

Изображение слайда

Слайд 38: Критерии нормальности

38 Критерии нормальности Обычно эмпирические и теоретические частоты различаются в силу того, что: расхождение случайно и связано с ограниченным количеством наблюдений; расхождение неслучайно и объясняется тем, что статистическая гипотеза о том, что генеральная совокупность распределена нормально — ошибочна. Таким образом, критерии согласия позволяют отвергнуть или подтвердить правильность выдвинутой при выравнивании ряда  гипотезы о характере распределения в эмпирическом ряду. Эмпирические частоты получают в результате наблюдения. Теоретические частоты рассчитывают по формулам.

Изображение слайда

Слайд 39: Критерий согласия Пирсона χ 2

39 Критерий согласия Пирсона χ 2 Критерий согласия Пирсона χ 2  – один из основных, который можно представить как сумму отношений квадратов расхождений между теоретическими ( fТ ) и эмпирическими ( f ) частотами к теоретическим частотам: k –число групп, на которые разбито эмпирическое распределение, fi –наблюдаемая частота признака в i-й группе, f t –теоретическая частота.

Изображение слайда

Слайд 40: Критерий согласия Пирсона χ 2

40 Критерий согласия Пирсона χ 2 Для распределения χ 2  составлены таблицы, где указано критическое значение критерия согласия χ 2  для выбранного уровня значимости  α  и степеней свободы df (или  ν ). Уровень значимости  α  – вероятность ошибочного отклонения выдвинутой гипотезы, т.е. вероятность того, что будет отвергнута правильная гипотеза. Р — статистическая достоверность принятия верной гипотезы. Число степеней свободы df определяется как число групп в ряду распределения минус число связей: df = m – n.  Под числом связей понимается число показателей эмпирического ряда, использованных при вычислении теоретических частот, т.е. показателей, связывающих эмпирические и теоретические частоты. Например, при выравнивании по кривой нормального распределения имеется три связи. Поэтому при выравнивании по кривой нормального распределения число степеней свободы определяется как df =k –3.

Изображение слайда

Слайд 41: Критерий согласия Пирсона χ 2

41 Критерий согласия Пирсона χ 2 Для оценки существенности, расчетное значение сравнивается с табличным χ 2 табл При полном совпадении теоретического и эмпирического распределений χ 2 =0, в противном случае χ 2 >0. Если χ 2 расч > χ 2 табл, то при заданном уровне значимости и числе степеней свободы гипотезу о несущественности (случайности) расхождений отклоняем. В случае, если χ 2 расч < χ 2 табл  то  гипотезу принимаем и с вероятностью Р=(1-α) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно. Следовательно, есть основания утверждать, что эмпирическое распределение подчиняется нормальному распределению. Критерий согласия Пирсона используется, если объем совокупности достаточно велик (N>50), при этом, частота каждой группы должна быть не менее 5

Изображение слайда

Слайд 42

42 ИЗУЧЕНИЕ ВАРИАЦИИ

Изображение слайда

Слайд 43: Ряды распределения

43 Ряды распределения Статистические ряды распределения представляют собой упорядоченное распределение единиц совокупности  по группам и группировкам. Ряды распределения изучают структуру совокупности, позволяют изучить ее однородность, размах и границы. Ряды распределения, образованные по качественным признакам, называют атрибутивными. При группировке по количественному признаку выделяются вариационные ряды. Вариационные ряды – ряды распределения единиц совокупности по признакам, имеющим количественное выражение, т. е. образованы численными значениями.

Изображение слайда

Слайд 44: Вариационные ряды

44 Вариационные ряды Дискретные  (прерывные) – основаны на прерывных вариациях признака. Это такие ряды, где значения вариант имеют значения целых чисел (т. е. не могут принимать дробные значения). Дискретные признаки отличаются друг от друга на некоторую конкретную величину. Интервальные (непрерывные) – имеют любые, в том числе и дробные количественные выражения и представлены в виде интервалов. Непрерывные признаки могут отличаться один от другого на сколь угодно малую величину.

Изображение слайда

Слайд 45: Изучение вариации

45 Изучение вариации Вариацией признака называют отличие в численных значениях признаков единиц совокупности и их колебания около средней величины. Чем меньше вариация, тем более однородна совокупность и более надежна (типична) средняя величина.

Изображение слайда

Слайд 46: Этапы анализа вариации

46 Этапы анализа вариации Построение вариационного ряда Графическое изображение вариационного ряда Расчет показателей центра распределения и структурных характеристик вариационного ряда Расчет показателей размера и интенсивности вариации Оценка вариационного ряда на асимметрию и эксцесс

Изображение слайда

Слайд 47: Этапы анализа вариации

47 Этапы анализа вариации Построение вариационного ряда ( ряда распределения) – это упорядоченное распределение единиц совокупности по возрастающим или убывающим значениям признака и подсчета числа единиц с тем или иным значением. Построение вариационного ряда

Изображение слайда

Слайд 48

48 Статистический ряд случайных величин Х Х1 Х2 X3 ... Хi ... X k т m1 m2 m3 ... mi ... mk - значения параметра в ранжированном порядке и соответствующие частоты Х- обозначение i -го интервала; mi — соответствующая частота; k — число интервалов

Изображение слайда

Слайд 49: Этапы анализа вариации

49 Этапы анализа вариации Исходные данные Построение вариационного ряда Среднедушевой денежный доход в среднем за месяц, тыс. руб. Число жителей Накопленные частости ( S) Середина интервала (х) xf xw чел. ( f) в % к итогу ( w) До 0,5 26 0,9 0,9 0,25 6,5 0,2 0,5-1,0 463 16,5 17,4 0,75 347,25 12,4 1,0-1,5 690 24,6 42,0 1,25 862,5 30,7 1,5-2,0 528 18,8 60,8 1,75 924 32,9 2,0-2,5 434 15,5 76,2 2,25 976,5 34,8 2,5-3,0 350 12,5 88,7 2,75 962,5 34,3 3,0 и более 318 11,3 100,0 3,25 1033,5 36,8 Итого 2809 100 5112,75 182,0

Изображение слайда

Слайд 50: Этапы анализа вариации

50 Этапы анализа вариации В составе любого вариационного ряда можно выделить три основных элемента: варианты – это значения, которые принимает исследуемый признак совокупности; если варианты представлены в виде целочисленных величин, вариационный ряд называют дискретным, а если в виде интервалов - интервальным, частоты вариационного ряда – абсолютная численность отдельных групп с различными значениями признака, частости вариационного ряда – удельные веса (доли) отдельных групп в общей численности совокупности. Построение вариационного ряда

Изображение слайда

Слайд 51: Этапы анализа вариации

51 Этапы анализа вариации Графическое изображение вариационного ряда облегчает его анализ и позволяет судить о форме распределения. Способы графического представления вариационного ряда: гистограмма; полигон частот; кумулята распределения 2. Графическое изображение вариационного ряда

Изображение слайда

Слайд 52: Этапы анализа вариации

52 Этапы анализа вариации Гистограмма – столбиковая диаграмма, для построения которой на оси абсцисс откладывают отрезки, равные величине интервалов вариационного ряда. На отрезках строят прямоугольники, высота которых в принятом масштабе по оси ординат соответствует частотам (или частостям ). 2. Графическое изображение вариационного ряда

Изображение слайда

Слайд 53

53 Гистограмма служит для графического анализа распределения Алгоритм построения гистограммы: Определяются минимальное min ( X ) и максимальное max ( X ) значения выборки (наибольшее и наименьшее значения). Определяется размах выборки как разность между наибольшим и наименьшим значениями указанного показателя D = max ( X )- min ( X ), Рассчитывается число интервалов гистограммы: К=1,5+3,3 lg n, где К - число интервалов; n - число значений случайной величины). Определяется ширина интервала h гистограммы путем деления диапазона гистограммы на число интервалов h = D / K. В случае, когда ширина интервала не превышает двукратной цены деления измерительного средства, необходимо уменьшить число интервалов К, чтобы не получить полигон частот вместо гистограммы распределения. Диапазон гистограммы разбивается на интервалы. Подсчитывается число попаданий результатов в каждый j - тый интервал p ( hj ). Определяется частота попаданий в интервал wj путем деления числа попаданий на размер выборки. wj = p ( hj )/ n. Строится столбчатая диаграмма.

Изображение слайда

Слайд 54: 2. Графическое изображение вариационного ряда

54 2. Графическое изображение вариационного ряда Гистограмма

Изображение слайда

Слайд 55

55 Гистограмма

Изображение слайда

Слайд 56

56 Полигон частот полигон распределения строится в прямоугольной системе координат; по оси абсцисс откладываются значения параметра, а по оси ординат—соответствующие им частоты; вершины ординат соединяются прямыми линиями. 2. Графическое изображение вариационного ряда

Изображение слайда

Слайд 57: 2. Графическое изображение вариационного ряда

57 2. Графическое изображение вариационного ряда Полигон частот

Изображение слайда

Слайд 58

58 Кумулята Кумулята распределения строится по накопленным частотам ( частостям ). Накопленные частоты ( частости ) определяют последовательным суммированием частот ( частостей ). Они показывают, сколько единиц совокупности имеют значение признака не больше, чем рассматриваемое значение 2. Графическое изображение вариационного ряда

Изображение слайда

Слайд 59: Этапы анализа вариации

59 Этапы анализа вариации Исходные данные Построение вариационного ряда Среднедушевой денежный доход в среднем за месяц, тыс. руб. Число жителей Накопленные частости ( S) Середина интервала (х) xf xw чел. ( f) в % к итогу ( w) До 0,5 26 0,9 0,9 0,25 6,5 0,2 0,5-1,0 463 16,5 17,4 0,75 347,25 12,4 1,0-1,5 690 24,6 42,0 1,25 862,5 30,7 1,5-2,0 528 18,8 60,8 1,75 924 32,9 2,0-2,5 434 15,5 76,2 2,25 976,5 34,8 2,5-3,0 350 12,5 88,7 2,75 962,5 34,3 3,0 и более 318 11,3 100,0 3,25 1033,5 36,8 Итого 2809 100 5112,75 182,0

Изображение слайда

Слайд 60: 2. Графическое изображение вариационного ряда

60 2. Графическое изображение вариационного ряда Кумулята

Изображение слайда

Слайд 61

61 Для характеристики среднего значения признака в вариационном ряду используются показатели центра распределения. К ним относятся: средняя величина признака мода медиана 3. Показатели центра распределения и структурные характеристики вариационного ряда

Изображение слайда

Слайд 62

62 Средняя величина признака Рассчитывается по формуле средней арифметической взвешенной: 3. Показатели центра распределения и структурные характеристики вариационного ряда x – варианты признака f – частоты ( частости )

Изображение слайда

Слайд 63

63 Среднедушевой денежный доход в среднем за месяц, тыс. руб. Число жителей Накопленные частости ( S) Середина интервала (х) xf xw чел. ( f) в % к итогу ( w) До 0,5 26 0,9 0,9 0,25 6,5 0,2 0,5-1,0 463 16,5 17,4 0,75 347,25 12,4 1,0-1,5 690 24,6 42,0 1,25 862,5 30,7 1,5-2,0 528 18,8 60,8 1,75 924 32,9 2,0-2,5 434 15,5 76,2 2,25 976,5 34,8 2,5-3,0 350 12,5 88,7 2,75 962,5 34,3 3,0 и более 318 11,3 100,0 3,25 1033,5 36,8 Итого 2809 100 5112,75 182,0 Средняя величина признака 3. Показатели центра распределения и структурные характеристики вариационного ряда Месячный среднедушевой доход составляет 1820 руб. тыс. руб.

Изображение слайда

Слайд 64

64 Среднедушевой денежный доход в среднем за месяц, тыс. руб. Число жителей Накопленные частости ( S) Середина интервала (х) xf xw чел. ( f) в % к итогу ( w) До 0,5 26 0,9 0,9 0,25 6,5 0,2 0,5-1,0 463 16,5 17,4 0,75 347,25 12,4 1,0-1,5 690 24,6 42,0 1,25 862,5 30,7 1,5-2,0 528 18,8 60,8 1,75 924 32,9 2,0-2,5 434 15,5 76,2 2,25 976,5 34,8 2,5-3,0 350 12,5 88,7 2,75 962,5 34,3 3,0 и более 318 11,3 100,0 3,25 1033,5 36,8 Итого 2809 100 5112,75 182,0 Средняя величина признака 3. Показатели центра распределения и структурные характеристики вариационного ряда тыс. руб.

Изображение слайда

Слайд 65

65 Мода Мода - значение признака, наиболее часто встречающееся в изучаемой совокупности. в· дискретном ряду модой является вариант с наибольшей частотой ( частостью ). В интервальном вариационном ряду мода рассчитывается по формуле: 3. Показатели центра распределения и структурные характеристики вариационного ряда Модальный интервал - это интервал, имеющий наибольшую частоту ( частость ).

Изображение слайда

Слайд 66: 2. Графическое изображение вариационного ряда

66 2. Графическое изображение вариационного ряда Мода

Изображение слайда

Слайд 67

67 Мода Медиана- вариант, расположенный в середине упорядоченного вариационного ряда, делящий его на две равные части, таким образом, что половина единиц совокупности имеют значения признака меньше, чем медиана, а половина -больше, чем медиана. В интервальном ряду медиана определяется по формуле: 3. Показатели центра распределения и структурные характеристики вариационного ряда

Изображение слайда

Слайд 68

68 Мода 3. Показатели центра распределения и структурные характеристики вариационного ряда

Изображение слайда

Слайд 69

69 По соотношению характеристик центра распределения (средней величины, моды и медианы) можно судить о симметричности эмпирического ряда распределения. Симметричным является распределение, в котором частоты двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой. В симметричном распределении средняя величина, медиана и мода равны между собой: 3. Показатели центра распределения и структурные характеристики вариационного ряда

Изображение слайда

Слайд 70

70 Если то имеет место правосторонняя асимметрия, т. е. бОльшая часть единиц совокупности имеет значения изучаемого признака, превышающие модальное значение. На графике распределения правая ветвь относительно максимальной ординаты вытянута больше, чем левая. 3. Показатели центра распределения и структурные характеристики вариационного ряда

Изображение слайда

Слайд 71

71 Соотношение характерно для левосторонней асимметрии, при которой бОльшая часть единиц совокупности имеет значения признака ниже модального. На графике распределения левая ветвь вытянута больше, чем правая. 3. Показатели центра распределения и структурные характеристики вариационного ряда

Изображение слайда

Слайд 72

72 Обязательным этапом в изучении вариационных рядов является расчет показателей размера и интенсивности вариации. Для характеристики размера вариации в статистике применяются абсолютные показатели вариации: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия. 4. Показатели размера и интенсивности вариации

Изображение слайда

Слайд 73

73 Размах вариации (размах колебаний) представляет собой разность между максимальным и минимальным значениями признака в совокупности: 4. Показатели размера и интенсивности вариации

Изображение слайда

Слайд 74

74 Размах вариации зависит от величины только крайних значений признака. Более точно характеризуют вариацию признака показатели, основанные на учете колеблемости всех значений признака,- среднее линейное отклонение ( d ) и среднее квадратическое отклонение ( σ ) 4. Показатели размера и интенсивности вариации

Изображение слайда

Слайд 75

75 Квадрат среднего квадратического отклонения называется дисперсией ( σ 2 ): 4. Показатели размера и интенсивности вариации

Изображение слайда

Слайд 76

76 Квадрат среднего квадратического отклонения называется дисперсией ( σ 2 ): 4. Показатели размера и интенсивности вариации

Изображение слайда

Слайд 77

77 Для оценки интенсивности вариации, а также для сравнения ее величины в разных совокупностях или по разным признакам используют относительные показатели вариации, которые рассчитываются как отношение абсолютных показателей вариации к средней величине признака: ·относительный размах вариации (коэффициент осцилляции), относительное линейное отклонение и др. Наиболее часто на практике применяют коэффициент вариации ( ν ), который представляет собой относительное квадратическое отклонение: 4. Показатели размера и интенсивности вариации

Изображение слайда

Слайд 78

78 По величине коэффициента вариации можно судить об интенсивности вариации признака, а следовательно, и об однородности состава изучаемой совокупности. Чем больше величина коэффициента вариации, тем больше разброс значений признака вокруг средней, тем больше неоднородность совокупности. Существует Шкала определения степени однородности совокупности в зависимости от значений коэффициента вариации. 4. Показатели размера и интенсивности вариации

Изображение слайда

Слайд 79

79 Асимметрия и эксцесс являются важнейшими.характеристиками формы распределения. Ряды распределения могут иметь один и тот же центр группирования (показатели центра распределения) и одинаковые пределы варьирования признака (показатели вариации), однако при этом отличаться характером распределения единиц совокупности вокруг центра. Если большая часть совокупности расположена левее центра, имеет место левосторонняя асимметрия, если правее - правосторонняя. 5.5. Оценка вариационного ряда на асимметрию и эксцесс

Изображение слайда

Слайд 80

80 Для оценки степени асимметричности применяют моментный и структурный коэффициенты асимметрии. Моментный коэффициент асимметрии (стандартизованный момент третьего порядка) определяется по формуле: 5.5. Оценка вариационного ряда на асимметрию и эксцесс

Изображение слайда

Слайд 81

81 Степень существенности асимметрии можно оценить с помощью средней квадратической ошибки коэффициента асимметрии, которая зависит от объема изучаемой совокупности и рассчитывается по формуле: 5.5. Оценка вариационного ряда на асимметрию и эксцесс

Изображение слайда

Слайд 82

82 Структурные показатели (коэффициенты) асимметрии характеризуют асимметричность только в центральной части распределения, т. е. основной массы единиц, и в отличие от моментного коэффициента не зависят от крайних значений признака. Наиболее часто применяют структурный коэффициент асимметрии, предложенный английским статистиком К. Пирсоном: 5.5. Оценка вариационного ряда на асимметрию и эксцесс

Изображение слайда

Слайд 83

83 Другим свойством рядов распределения является эксцесс Под эксцессом понимают островершинность или плосковершинность распределения по сравнению с нормальным распределением при той же силе вариации. Э ксцесс -это отклонение вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. При этом эксцесс определяется только для симметричных и умеренно асимметричных распределений. 5.5. Оценка вариационного ряда на асимметрию и эксцесс

Изображение слайда

Слайд 84

84 Чаще всего на практике эксцесс оценивается с помощью следующего показателя: 5.5. Оценка вариационного ряда на асимметрию и эксцесс

Изображение слайда

Слайд 85

85 5.5. Оценка вариационного ряда на асимметрию и эксцесс Чтобы оценить существенность эксцесса распределения, рассчитывают среднюю квадратическую ошибку эксцесса:

Изображение слайда

Слайд 86

86 Числовые характеристики статистического ряда средние

Изображение слайда

Слайд 87

87 Числовые характеристики статистического ряда характеристики вариации (рассеяния)

Изображение слайда

Слайд 88

88 Проверка гипотезы о нормальном распределении генеральной совокупности Во многих практических задачах точный закон распределения исследуемого признака Х генеральной совокупности неизвестен. В этом случае необходимо проверить гипотезу о предполагаемом законе распределения. Выдвигаются нулевая гипотеза Н 0 и ей конкурирующая Н 1. Н 0: признак Х имеет нормальный закон распределения. Н 1: признак Х имеет закон распределения, отличный от нормального. Нулевая гипотеза проверяется с помощью критерия согласия.

Изображение слайда

Последний слайд презентации: 1 ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ

89 Проверка гипотезы о нормальном распределении генеральной совокупности

Изображение слайда

Похожие презентации