Первый слайд презентации: 2. Описательная статистика
Слайд 4
Число, которое встречается в числовом наборе наиболее часто, называют его модой.
Слайд 5
Итак, в качестве итоговой оценки можно взять моду. Однако справедливо ли будет не учитывать другие отметки? Ведь двоек у третьего ученика хотя и больше всего, но только 40% от общего количества отметок. А пятёрок у первого и того меньше — всего 35%. И потом, если мы будем выбирать в качестве итоговой оценки моду, то рискуем попасть в безвыходное положение: ведь вполне может быть так, что две (или даже три) самые популярные отметки будут встречаться одинаково часто. В этом случае говорят, что у числового набора нет моды. Таким образом, выбор моды в качестве критерия для выставления итоговой оценки далеко не лучший вариант. Тем не менее мода довольно часто используется в статистических опросах, таких, например, как выборы
Слайд 6
Это объясняется двумя причинами: во-первых, моду можно найти даже для не числового набора данных (например, можно определить, за какого кандидата чаще всего голосовали избиратели); во-вторых, если набор данных большой по объёму, а различных значений немного, то совпадение частот у двух кандидатов очень маловероятно.
Слайд 8
Средним арифметическим набора чисел называется частное от деления суммы этих чисел на их количество.
Слайд 12
Чтобы найти медиану произвольного ряда чисел, их нужно записать по возрастанию и воспользоваться следующим правилом: если ряд состоит из нечетного количества чисел, то медианой будет число, которое находится посередине; если ряд состоит из четного количества чисел, то медианой будет среднее арифметическое двух чисел, находящихся посередине.
Слайд 13
Посчитаем медиану отметок для каждого ученика из нашего примера: 1-й ученик: 5, 2, 4, 5, 3, 2, 3, 2, 4, 3, 4, 5, 4, 3, 4, 5, 5, 5, 4, 5; 2-й ученик: 3, 3, 2, 3, 3, 3, 2, 3, 5, 3, 3, 4, 4, 2, 4, 3, 4, 5, 3, 4, 4, 5, 2; 3-й ученик: 2, 3, 2, 4, 5, 2, 3, 2, 3, 4
Слайд 14
1-й ученик отметки 4 и 4, медиана – 4. 2-й ученик отметка 3, медиана 3. 3-й ученик отметки 3 и 3, медиана 3.
Слайд 15
Как видим, с точки зрения медианной оценки успеваемость второго и третьего учеников оказалась одинаковой — медиана и там, и там равна 3. Сложнее найти медиану, если вам дан не числовой набор, а построенная по нему таблица частот. Конечно, можно сначала выписать все числа по порядку в нужном количестве, а потом найти по ним медиану. Но можно действовать рациональнее: достаточно двигаться по возрастающим значениям ряда, записанным в таблице, и суммировать количество повторений, пока их не станет больше половины (или суммировать частоты, пока сумма не превысит 0,5). То значение, на котором это произошло, и будет медианой. Для этого можно добавить к нашей таблице ещё одну строку — строку накопленных (т. е. просуммированных) частот. Вот как такая строка будет выглядеть для первого ученика «Перевал» накопленной частоты через 0,5 произошёл на отметке «4», значит, это число и будет медианой. Подытоживая, можно дать следующее определение медианы.
Слайд 16
Медианой числового набора называется такое число m, что хотя бы 50% исходных чисел ≤ m, и хотя бы 50% исходных чисел ≥ m.
Слайд 17
Все три рассмотренные величины называют средними характеристиками числового набора. Конечно, они не несут всей полноты информации, полученной в статистическом исследовании (ведь целый массив данных характеризуется всего одним числом!), Но содержат ключевую информацию, на основе которой часто принимаются важные решения (выставляется итоговая оценка, определяется победитель соревнований, выбирается президент и т. д.). В электронной таблице для вычисления каждой из средних характеристик есть специальная функция: Мода(диапазон) — мода; Срзнач (диапазон) — среднее арифметическое; Медиана(диапазон) — медиана.
Слайд 19
Получается, что три разных подхода к выставлению итоговой оценки одних и тех же учеников дают разные результаты. Представим их в виде таблицы
Слайд 20
Правда, среднее арифметическое всё равно придётся округлить, и тогда, скорее всего, учитель выставит первому ученику 4, а второму и третьему — 3. Какая же из этих характеристик лучше? Ответить на этот вопрос невозможно, так как выбор подходящей средней характеристики зависит от конкретной ситуации. Рассмотрим достоинства и недостатки средних характеристик.
Слайд 21
Мода. Мы уже говорили о том, что моды у числового ряда может не быть вовсе. Кроме того, даже когда она есть, её значение может быть малоинформативным, давать искажённое представление о поведении числового набора. Например, для последовательности чисел 1, 1, 3, 4, 6, 8, 9, 12 мода равна 1, но вряд ли это можно считать какой-то важной характеристикой. В то же время, когда из всего набора данных (не обязательно числового) нужно по условию задачи выбрать ровно одно значение, например определить лучшую книгу года или выбрать победителя в каком-то конкурсе, мода оказывается самой подходящей характеристикой.
Слайд 22
Среднее арифметическое. Среднее арифметическое — наиболее популярная из этих характеристик. Средний балл по какому-то предмету, среднесуточная температура, средняя выработка на производстве — всё это примеры величин, полученных по формуле среднего арифметического. Среднее арифметическое имеет важный физический смысл: в этой точке находится «центр тяжести» всего числового набора. Поясним, что это значит. Отметим на числовой оси точки из нашего набора данных и «подвесим» в каждой из этих точек одинаковые грузики (если одно и то же число повторяется в наборе несколько раз, то подвесим в этой точке столько грузиков, сколько раз оно повторяется). Если теперь вычислить среднее арифметическое и поставить в этой точке опору (рис. 22), то вся система будет находиться в равновесии
Слайд 23
Но у среднего арифметического есть и свои недостатки. Оно чувствительно к так называемым выбросам — слишком маленьким или слишком большим значениям числового набора. Например, среднее арифметическое ряда чисел 10, 20, 20, 30, 30, 30, 30, 30, 30, 900 равно 110 (проверьте), но при этом девять из десяти чисел этого набора меньше этого среднего и только одно — больше. Этот недостаток среднего арифметического зачастую может искажать весьма важную информацию. Самый известный пример такого рода — средняя зарплата. Представим себе, что приведённые выше числа — это зарплата сотрудников какого-то предприятия (выраженная, например, в тысячах рублей). Тогда фраза директора (который получает 900 000 р.) «на нашем предприятии средняя зарплата превышает 100 000 р.» будет чистой правдой, но кому такая «правда» нужна? Ведь все его сотрудники получают зарплату, которая намного меньше 100 000 р.!
Слайд 24
Медиана. Медиана, в отличие от среднего арифметического, не чувствительна к выбросам. Если расположить все значения набора данных на числовой оси, а потом двигать крайнюю правую точку вправо, то среднее арифметическое (центр тяжести) тоже будет смещаться вправо, а вот медиана будет стоять на месте! То же самое будет, если двигать минимальное из чисел влево. Такое свойство называют устойчивостью медианы. В примере с зарплатами медиана будет равна 30 000 р., И это значение даёт гораздо более объективное представление о материальном положении сотрудников на данном предприятии. Неслучайно в современных статистических сводках и отчётах средний доход и средняя зарплата всё чаще уступают место медианным показателям. Если директору предприятия захочется сказать «на нашем предприятии медианная зарплата превышает 100 000 р.», То ему придётся повысить до этого уровня заработную плату хотя бы половины своих сотрудников. Так, может быть, медиана и есть идеальный средний показатель? К сожалению, это не так. Как часто бывает, достоинства медианы являются одновременно и её слабым местом. Обратимся к числовой оси. Если как угодно двигать точки слева от медианы, не перескакивая через неё, то она не изменится. То же самое для точек справа. Так ли это хорошо? Пока речь шла о крайних значениях, устойчивость играла положительную роль, но когда медиана не реагирует и на другие изменения, описанные выше, это становится недостатком
Слайд 25
Таким образом, каждая из трёх рассмотренных средних характеристик — мода, среднее арифметическое и медиана — имеет свои достоинства и недостатки. Зная их, можно выбрать в каждой конкретной задаче наиболее информативную или использовать несколько из них