Основные статистические характеристики данных. Основные статистические характеристики экспериментальных данных. VI. Закрепление изученного материала

Статистика - одна из древнейших отраслей прикладной математики, которая широко использует теоретическую базу многих арифметических определений для осуществления практической деятельности человека. Ещё в древних государствах возникла необходимость строгого учета дохода граждан по группам, для проведения эффективного процесса налогообложения. Статистические исследования имеют громадное значение для экономического развития общества, и не только. Поэтому, в данном видеоуроке мы рассмотрим основные определения статистических характеристик.

Предположим, нам необходимо изучить статистику выполнения тестов учениками седьмого класса. Для начала нам необходимо создать массив информации, с которым можно работать. Информацией, в данном случае, будут являться цифры, определяющие количество выполненных тестов каждым из учеников. Рассмотрим два класса, содержащие по 15 школьников каждый. Общее задание включало 10 упражнений. Результаты получились следующими:

7А: 4, 10, 6, 4, 7, 8, 2, 10, 8, 5, 7, 9, 10, 6, 3;

7Б: 7, 5, 9, 7, 8, 10, 7, 1, 7, 6, 5, 9, 8, 10, 7.

Мы получили, в математической интерпретации, два множества чисел, состоящие из 15 элементов каждое. Этот информационный массив, сам по себе, мало чем может помочь в оценивании эффективности выполнения заданий. Поэтому его нужно статистически преобразовать. Для этого введем основные понятия статистики. Ряд чисел, полученных в результате исследования, называется выборкой. Каждое число (количество выполненных упражнений) - это варианта выборки. А количество всех чисел (в данном случае, это 30 - сумма всех учеников в обоих классах) является объемом выборки.

Одной из главных статистических характеристик является среднее арифметическое. Это значение определяется как частное, полученное в результате деления суммы значений вариант выборки на её объем. В нашем случае необходимо сложить все полученные значения чисел и поделить их на 15 (если мы вычисляем среднее арифметическое для какого-либо одного класса), либо же на 30 (если мы вычисляем общее среднее арифметическое). В представляемом примере, сумма всех количеств выполненных заданий для класса 7А составит 99. Поделив на 15, получаем 6,6 - это среднее арифметическое выполненных заданий для данной группы учеников.

Работать с хаотичным набором чисел не очень удобно, поэтому очень часто информационный массив приводят к упорядоченному набору данных. Создадим вариационный ряд для 7Б класса, использовав метод постепенного возрастания, располагая числа от меньшего к большему:

1, 5, 5, 6, 7, 7, 7, 7, 7, 8, 8, 9, 9, 10, 10.

Количество появлений какого-либо одного значения в выборке данных называется частотой варианты выборки. Например, частота варианты «7» в вышеуказанном вариационном ряду легко определяется, и равна она пяти. Для удобства отображения упорядоченный ряд преобразуется в таблицу, отображающую зависимость между стандартным рядом значений вариант, и частотой встречаемости (количеством учеников, выполнивших одинаковое количество задач).

В 7А классе наименьшей вариантой выборки является значение «2», а наибольшей - «10». Интервал между 2 и 10 называется размахом вариационного ряда. Для 7Б класса размах ряда составляет от 1 до 10. Наибольшая, по частоте встречаемости, варианта называется модой выборки - для 7А это число 7, встречающееся 5 раз.


ОГЛАВЛЕНИЕ

Введение. 2

Понятие статистики. 2

История математической статистики. 3

Простейшие статистические характеристики. 5

Статистические исследования. 8

1. СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ 9

2. РАЗМАХ 10

4. МЕДИАНА 11

5. СОВМЕСТНОЕ ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК 11

Перспективы и вывод. 11

Список литературы. 12
Введение.

В октябре на перемене перед уроком наш учитель математики Марианна Рудольфовна проверяла самостоятельные работы у 7 класса. Увидев, о чем они пишут, я не поняла ни слова, но спросила у Марианны Рудольфовны, что означают незнакомые мне слова – размах, мода, медиана, среднее. Получив ответ, я ничего не поняла. Под конец 2 четверти Марианна Рудольфовна предложила кому-нибудь из нашего класса сделать реферат на эту самую тему. Мне показалась эта работа очень интересной, и я согласилась.

В ходе работы рассматривались такие вопросы

Что такое математическая статистика?

В чем значение статистики для обычного человека?

Где применяются полученные знания?

Почему человек не может обойтись без математической статистики?

Понятие статистики.

СТАТИСТИКА – это наука, которая занимается получением, обработкой и анализом количественных данных о разнообразных явлениях, происходящих в природе и обществе.

В средствах массовой информации часто встречаются такие фразы, как статистика аварий, статистика народонаселения, статистика заболеваний, статистика разводов и др.

Одна из основных задач статистики состоит в надлежащей обработке информации. Конечно, у статистики есть много других задач: получение и хранение информации, выработка различных прогнозов, оценка их достоверности и т. д. Ни одна из этих целей не достижима без обработки данных. Поэтому, первое, чем стоит заняться - это статистическими методами обработки информации. Для этого есть много терминов, принятых в статистике.

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА - раздел математики, посвященный методам и правилам обработки и анализа статистических данных

История математической статистики.

Математическая статистика как наука начинается с работ знаменитого немецкого математика Карла Фридриха Гаусса (1777-1855), который на основе теории вероятностей исследовал и обосновал метод наименьших квадратов, созданный им в 1795 г. и примененный для обработки астрономических данных (с целью уточнения орбиты малой планеты Церера). Его именем часто называют одно из наиболее популярных распределений вероятностей – нормальное, а в теории случайных процессов основной объект изучения – гауссовские процессы.

В конце XIX в. – начале ХХ в. крупный вклад в математическую статистику внесли английские исследователи, прежде всего К.Пирсон (1857-1936) и Р.А.Фишер (1890-1962). В частности, Пирсон разработал критерий «хи-квадрат» проверки статистических гипотез, а Фишер – дисперсионный анализ, теорию планирования эксперимента, метод максимального правдоподобия оценки параметров.

В 30-е годы ХХ века поляк Ежи Нейман (1894-1977) и англичанин Э.Пирсон развили общую теорию проверки статистических гипотез,

а советские математики академик А.Н. Колмогоров (1903-1987) и член-корреспондент АН СССР Н.В.Смирнов (1900-1966) заложили основы непараметрической статистики.

В сороковые годы ХХ в. румынский математик А. Вальд (1902-1950) построил теорию последовательного статистического анализа.

Математическая статистика бурно развивается и в настоящее время.

^ Простейшие статистические характеристики.

В повседневной жизни мы, не догадываясь, используем такие понятия как медиана, мода, размах и среднее арифметическое. Даже когда мы ходим в магазин или делаем уборку.

^ Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на их количество. Среднее арифметическое является важной характеристикой ряда чисел, но иногда полезно рассматривать и другие средние.

Модой называют число ряда, которое встречается в этом ряду наиболее часто. Можно сказать, что данное число самое «модное» в этом ряду. Такой показатель, как мода, используется не только для числовых данных. Если, например, опросить большую группу учеников, какой школьный предмет им нравится больше всего, то модой этого ряда ответов окажется тот предмет, который будут называть чаще остальных.

Мода – показатель, который широко используется в статистике. Одним из наиболее частых использований моды является изучение спроса. Например, при решении вопросов, в пачки какого веса фасовать масло, какие открывать авиарейсы и т. п., предварительно изучается спрос и выявляется мода - наиболее часто встречающийся заказ.

Заметим, что в рядах, рассматриваемых в реальных статистических исследованиях, иногда выделяют больше одной моды. Когда в ряду много данных, то интересными бывают все те значения, которые встречаются гораздо чаще других. Их статистики тоже называют модой.

Однако нахождение среднего арифметического или моды далеко не всегда позволяет делать надежные выводы на основе статистических данных. Если есть ряд данных, то, помимо средних значений, надо еще указать, насколько используемые данные различаются между собой.

Одним из статистических показателей различия или разброса данных является размах.

Размах - это разность между наибольшим и наименьшим значениями ряда данных.

Еще одной важной статистической характеристикой ряда данных является его медиана. Обычно медиану ищут в случае, когда числа в ряду являются какими-либо показателями и надо найти, например, человека, показавшего средний результат, фирму со средней годовой прибылью, авиакомпанию, предлагающую средние цены на билеты, и т. д.

Медианой ряда, состоящего из нечетного количества чисел, называется число данного ряда, которое окажется посередине, если этот ряд упорядочить. Медианой ряда, состоящего из четного количества чисел, называется среднее арифметическое двух стоящих посередине чисел этого ряда.

Например:

1. В школах г. Перми каждый год проходит ЕРТ за 4 класс и в 2010 году были получены следующие средние баллы:

Математика

Русский язык

Гимназия № 4

Моя мама работает на пермском пороховом заводе бухгалтером. Зарплата сотрудников этого предприятия колеблется в размерах от 12000 до18000. разность составляет 6000. Это называется размах

Несколько лет назад мы с родителями отдыхали на юге в Анапе. Я обратила внимание, что на номерах машин чаще всего встречается №23 – номер региона. Это называется мода.

На выполнение домашнего задания я тратила в течение недели такое время – 60 мин в понедельник, во вторник 103 мин, в среду 58, в четверг 76 , а в пятницу 89 мин. Записав эти числа от меньшего к большему, посередине стоит число 76 – это называется медиана.

Статистические исследования.

«Статистика знает всё»,- утверждали Ильф и Петров в своем знаменитом романе «Двенадцать стульев» и продолжали: «Известно, сколько какой пищи съедает в год средний гражданин республики... Известно, сколько в стране охотников, балерин... станков, велосипедов, памятников, маяков и швейных машинок... Как много жизни, полной пыла, страстей и мысли, глядит на нас со статистических таблиц!..» Зачем нужны эти таблицы, как их составлять и обрабатывать, какие выводы на их основании можно делать – на эти вопросы отвечает статистика (от итальянского stato – государство, латинского status – состояние).

^ 1. СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ
Я вычислила средние затраты на электроэнергию в нашей семье в течение 2010 года:

Расход, кВт/ч

(189 + 155*2 + 106*2 + 102 + 112*2 + 138 + 160 + 156 + 149) : 12 = 136 – среднее арифметическое

^ Когда нужно и не нужно среднее арифметическое?

Имеет смысл вычислять средние траты в семье на продукты, среднюю урожайность картофеля на огороде, средние расходы на продукты, чтобы понять, как поступать в следующий раз, чтобы не было большого перерасхода, среднюю оценку за четверть – по ней поставят оценку за четверть.

Нет смысла вычислять среднюю зарплату моей мамы и Абрамовича, среднюю температуру здорового и больного человека, средний размер обуви у меня и у моего брата.
2. РАЗМАХ
Рост девочек нашего класса самый разный:

151 см, 160 см, 163 см, 162 см, 145 см, 130 см, 131 см, 161 см

Размах составляет 163 – 130 = 33 см. Размах определяет разницу в росте.

^ Когда нужен и не нужен размах?

Размах ряда находят тогда, когда хотят определить, как велик разброс данных в ряду. Например, в течение суток отмечали каждый час температуру воздуха в городе. Для полученного ряда данных полезно не только вычислять среднее арифметическое, показывающее, какова среднесуточная температура, но и найти размах ряда, характеризующий колебание температуры воздуха в течение этих суток. Для температуры на Меркурии, например, размах равен 350 + 150=500 С. Конечно, такого перепада температур человек выдержать не может.

3. МОДА
Я выписала свои оценки за декабрь по математике:

4,5,5,4,4,4,4,5,5,4,5,5,4,5,5,5,5,5,5. Оказалось, что я получила:

«5» - 7, «4» - 5, «3» - 0, «2» - 0

Мода равна 5.

Но мода бывает не одна, например, по природоведению в октябре у меня были такие оценки – 4,4,5,4,4,3,5,5,5. Мод здесь две – 4 и 5

Когда нужна мода?

Мода важна для производителей при определении самого популярного размера одежды, обуви, размеров бутылки сока, пачки чипсов, популярного фасона одежды

4. МЕДИАНА
При анализе результатов, показанных участниками забега учеников класса на 100 метров знание медианы позволяет учителю физкультуры выделить для участия в соревнованиях группу ребят, показавших результат выше срединного.

^ Когда нужна и не нужна медиана?

Медиана чаще применяется с другими статистическими характеристиками, но по неё одной можно отбирать результаты, выше или ниже медианы

^ 5. СОВМЕСТНОЕ ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК
В нашем классе за последнюю проверочную работу по математике по теме «Измерение углов и их виды» были получены следующие оценки: «5» - 10, «4» - 5, «3» - 7, «2» - 1.

Среднее арифметическое - 4.3, размах - 3, мода - 5, медиана – 4.

^ Перспективы и вывод.

Статистические характеристики позволяют изучать числовые ряды. Только все вместе они могут дать объективную оценку ситуации

Нельзя правильно организовывать нашу жизнь, не зная законов математики. Она позволяет изучать, узнавать, исправлять.

Статистика создает фундамент точных и бесспорных фактов, который необходим для теоретических и практических целей.

Математики изобрели статистику потому, что она была нужна обществу

Думаю, что знания, полученные при работе над данной темой, пригодятся мне в дальнейшей учебе и в жизни.

Изучая литературу, я узнала, что есть еще такие характеристики, как среднее квадратичное отклонение, дисперсия и другие.

Однако моих знаний недостаточно, чтобы в них разобраться. О них – в будущем.

^ Список литературы.
Учебное пособие для учащихся 7-9 классов общеобразовательных учреждений «Алгебра. Элементы статистики и теории вероятностей». Ю.Н.Макарычев, Н.Г.Миндюк, под редакцией С.А.Теляковского; Москва. Просвещение. 2005 г.

Статьи из приложения к газете «Первое сентября. Математика».

Энциклопедический СЛОВАРЬ ЮНОГО МАТЕМАТИКА

http://statist.my1.ru/

http://art.ioso.ru/seminar/2009/projects11/rezim/stat1.html

Класс: 7

Презентация к уроку

















Назад Вперёд

Внимание! Предварительный просмотр слайдов используется исключительно в ознакомительных целях и может не давать представления о всех возможностях презентации. Если вас заинтересовала данная работа, пожалуйста, загрузите полную версию.

Цели:

  • познакомить с основными статистическими характеристиками (средним арифметическим, размахом, модой ряда);
  • учить находить среднее арифметическое, размах, моду ряда;
  • способствовать развитию внимания, логического мышления, наблюдательности учащихся;
  • способствовать формированию экономически осознанного отношения к окружающему миру.

Материальное обеспечение:
мультимедийный проектор, карточки для проведения самостоятельной работы.
ХОД УРОКА
1. Домашнее задание: п.9, №№ 168, 172, 178 (учебник «Алгебра. 7класс» под редакцией С. А. Теляковского, Москва «Просвещение», 2009 год)

2. Сообщение темы урока.

2.1. Разгадывание кроссворда:

  1. Результат действия сложения (сумма) .
  2. Равенство, верное при любых значениях переменной (тождество) .
  3. Координата точки по оси Ох (абсцисса) .
  4. Утверждение, требующее доказательства (теорема) .
  5. Неизвестный элемент, который требуется найти (искомое) .
  6. Компонент действия сложения (слагаемое) .
  7. Простейшая геометрическая фигура (точка) .
  8. Компьютер – это инструмент для хранения, обработки и передачи … (информации) .
  9. Прямоугольный параллелепипед, у которого все измерения равны (куб) .
  10. Установленный порядок действий (алгоритм) .

2.2. – Прочитайте слово, образованное первыми буквами разгаданных слов. (Статистика)

– Как вы думаете, чем занимается статистика?
Статистика – это наука, которая занимается получением, обработкой и анализом количественных данных о разнообразных явлениях, происходящих в природе и обществе. (Слайд 2)
Экономическая статистика изучает изменение цен, спроса и предложения на товары, прогнозирует спрос и падение производства и потребления.
Медицинская статистика изучает эффективность различных лекарств и методов лечения, вероятность возникновения некоторого заболевания в зависимости от возраста, пола, наследственности, условий жизни, вредных привычек, прогнозирует распространение эпидемий.
Демографическая статистика изучает рождаемость, численность населения, его состав (возрастной, национальный, профессиональный).
А ещё есть статистика финансовая, налоговая, биологическая, метеорологическая и т.д.
Для обработки информации существуют определённые методы. (Слайд 3)
Раздел математики, посвящённый методам и правилам обработки и анализа статистических данных, называется математической статистикой. (Слайд 4)

2.3. Сообщение темы урока.

– Сегодня мы будем знакомиться с некоторыми статистическими характеристиками, будем учиться их определять. (Слайд 5).

3. Изучение нового материала.

3.1. – Рассмотрим данные о производстве пшеницы в России в период с 1995 года по 2001 год. (Слайд 6)

1995 г. – 30,1 млн. тонн;
1996 г. – 34,9 млн. тонн;
1997 г. – 44,3 млн. тонн;
1998 г. – 27 млн. тонн;
1999 г. – 31 млн. тонн;
2000 г. – 34,5 млн. тонн;
2001 г. – 47 млн. тонн.

– Как видим, производство пшеницы в разные годы различается. Как вы думаете, почему?
– Да, оно зависит от погодных условий, площади посева, качества семян и других обстоятельств. Поэтому производство пшеницы за 1 год не даёт полного представления об уровне производства пшеницы в стране. Для этой цели лучше использовать среднее значение за ряд лет. По данным таблицы мы можем вычислить среднее производство пшеницы за 7 лет. Как это можно сделать?
(30,1 + 34,9 + 44,3 + 27 + 31 + 34,5 + 47) : 7 = 35,5 (Слайд 7)
– Что мы нашли? (Среднее арифметическое)
– Среднее арифметическое является одной из статистической характеристик ряда чисел. Запишите определение этого понятия в тетрадь. (Слайд 8)
Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на их количество.
– В каком году производство пшеницы было ближе всего к среднему значению? (в 1996 году)

3.2. Выполните задания (слайд 9) :

1) Вычислите среднее арифметическое чисел 6, 10, 16 и 20. (6 + 10 + 16 + 20) : 4 = 52: 4 = 13
2) Все числа равны между собой. Чему рано их среднее арифметическое? (Самому этому числу.)
3) Может ли среднее арифметическое не совпадать ни с одним из чисел данного ряда? (Да)
4) Придумайте три числа, среднее арифметическое которых совпадает со вторым по величине числом.

3.3. В одном из седьмых классов измерили рост мальчиков. Получили такие данные:
155 см, 167 см, 159 см, 168 см, 161 см, 170 см, 162 см, 153 см, 165 см. (Слайд 10) Найдите среднее арифметическое этого ряда чисел.
(155 + 167 + 159 + 168 + 161 + 170 + 162 + 153 + 165) : 9 = 1460: 9 = 162,(2) = 162
– Какой рост имеет самый высокий мальчик из этого класса? (170 см)
– Самый низкий мальчик? (153 см)
– Найдите разницу в росте ребят?
170 – 153 = 17 (см)
Разность между наибольшим и наименьшим значениями ряда данных называется размахом ряда и также является одной из статистических характеристик. (Слайд 11)
– Запишите определение в тетрадь.

3.4. Петя и Вася поспорили, кто лучше прыгает в длину с места. Чтобы избежать случайности, они решили, что будут прыгать по очереди 5 раз. (Слайд 12) Результаты своих прыжков они записали в таблицу (слайд 13) :

Номер прыжка

– Какую статистическую характеристику каждого ряда надо определить, чтобы выяснить, кто из ребят прыгает дальше? (Среднее арифметическое)
– Выясните это.

Петя: (190 + 205 + 195 + 210 + 210) : 5 = (190 + 400 + 420) : 5 = 1010: 5 = 202 (см)
Вася: (185 + 200 + 215 + 190 + 190) : 5 = (600 + 380) : 5 = 980: 5 = 196 (см)

Вывод: Петя прыгает дальше, чем Вася.
– Найдите по данной таблице разность между лучшим и худшим результатом каждого мальчика (размах ряда).
Петя: 210 – 190 = 20 (см); Вася: 215 – 185 = 30 (см)
– Можно ли утверждать, что Петя прыгает стабильнее? (Да)

3.5. В одном из седьмых классов решили выяснить, обувь какого размера носят девочки этого класса. (Слайд 14) Получили такие результаты:

35, 39, 37, 36, 38, 37, 38, 36, 37, 37, 38, 37, 37.

– Какой размер обуви встречается чаще всего? (37)
Число ряда, которое встречается в данном ряду наиболее часто, называется модой ряда . (Слайд 15)
– Запишите это определение в тетрадь.

3.6. (Слайд 16)

1) Любой ли ряд чисел имеет моду? (Нет)
2) Может ли ряд чисел иметь более одной моды? (Да)
3) Может ли мода ряда чисел не совпадать ни с одним из этих чисел? (Нет)

3.7. (Слайд 17)

Дан числовой ряд: 7, 8, 9, 7, 7, 6, 7, 6, 9, 7. Найдите среднее арифметическое, моду и размах этого ряда.
Среднее арифметическое: (7 + 8 + 9 + 7 + 7 + 6 + 7 + 6 + 9 + 7) : 10 = 73: 10 = 7,3.
Мода: 7.
Размах: 9 – 6 = 3.

4. Самостоятельная работа

Вариант 1.

  1. Найдите среднее арифметическое ряда чисел: 18, 11, 20, 19, 2, 10.
  2. Определите моду ряда чисел: 12, 13, 13, 15, 19, 13, 12, 14, 12, 14, 13.
  3. Вычислите размах ряда чисел: 31, 14, 25, 18, 29, 11, 16.
  4. Найдите среднее арифметическое, размах и моду ряда чисел: 21, 21, 21, 21, 21, 21, 21.
  5. В течение четверти Лена получила по алгебре такие оценки: три двойки, две тройки, четыре четвёрки и одну пятёрку. Какую статистическую характеристику Лена предпочла бы при выставлении четвертной оценки: среднее арифметическое, размах или моду ряда?

Вариант 2.

  1. Найдите среднее арифметическое ряда чисел: 21, 5, 18, 19, 15, 12.
  2. Определите моду ряда чисел: 18, 17, 17, 15, 11, 17, 18, 16, 18, 16, 17.
  3. Вычислите размах ряда чисел: 29, 16, 25, 12, 19, 11, 14.
  4. Найдите среднее арифметическое, размах и моду ряда чисел: 15, 15, 15, 15, 15, 15, 15.
  5. В течение четверти Лена получила по алгебре такие оценки: две двойки, три тройки, шесть четвёрок и две пятёрки. Какую статистическую характеристику Лена предпочла бы при выставлении четвертной оценки: среднее арифметическое, размах или моду ряда?

5. Подведение итогов урока. (Слайд 18)

1) С какими статистическими характеристиками мы познакомились на уроке?
2) Как найти среднее арифметическое ряда чисел?
3) Как находится размах ряда чисел?
4) Что показывает мода ряда чисел?

Использованная литература:

  1. Учебник «Алгебра. 7класс» под редакцией С. А. Теляковского, Москва «Просвещение», 2009 год;
  2. Ю. Н. Тюрин, А. А. Макаров, И. Р. Высоцкий, И. В. Ященко «Теория вероятностей и статистика», МЦНМО АО «Московские учебники», Москва, 2004 год;
  3. Г. Н. Иванова , www.openklass.ru ;
  4. «Математическая статистика»; kl10sch55.narod.ru;
  5. s21.my1.ru/metodi/tema uroka stat kharak 7 klass.doc

Предварительная информация по МЕТОДАМ ОБРАБОТКИ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА

ПОДГОТОВКА ПЕРВИЧНЫХ ДАННЫХ К АНАЛИЗУ

Наблюдая и измеряя характеристики объекта, экспериментатор собирает первичный статистический материал. Дальнейшая задача состоит в такой обработке и представлении первичных данных, которые позволили бы оценить и сопоставить результаты для проверки гипотез, для выявления существенных свойств и закономерностей изучаемого процесса. В основе методов обработки лежит предварительное упорядочение, cиcтeмaтизaция первичных данных и вычисление их статистических характеристик.

Обобщенный алгоритм подготовки данных может быть представлен следующим операциями:
а) все данные формулируются и записываются в необходимой краткой форме;
б) проводится группировка данных, то есть распределение их на однородные группы в соответствии с интересующими экспериментатора признаками. Данные в каждой группе упорядочиваются - классифицируются, сортируются, структурируются в соответствии с той моделью, которая разрабатывалась при составлении плана-программы устанавливаются характеристики (признаки, параметры каждой группы данных и производится подсчет абсолютного числа факторов, характеризующих группуг) данные внутри каждой сформированной группы располагаются в ряд (вариационный ряд) по убыванию или возрастанию признака. Определяется наибольшее и наименьшее значения признака;
д) вариационные ряды данных, полученных в номинальной или порядковой шкале, ранжируются. Интервалы группировки по рангам выбираются оптимальными (слишком крупные интервалы скрывают нюансы явлений, слишком дробные - затрудняют o6pаботку). В результате этой операции появляются новые количественные данные;
е) проводится статистическая обработка полученных количественных данных, заключающаяся в вычислении некоторых статистических характероистик и оценок, позволяющих глубже понять особенности экспериментальных явлений;
ж) составляются наглядные материалы, отображающие полученную информацию: таблицы, графики, диаграммы, схемы и др., по которым в дальнейшем устанавливаются и анализируются связи между параметрами экспериментальных объектов.

СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ

Экспериментатору необходимо знание ряда простейших понятий математической статистики и умение с ними работать.
Все множество интересующих исследователя однородных явлений, событий или их показателей называется генеральной совокупностью данных объектов. Та часть последней, которая подвергается экспериментальному изучению, называется выборочными совокупностью или выборкой.
Величина (объем) выборки представляет собой абсолютное (счетное) количество однородных объектов исследования (явлений, событий или их характеристик).
Выборка характеризуется рядом статистических характеристик, наиболее употребительными из которых являются: среднее арифметическое значение, дисперсия, среднее квадратичное отклонение среднего арифметического.

Среднее значение данного показателя выборочной совокупности (арифметическое среднее, выборочное среднее ) - это отношение суммы всех измеренных значений показателя к величине выборки.

Если в выборке есть повторяющиеся значения, то составляется таблица сгруппированных данных, следующего вида:

Тогда = , где n= .

Среднее значение недостаточно полно характеризует выборку; за ним скрывается “поведение” самого показателя явления-“разброс”, различное распределение его значений около среднего (так называемая “функция распределения”).

Выборочной дисперсией (s 2) статистического показателя называется среднее значение квадратов отклонений отдельных его значений от среднего выборочного; дисперсия определяется по формуле:

S 2 = (2)

Для сгруппированных данных S 2 = .

Выборочнымсредним квадратическим отклонением называется корень квадратный из выборочной дисперсии.

Выборочные дисперсия и среднее квадратичное отклонение играют большую роль при определении степени достоверности результатов.
Генеральная совокупность также обладает всеми вышеперечисленными статистическими характеристиками, которые в общем случае не совпадают с характеристиками выборки. Для эксперимента особое значение, имеет оценка той ошибки, которая допускается, если по выборочным характеристикам судить о генеральной совокупности.
В практике вычислений величина расхождения средних значений генеральной и выборочной совокупностей определяется средней квадратической ошибкой выборочного среднего, которая вычисляется по формуле

Мода - это наиболее часто встречающеесязначение в выборке. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей. Модой для дискретного ряда является значение, обладающая наибольшей частотой.

Медиана - это значение признака, которое лежит в основе ранжированного ряда и делит этот ряд на две равные по численности части.

Для определения медианы в дискретном ряду при наличии частот сначала вычисляют полусумму частот , а затем определяют, какое значение признака приходится на нее. (Если отсортированный ряд содержит нечетное число признаков, то значение среднего в упорядоченном ряду будет медианой, порядковый номер медианы вычисляют по формуле:

(n + 1)/2,

в случае четного числа признаков медиана будет равна среднему арифметическому из двух признаков находящихся в середине ряда.

Цель работы: научиться обрабатывать статистические данные в электронных таблицах с помощью встроенных функций; изучить возможности Пакета анализа в MS Excel 2010 и его некоторые инструменты: Генерация случайных чисел, Гистограмма, Описательная статистика.

Теоретическая часть

Очень часто для обработки данных, полученных в результате обследования большого числа объектов или явлений (статистических данных ), используются методы математической статистики.

Современная математическая статистика подразделяется на две обширные области: описательную и аналитическую статистику . Описательная статистика охватывает методы описания статистических данных, представления их в форме таблиц, распределений и пр.

Аналитическая статистика называется также теорией статистических выводов. Ее предметом является обработка данных, полученных в ходе эксперимента, и формулировка выводов, имеющих прикладное значение для самых различных областей человеческой деятельности

Полученный в результате обследования набор чисел называетсястатистической совокупностью.

Выборочной совокупностью (или выборкой ) называется совокупность случайно отобранных объектов. Генеральной совокупностью называется совокупность объектов, из которой производится выборка. Объемом совокупности (генеральной или выборочной) называется число объектов этой совокупности.

Для статистической обработки результаты исследования объектов представляют в виде чисел x 1 , x 2 , …, x k . Если значение x 1 наблюдалось n 1 раз, значение x 2 наблюдалось n 2 раз, и т.д., то наблюдаемые значения x i называются вариантами , а числа их повторений n i называются частотами . Процедура подсчета частот называется группировкой данных.

Объем выборки n равен сумме всех частот n i :

Относительной частотой значения x i называется отношение частоты этого значения n i к объему выборки n :

. (2)

Статистическим распределением частот (или просто распределением частот ) называется перечень вариант и соответствующих им частот, записанных в виде таблицы:

Распределением относительных частот называется перечень вариант и соответствующих им относительных частот.

1. Основные статистические характеристики.

Современные электронные таблицы имеют огромный набор средств для анализа статистических данных. Наиболее часто используемые статистические функции встраиваются в основное ядро программы, то есть эти функции доступны с момента запуска программы. Другие более специализированные функции входят в дополнительные подпрограммы. В частности, в Excel, такая подпрограмма называется Пакетом анализа. Команды и функции пакета анализа называют Инструментами анализа. Мы ограничимся изучением нескольких основных встроенных статистических функций и наиболее полезных инструментов анализа из пакета анализа в электронной таблице Excel.

Среднее значение.

Функция СРЗНАЧ вычисляет выборочное (или генеральное) среднее, то есть среднее арифметическое значение признака выборочной (или генеральной) совокупности. Аргументом функции СРЗНАЧ является набор чисел, как правило, задаваемый в виде интервала ячеек, например, =СРЗНАЧ (А3:А201).

Дисперсия и среднее квадратическое отклонение.

Для оценки разброса данных используются такие статистические характеристики, как дисперсия D и среднее квадратическое (или стандартное) отклонение . Стандартное отклонение есть квадратный корень из дисперсии:
. Большое стандартное отклонение указывает на то, что значения измерения сильно разбросаны относительно среднего, а малое – на то, что значения сосредоточены около среднего.

В Excel имеются функции, отдельно вычисляющие выборочную дисперсиюD в и стандартное отклонение в и генеральные дисперсиюD г и стандартное отклонение г. Поэтому, прежде чем вычислять дисперсию и стандартное отклонение, следует четко определиться, являются ли ваши данные генеральной совокупностью или выборочной. В зависимости от этого нужно использовать для расчетаD г и г,D в и в .

Для вычисления выборочной дисперсии D в и выборочного стандартного отклонения в имеются функции ДИСП) и СТАНДОТКЛОН. Аргументом этих функций является набор чисел, как правило, заданный диапазоном ячеек, например, =ДИСП (В1:В48).

Для вычисления генеральной дисперсии D г и генерального стандартного отклонения г имеются функции ДИСПР и СТАНДОТКЛОНП, соответственно.

Аргументы этих функций такие же как и для выборочной дисперсии.

Объем совокупности.

Объем совокупности выборочной или генеральной – это число элементов совокупности. Функция СЧЕТ определяет количество ячеек в заданном диапазоне, которые содержат числовые данные. Пустые ячейки или ячейки, содержащие текст, функция СЧЕТ пропускает. Аргументом функции СЧЕТ является интервал ячеек, например: =СЧЕТ (С2:С16).

Для определения количества непустых ячеек, независимо от их содержимого, используется функция СЧЕТ3. Ее аргументом является интервал ячеек.

Мода и медиана.

Мода – это значение признака, которое чаще других встречается в совокупности данных. Она вычисляется функцией МОДА. Ее аргументом является интервал ячеек с данными.

Медиана – это значение признака, которое разделяет совокупность на две равные по числу элементов части. Она вычисляется функцией МЕДИАНА. Ее аргументом является интервал ячеек.

Размах варьирования. Наибольшее и наименьшее значения.

Размах варьирования R – это разность между наибольшимx max и наименьшим x min значениями признака совокупности (генеральной или выборочной):R =x max –x min . Для нахождения наибольшего значенияx max имеется функция МАКС (или MAX), а для наименьшегоx min – функция МИН (или MIN). Их аргументом является интервал ячеек. Для того, чтобы вычислить размах варьирования данных в интервале ячеек, например, от А1 до А100, следует ввести формулу: =МАКС (А1:А100)-МИН (А1:А100).

Отклонение случайного распределения от нормального.

Нормально распределенные случайные величины широко распространены на практике, например, результаты измерения любой физической величины подчиняются нормальному закону распределения. Нормальным называется распределение вероятностей непрерывной случайной величины, которое описывается плотностью

,

где
дисперсия, - среднее значение случайной величины .

Для оценки отклонения распределения данных эксперимента от нормального распределения используются такие характеристики как асимметрия А и эксцессЕ . Для нормального распределенияА =0 иЕ =0.

Асимметрия показывает, на сколько распределение данных несимметрично относительно нормального распределения: если А >0, то большая часть данных имеет значения, превышающие среднее ; еслиА <0, то большая часть данных имеет значения, меньшие среднего . Асимметрия вычисляется функцией СКОС. Ее аргументом является интервал ячеек с данными, например, =СКОС (А1:А100).

Эксцесс оценивает «крутость», т.е. величину большего или меньшего подъема максимума распределения экспериментальных данных по сравнению с максимумом нормального распределения. Если Е >0, то максимум экспериментального распределения выше нормального; еслиЕ <0, то максимум экспериментального распределения ниже нормального. Эксцесс вычисляется функцией ЭКСЦЕСС, аргументом которой являются числовые данные, заданные, как правило, в виде интервала ячеек, например: =ЭКСЦЕСС (А1:А100).

Задание 1. Применение статистических функций

Одним и тем же вольтметром было измерено 25 раз напряжение на участке цепи. В результате опытов получены следующие значения напряжения в вольтах: 32, 32, 35, 37, 35, 38, 32, 33, 34, 37, 32, 32, 35, 34, 32, 34, 35, 39, 34, 38, 36, 30, 37, 28, 30.Найдите выборочные среднюю, дисперсию, стандартное отклонение, размах варьирования, моду, медиану. Проверить отклонение от нормального распределения, вычислив асимметрию и эксцесс.

    Наберите результаты эксперимента в столбец А.

    В ячейку В1 наберите «Среднее», в В2 – «выборочная дисперсия», в В3 – «стандартное отклонение», в В4 – «Максимум», в В5 – «Минимум», в В6 – « Размах варьирования», в В7 – «Мода», в В8 – «Медиана», в В9 – «Асимметрия», в В10 – «Эксцесс». Выровняйте ширину этого столбца с помощью Автоподбора ширины.

    Выделите ячейку С1 и нажмите на знак «=» в строке формул. С помощью Мастера функций в категорииСтатистические найдите функцию СРЗНАЧ, затем выделите интервал ячеек с данными и нажмитеEnter .

    Выделите ячейку С2 и нажмите на знак «=» в строке формул. С помощью помощью Мастера функций в категорииСтатистические найдите функцию ДИСП, затем выделите интервал ячеек с данными и нажмитеEnter .

    Проделайте самостоятельно аналогичные действия для вычисления стандартного отклонения, максимума, минимума, моды, медианы, асимметрии и эксцесса.

    Для вычисления размаха варьирования в ячейку С6 следует ввести формулу: =МАКС (А1:А25)-МИН(А1:А25).