Статистическое изучение вариационных рядов и расчет средних величин. Структурные средние: мода и медиана

В прошлом уроке, и поняли, что она знает многое, кто не понял, забыл или прошел мимо, может перейти по ссылке и освежить свои знания)). Но в теории статистики есть еще одно очень интересное изречение. В мире есть три вида лжи – ложь, наглая ложь и… СТАТИСТИКА!!!

Совершенно противоречивое утверждение другое – статистика знает все . Но отчасти в нем есть доля правды. Все дело в данных, которые были собраны для обработки.

Но об этом поговорим позже…

Однако вернемся к статистическим категориям. Категории или основные статистические термины важная часть науки. И дело здесь в том, что эти термины регулярно употребляются в процессе обработки и анализа данных. Именно в этом кроется их такая важность для статистической науки.

Статистическая совокупность – это группа социально-экономических объектов или явлений общественной жизни объединенных общей связью, но отличающихся друг от друга отдельными признаками. Это наиболее часто встречающее определение совокупности. Включает в себя ее особенности, и что очень важно и другие статистические категории. Попытаемся упростить или понять, что же такое совокупность на примере.
Совокупность это некоторое объединение элементов или явлений или людей и т.п. Мало того что в совокупности как правило много частей или элементом (всегда больше одного), так еще все они в чем-то похожи. Так вот эта похожесть и есть признак, по которому объединили эти элементы. Общее у элементов одно, и масса других характеристик отличающихся.



Вот небольшой такой пример. На картинке у нас изображены условно люди. Это совокупность людей – по этому признаку их и объединили в совокупность. Однако все мы разные и у нас масса признаков, которые отличают нас друг от друга – пол, возраст, образование, семейное положение, уровень доходов, место жительства и так далее.
Вообще в совокупность можно объединить разные элементы, лишь бы было что изучать:
— совокупность школьников – общее учатся в школе, а различия пол, возраст, класс, место учебы и многое другое;
— совокупность деревьев в лесу – общее это деревья, различия возраст, разновидность дерева, высота и т.п.;
— совокупность предприятий – общее предприятия, различия, отрасль, число работников, объем выпуска, объем прибыли и др.
И таких примеров можно привести огромное количество.

Задание. Предположим на картинке представлена совокупность студентов. Опишите ее, почему она является совокупностью, какие есть признаки у студентов. Нет ли на картинке лишних элементов, не относящихся к данной совокупности?

И последний очень важный термин вариация!
Вариация – это колебания признака статистической совокупности. В статистике говорят – признак колеблется или ВАРЬИРУЕТСЯ.
Вариация признака это основа статистической науке. Не было бы вариации, не было бы статистики. Именно потому что признаки изменяются и происходит их изучении. Если не было бы изменений и отличий и все было одинаковым, то изучать было бы нечего и статистики не было.

А дальше мы перейдем к . Но прежде домашние задания.

Контрольное задание. Приведите примеры двух трех совокупностей, выделите в них единицы совокупности и охарактеризуйте их признаками. Приведите пример статистических показателей и вариации признака.

Доклад – Органы государственной статистики в РФ – функции, задачи, структура. – Федеральная служба государственной статистики — http://www.gks.ru/

Понятие вариационного ряда. Первым шагом систематизации материалов статистического наблюдения является подсчет числа единиц, обладающих тем или иным признаком. Расположив единицы в порядке возрастания или убывания их количественного признака и подсчитав число единиц с конкретным значением признака, получаем вариационный ряд. Вариационный ряд характеризует распределение единиц определенной статистической совокупности по какому–либо количественному признаку.

Вариационный ряд представляет собой две колонки, в левой колонке приводятся значения варьирующего признака, именуемые вариантами и обозначаемые (x), а в правой – абсолютные числа, показывающие, сколько раз встречается каждый вариант. Показатели этой колонки называются частотами и обозначаются (f).

Схематично вариационный ряд можно представить в виде табл.5.1:

Таблица 5.1

Вид вариационного ряда

Варианты (x)

Частоты (f)

В правой колонке могут использоваться и относительные показатели, характеризующие долю частоты отдельных вариантов в общей сумме частот. Эти относительные показатели именуют частостями и условно обозначают через , т.е. . Сумма всех частостей равна единице. Частости могут быть выражены и в процентах, и тогда их сумма будет равна 100%.

Варьирующие признаки могут носить разный характер. Варианты одних признаков выражаются в целых числах, например, число комнат в квартире, число изданных книг и т.д. Эти признаки именуют прерывными, или дискретными. Варианты других признаков могут принимать любые значения в определенных пределах, как, например, выполнение плановых заданий, заработная плата и др. Эти признаки называют непрерывными.

Дискретный вариационный ряд. Если варианты вариационного ряда выражены в виде дискретных величин, то такой вариационный ряд называют дискретным, его внешний вид представлен в табл. 5.2:

Таблица 5.2

Распределение студентов по оценкам, полученным на экзамене

Оценки (х)

Количество студентов (f)

В % к итогу ()

Характер распределения в дискретных рядах изображается графически в виде полигона распределения, рис.5.1.

Рис. 5.1. Распределение студентов по оценкам, полученным на экзамене.

Интервальный вариационный ряд. Для непрерывных признаков вариационные ряды строятся интервальные, т.е. значения признака в них выражаются в виде интервалов «от и до». При этом минимальное значение признака в таком интервале именуют нижней границей интервала, а максимальное – верхней границей интервала.

Интервальные вариационные ряды строят как для прерывных признаков (дискретных), так и для варьирующих в большом диапазоне. Интервальные ряды могут быть с равными и неравными интервалами. В экономической практике в большинстве своем применяются неравные интервалы, прогрессивно возрастающие или убывающие. Такая необходимость возникает особенно в тех случаях, когда колеблемость признака осуществляется неравномерно и в больших пределах.

Рассмотрим вид интервального ряда с равными интервалами, табл. 5.3:

Таблица 5.3

Распределение рабочих по выработке

Выработка, т.р. (х)

Число рабочих (f)

Кумулятивная частота (f´)

Интервальный ряд распределения графически изображается в виде гистограммы, рис.5.2.

Рис.5.2. Распределение рабочих по выработке

Накопленная (кумулятивная) частота. В практике возникает потребность в преобразовании рядов распределения в кумулятивные ряды, строящиеся по накопленным частотам. С их помощью можно определить структурные средние, которые облегчают анализ данных ряда распределения.

Накопленные частоты определяются путем последовательного прибавления к частотам (или частостям) первой группы этих показателей последующих групп ряда распределения. Для иллюстрации рядов распределения используются кумуляты и огивы. Для их построения на оси абсцисс отмечаются значения дискретного признака (или концы интервалов), а на оси ординат – нарастающие итоги частот (кумулята), рис.5.3.

Рис. 5.3. Кумулята распределения рабочих по выработке

Если шкалы частот и вариантов поменять местами, т.е. на оси абсцисс отражать накопленные частоты, а на оси ординат – значения вариантов, то кривая, характеризующая изменение частот от группы к группе, будет носит название огивы распределения, рис.5.4.

Рис. 5.4. Огива распределения рабочих по выработке

Вариационные ряды с равными интервалами обеспечивают одно из важнейших требований, предъявляемых к статистическим рядам распределения, обеспечение сравнимости их во времени и пространстве.

Плотность распределения. Однако частоты отдельных неравных интервалов в названных рядах непосредственно не сопоставимы. В подобных случаях для обеспечения необходимой сравнимости исчисляют плотность распределения, т.е. определяют, сколько единиц в каждой группе приходится на единицу величины интервала.

При построении графика распределения вариационного ряда с неравными интервалами высоту прямоугольников определяют пропорционально не частотам, а показателям плотности распределения значений изучаемого признака в соответствующих интервалах.

Составление вариационного ряда и его графическое изображение является первым шагом обработки исходных данных и первой ступенью анализа изучаемой совокупности. Следующим шагом в анализе вариационных рядов является определение основных обобщающих показателей, именуемых характеристиками ряда. Эти характеристики должны дать представление о среднем значении признака у единиц совокупности.

Средняя величина . Средняя величина представляет собой обобщенную характеристику изучаемого признака в исследуемой совокупности, отражающая ее типический уровень в расчете на единицу совокупности в конкретных условиях места и времени.

Средняя величина всегда именованная, имеет ту же размерность, что и признак у отдельных единиц совокупности.

Перед вычислением средних величин необходимо произвести группировку единиц исследуемой совокупности, выделив качественно однородные группы.

Средняя, рассчитанная по совокупности в целом называется общей средней, а для каждой группы – групповыми средними.

Существуют две разновидности средних величин: степенные (средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая); структурные (мода, медиана, квартили, децили).

Выбор средней для расчета зависит от цели.

Виды степенных средних и методы их расчета. В практике статистической обработки собранного материала возникают различные задачи, для решения которых требуются различные средние.

Математическая статистика выводит различные средние из формул степенной средней:

где средняя величина; x – отдельные варианты (значения признаков); z – показатель степени (при z = 1 – средняя арифметическая, z = 0 средняя геометрическая, z = - 1 – средняя гармоническая, z = 2 – средняя квадратическая).

Однако вопрос о том, какой вид средней необходимо применить в каждом отдельном случае, разрешается путем конкретного анализа изучаемой совокупности.

Наиболее часто встречающимся в статистике видом средних величин является средняя арифметическая . Она исчисляется в тех случаях, когда объем осредняемого признака образуется как сумма его значений у отдельных единиц изучаемой статистической совокупности.

В зависимости от характера исходных данных средняя арифметическая определяется различными способами:

Если данные несгруппированные, то расчет ведется по формуле простой средней величины

Расчет средней арифметической в дискретном ряду происходит по формуле 3.4.

Расчет средней арифметической в интервальном ряду. В интервальном вариационном ряду, где за величину признака в каждой группе условно принимается середина интервала, средняя арифметическая может отличаться от средней, рассчитанной по несгруппированным данным. Причем, чем больше величина интервала в группах, тем больше возможные отклонения средней, вычисленной по сгруппированным данным, от средней, рассчитанной по несгруппированным данным.

При расчете средней по интервальному вариационному ряду для выполнения необходимых вычислений от интервалов переходят к их серединам. А затем рассчитывают среднюю величину по формуле средней арифметической взвешенной.

Свойства средней арифметической. Средняя арифметическая обладает некоторыми свойствами, которые позволяют упрощать вычисления, рассмотрим их.

1. Средняя арифметическая из постоянных чисел равна этому постоянному числу.

Если х = а. Тогда .

2. Если веса всех вариантов пропорционально изменить, т.е. увеличить или уменьшить в одно и то же число раз, то средняя арифметическая нового ряда от этого не изменится.

Если все веса f уменьшить в k раз, то .

3. Сумма положительных и отрицательных отклонений отдельных вариантов от средней, умноженных на веса, равна нулю, т.е.

Если , то . Отсюда .

Если все варианты уменьшить или увеличить на какое- либо число, то средняя арифметическая нового ряда уменьшится или увеличится на столько же.

Уменьшим все варианты x на a , т.е. x ´ = x a.

Тогда

Среднюю арифметическую первоначального ряда можно получить, прибавляя к уменьшенной средней ранее вычтенное из вариантов числа a , т.е. .

5. Если все варианты уменьшить или увеличить в k раз, то средняя арифметическая нового ряда уменьшится или увеличится во столько же, т.е. в k раз.

Пусть , тогда .

Отсюда , т.е. для получения средней первоначального ряда среднюю арифметическую нового ряда (с уменьшенными вариантами) надо увеличить в k раз.

Средняя гармоническая. Средняя гармоническая это величина обратная средней арифметической. Ее используют, когда статистическая информация не содержит частот по отдельным вариантам совокупности, а представлена как их произведение (М= xf). Средняя гармоническая будет рассчитываться по формуле 3.5

Практическое применение средней гармонической – для расчета некоторых индексов, в частности, индекса цен.

Средняя геометрическая. При применении средней геометрической индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста.

Средняя геометрическая величина используется также для определения равноудаленной величины от максимального и минимального значений признака. Например, страховая компания заключает договоры на оказание услуг автострахования. В зависимости конкретного страхового случая страховая выплата может колебаться от 10000 до 100000 долл. в год. Средняя сумма выплат по страховке составит долл.

Средняя геометрическая это величина, используемая как средняя из отношений или в рядах распределения, представленных в виде геометрической прогрессии, когда z = 0. Этой средней удобно пользоваться, когда уделяется внимание не абсолютным разностям, а отношениям двух чисел.

Формулы для расчета следующие

где – варианты осредняемого признака; – произведение вариантов; f – частота вариантов.

Средняя геометрическая используется в расчетах среднегодовых темпов роста.

Средняя квадратическая. Формула средней квадратической используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения. Так, при расчете показателей вариации среднюю вычисляют из квадратов отклонений индивидуальных значений признака от средней арифметической величины.

Средняя квадратическая величина рассчитывается по формуле

В экономических исследованиях средняя квадратическая в измененном виде широко используется при расчете показателей вариации признака, таких как дисперсия, среднее квадратическое отклонение.

Правило мажорантности. Между степенными средними существует следующая зависимость – чем больше показатель степени, тем больше значение средней, табл.5.4:

Таблица 5.4

Соотношение между средними величинами

Значение z

Соотношение между средними

Это соотношение называется правилом мажорантности.

Структурные средние величины. Для характеристики структуры совокупности применяются особые показатели, которые можно назвать структурными средними. К таким показателям относятся мода, медиана, квартили и децили.

Мода. Модой (Мо) называется наиболее часто встречающееся значение признака у единиц совокупности. Модой называется то значение признака, которое соответствует максимальной точке теоретической кривой распределения.

Мода широко используется в коммерческой практике при изучении покупательского спроса (при определении размеров одежды и обуви, которые пользуются широким спросом), регистрации цен. Мод в совокупности может быть несколько.

Расчет моды в дискретном ряду. В дискретном ряду мода – это варианта с наибольшей частотой. Рассмотрим нахождение моды в дискретном ряду.

Расчет моды в интервальном ряду. В интервальном вариационном ряду модой приближенно считают центральный вариант модального интервала, т.е. того интервала, который имеет наибольшую частоту (частость). В пределах интервала надо найти то значение признака, которое является модой. Для интервального ряда мода будет определяться формулой

где – нижняя граница модального интервала; – величина модального интервала; – частота, соответствующая модальному интервалу; – частота, предшествующая модальному интервалу; – частота интервала, следующего за модальным.

Медиана. Медианой () называется значение признака у средней единицы ранжированного ряда. Ранжированный ряд – это ряд, у которого значения признака записаны в порядке возрастания или убывания. Или медиана это величина, которая делит численность упорядоченного вариационного ряда на две равные части: одна часть имеет значение варьирующего признака меньшие, чем средний вариант, а другая – большие.

Чтобы найти медиану, сначала определяется ее порядковый номер. Для этого при нечетном числе единиц к сумме всех частот прибавляется единица и все делится на два. При четном числе единиц медиана отыскивается как значение признака у единицы, порядковый номер который определяется по общей сумме частот, деленной на два. Зная порядковый номер медианы, легко по накопленным частотам найти ее значение.

Расчет медианы в дискретном ряду. По данным выборочного обследования получены данные о распределении семей по числу детей, табл. 5.5. Для определения медианы сначала определим ее порядковый номер

В этих семьях количество детей равно 2, следовательно, = 2. Таким образом, в 50% семей число детей не превышает 2.

–частота накопленная, предшествующая медианному интервалу;

С одной стороны, это весьма положительное свойство т.к. в этом случае учитывается действие всех причин, воздействующих на все единицы изучаемой совокупности. С другой стороны, даже одно наблюдение, попавшее в исходные данные случайно, может существенным образом исказить представление об уровне развития изучаемого признака в рассматриваемой совокупности (особенно в коротких рядах).

Квартили и децили. По аналогии с нахождением медианы в вариационных рядах можно отыскать значение признака у любой по порядку единицы ранжированного ряда. Так, в частности, можно найти значение признака у единиц, делящих ряд на 4 равные части, на 10 и т.п.

Квартили. Варианты, которые делят ранжированный ряд на четыре равные части, называют квартилями.

При этом различают: нижний (или первый) квартиль (Q1) – значение признака у единицы ранжированного ряда, делящей совокупность в соотношении ¼ к ¾ и верхний (или третий) квартиль(Q3) – значение признака у единицы ранжированного ряда, делящий совокупность в соотношении ¾ к ¼.

– частоты квартильных интервалов (нижнего и верхнего)

Интервалы, в которых содержатся Q1 и Q3 определяют по накопленным частотам (или частостям).

Децили. Кроме квартилей рассчитывают децили – варианты, делящие ранжированный ряд на 10 равных частей.

Обозначаются они через D, первый дециль D1 делит ряд в соотношении 1/10 и 9/10, второй D2 – 2/10 и 8/10 и т.д. Вычисляются они по той же схеме, что и медиана и квартили.

И медиана, и квартили, и децили принадлежат к так называемым порядковым статистикам, под которым понимают вариант, занимающий определенное порядковое место в ранжированном ряду.

Среднее есть абстрактная типическая характеристика всей совокупности. Оно уничтожает, погашает, сглаживает случайные и неслучайные колебания, влияние индиви­дуальных особенностей и позволяет представить в одной величине, некоторую общую характеристику реальной совокупности единиц. Основное условие научного использования средних заключается в том, чтобы каждое среднее характеризовало такую совокупность единиц, которая в существенном отношении, и в первую очередь в отношении осредняемых значений признака, была бы качественно однородной. Среди всего многообразия средних практически наибо­лее часто используемой считается среднее арифметическое.

Среднее арифметическое. Среднее арифметическое есть частное от деления суммы всех значений признака на их число. Обознача­ется оно х. Формула для вычисления имеет вид

По следующим данным вычислим среднее число газет, читаемых ежедневно индивидами в выборке, из 10 человек:

Формула (1) для сгруппированных данных преобразуется в следующую:

где n t - частота для i -го значения признака.

Если находят среднюю для интервального ряда.распределения, то в качестве значения признака для каждого интервала условно принимают его середину.

Процедуру вычисления среднего по сгруппированным данным удобно выполнять по следующей схеме (табл. 3).

Существует ряд упрощенных приемов вычисления средних. На с. 163 как промежуточный этап рассмотрено вычисление среднего методом отсчета от условного нуля.

Пример. Вышеприведенные данные о количестве прочитанных газет (см. с. 159) сгруппируем следующим образом:

Медиана. Медианой называется значение признака у той еди­ницы совокупности, которая расположена в середине ряда частот­ного распределения.

Если в ряду четное число членов (2k), то медиана равна средне­му арифметическому из двух серединных значений признака. При нечетном числе членов (2k+ 1) медианным будет значение призна­ка у (k + 1) объекта.

Предположим, что в выборке из 10 человек респонденты проранжированы по стажу работы на данном предприятии:

Серединные ранги 5 и 6, поэтому медиана равна

В интервальном ряду с различными значениями частот вычисление медианы распадается на два этапа: сначала находят медиан­ный интервал, которому соответствует первая из накопленных ча­стот, превышающая половину всего объема совокупности, а затем находят значение медианы по формуле

где Х0 - начало (нижняя граница) медианного интервала; d - ве­личина медианного интервала; n = Sn t - сумма частот (относитель­ных частот) интервалов; n н - частота (относительная), накоплен­ная до медианного интервала; n мe - частота (относительная) меди­анного интервала.


Проведем вычисление по данным табл. 2, где в нижней строке приведены накопленные относительные частоты. Первая из них, превышающая половину совокупности (100/2 = 50%), равна 57,9%. Следовательно, медиана принадлежит интервалу 3-4 года. По­этому

Таким образом, для данной выборки медиана, равная 3,7 года, показывает, что 50% семей имеют соотношение возрастов, меньшее этой величины, а другие 50%-большее. Медиана может быть легко определена графически по кумуляте распределения (см. рис. 3).

Медиана может быть применена для дискретных переменных, хотя дробные значения часто не имеют непосредственной содержа­тельной интерпретации.

По данным распределения рабочих по тарифным разрядам см. с. 156) вычислим медиану этого распределения, используя приведенную выше формулу 1 8 . Получим

Узнали, что 50% рабочих имеют разряд, меньший 3,1, и 50%-больший.

Медиана, как уже отмечалось, делит упорядоченный вариацион­ный ряд на две равные по численности группы.

Наряду с медианой можно рассматривать величины, называемые квантилями, которые делят ряд распределения на 4 равные части, на 10 и т. д.

Квантили, которые делят ряд на 4 равные по объему совокупно­сти, называются квартилями. Различают нижний Q1/4 и верхний квартили (рис. 6). Величина Q 1/2 является медианой. Вычисле­ние квартилей совершенно аналогично вычислению медианы:

где х 0 - минимальная граница интервала, содержащего нижний (верхний) квартиль; n н - частота (относительная частота), накоп­ленная до квартального интервала; n Q - частота (относительная частота) квартального интервала; d - величина квартального ин­тервала.

Процентили делят множество наблюдений на 100 частей с рав­ным числом наблюдений в каждой. Децили делят множество наблю­дений на десять равных частей. Квантили легко вычисляются по распределению накопленных частот (по кумуляте).

Мода. Модой в статистике называется наиболее часто встречаю­щееся значение признака, т. е. значение, с которым наиболее веро­ятно можно встретиться в серии зарегистрированных наблюдений. В дискретном ряду мода (Мо) - это значение с наибольшей частотой.

В интервальном ряду (с равными интервалами) модальным яв­ляется класс с наибольшим числом наблюдений. Значение моды находится в его пределах и вычисляется по формуле

где х 0 - нижняя граница модального интервала; d - величина ин­тервала; n- - частота интервала, предшествующего модальному; n Мо - частота модального класса; n + - частота интервала, следую­щего за модальным.

В совокупностях, в которых может быть произведена лишь опе­рация классификации объектов по какому-нибудь качественному признаку, вычисление моды является единственный способом ука­зать некий центр тяжести совокупности.

К недостаткам моды следует отнести следующие: невозможность совершать над ней алгебраические действия; зависимость ее величи­ны от интервала группировки; возможность существования в ряду распределения нескольких модальных значений признака (см., например, рис. 4, в).

Сравнение средних . Целесообразность использования того или иного типа средней величины зависит по крайней мере от следующих условий: цели усреднения, вида распределения, уровня измерения признака, вычислительных соображений. Цель усреднения свя­зана с содержательной трактовкой рассматриваемой задачи. Однако форма распределения может существенно усложнить исследование средних. Если для симметричного распределения (см. рис. 4, а) мода, медиана и среднее арифметическое тождественны, то для асимметричного распределения это не так. На выбор средней мо­жет повлиять и вид распределения. Например, для ряда с откры­тыми конечными интервалами нельзя вычислять среднее арифмети­ческое, но если распределение близко к симметричному, можно под­считать тождественную ему в этом случае медиану.


1. Средние величины: сущность, значение, виды

Важный вклад в обоснование и развитие теории средних величин внес крупный ученый XIX века Адольф Кетле (1796-1874), член Бельгийской академии наук, член-корреспондент Петербургской академии наук.

Средняя величина - обобщающая характеристика изучаемого признака в исследуемой совокупности. Она определяет его типичный уровень в расчёте на единицу совокупности в конкретных условиях места и времени.

Средняя величина всегда именованная, имеет ту же размерность (единицу измерения), что и признак у отдельных единиц совокупности.

Основным условием научного использования средней величины является качественная однородность совокупности, по которой исчислена средняя.

    степенные (средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая, средняя кубическая);

    структурные (мода, медиана).

Степенная средняя – корень степени k из средней всех вариантов, взятых в k –й степени, имеет следующий вид:

где – признак, по которому находится средняя, называется осредняемым признаком,

х i или (х 1 , х 2 …х n ) – величина осредняемого признака у каждой единицы совокупности,

f i – повторяемость индивидуального значения признака.

В зависимости от степени k получаются различные виды степенных средних, формулы расчета которых показаны ниже в таблице 1.

Таблица 1 – Виды степенных средних

Значение k

Наименование средней

Формулы средней

взвешенная

Средняя гармоническая

, w i = x i · f i

Средняя геометрическая

Средняя арифметическая

=

=

Средняя квадратическая

=

=

f i частота повторения индивидуального значения признака (его вес)

Весом может быть и частотость, т.е. отношение частоты повторения индивидуального значения признака к сумме частот:

Выбор вида средней величины:

Средняя арифметическая простая применяется в случае, если индивидуальное значение признака у единиц совокупности на повторяется или встречается одни раз или одинаковое число раз, т.е. когда средняя рассчитывается по несгруппированным данным.

Когда отдельное значение изучаемого признака встречается несколько раз у единиц изучаемой совокупности, тогда частота повторения индивидуальных значений признака (вес) присутствует в расчетных формулах степенных средних. В этом случае они называются формулами взвешенных средних .

Если по условию задачи необходимо, чтобы неизменной оставалась при осреднении суммы величин, обратных, индивидуальным значениям признака, то средняя величина является гармонической средней .

Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменным произведение индивидуальных величин, то следует применить среднюю геометрическую . Средняя геометрическая используется для расчета средних темпов роста в анализе рядов динамики.

Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменной сумму квадратов исходных величин, то средняя будет являться квадратической средней величиной . Средняя квадратическая используется для расчета среднего квадратического отклонения при анализе вариации признака в рядах распределения.

Степенные средние разных видов, исчисленные по одной и той же совокупности, имеют различные количественные и чем больше показатель степени k , тем больше и величина соответствующей средней, если все исходные значения признака равны, то и все средние равны этой постоянной:

Гарм. ≤ геом. ≤ арифм. ≤ кв. ≤ куб.

Это свойство степенных средних возрастать с повышением показателя степени определяющей функции называется мажорантностью средних .

Структурные средние применяют в том случае, когда расчет степенных средних невозможен или нецелесообразен.

К структурным средним относят: моду и медиану .

Мода – это наиболее часто встречающееся значение признака у единиц данной совокупности. При наличии вариантов и частот в ряду распределения величина моды соответствует значению признака у наибольшего числа единиц (наибольшей частоте), т.е. для дискретного вариационного ряда мода находится по определению.

Медиана – значение признака у единицы совокупности в середине ранжированного ряда распределения, когда все индивидуальные значения признака изучаемых единиц расположены в порядке их возрастания или убывания.

В случае нечетного числа наблюдений медиана находится по определению, т.е. вариант (где n – число наблюдений). При четном числе наблюдений медиана определяется по формуле:

Для интервального ряда распределения величина моды и медианы рассчитываются по следующим формулам:
;
,

где: - нижняя граница модального или медианного интервала;

- величина интервала;

и
- частоты, предшествующие и следующие за модальным интервалом;

- частота модального или медианного интервала;

- сумма накопленных частот в интервалах, предшествующих медианному.

Расчет медианы по несгруппированным данным производится следующим образом:

1. Индивидуальные значения признака располагаются в возрастающем порядке. 2. Определяется порядковый номер медианы № Ме = (n +1) / 2

    Показатели вариации, сущность, значение, виды. Законы вариации

Для измерения вариации признака применяются различные абсолютные и относительные показатели.

К абсолютным показателям (мера) вариации относятся: размах колебаний, среднее абсолютное отклонение, дисперсия, среднее квадратическое отклонение.

Размах вариации – это разность между максимальным и минимальным значениями признака:
.

Размах вариации показывает, в каких пределах колеблется размер признака, образующего ряд распределения

Среднее абсолютное отклонение (САО) - средняя из абсолютных значений отклонений отдельных вариант от средней.

(простая),
(взвешенная)

Дисперсия- средняя из квадратов отклонений вариантов значений признака от их средней величины:

(простая),
(взвешенная)

Дисперсия может быть разложена на составные элементы, позволяющих оценить влияние различных факторов, обуславливающих вариацию признака

т.е. дисперсия равна разности между средним квадратом значений признака и квадратом средней.

Свойства дисперсии, позволяющие упростить способ ее вычисления:

    Дисперсия постоянной величины равна 0.

    Если все варианты значений признака уменьшить на одно и то же число раз, то дисперсия не уменьшится.

    Если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшится в k 2 раз.

Среднее квадратическое отклонение (СКО) представляет собой корень квадратный из дисперсии, показывает насколько в среднем колеблется величина признака у единиц изучаемой совокупности: =

СКО является мерилом надежности. Чем меньше СКО, тем лучше средняя арифметическая отражает собой всю представляемую совокупность.

Размах вариации, САО, СКО являются величинами именованными, т.е. имеют те же единицы измерения, что и индивидуальные значения признака.

Существуют 4 вида дисперсии: общая, межгрупповая, внутригрупповая, групповая.

Дисперсию, вычисляемую для всей совокупности в целом называют общей дисперсией. Она измеряет колеблемость зависимого признака (результатного), вызванную действием на него всех без исключения факторов.

Общая дисперсия равна сумме средней из внутригрупповой и межгрупповой дисперсии:

Если совокупность разбита на группы, то для каждой группы может быть определена своя дисперсия, характеризующая вариацию внутри группы. Групповая дисперсия – средние квадратические отклонения от групповой средней, т.е. от средней величины признака в данной группе.

где j – порядковый номер x и f в пределах группы.

Групповая дисперсия характеризует вариацию признака в пределах группы за счет всех прочих факторов, кроме положенного в основании группировки.

Измерение вариации по совокупности в целом, исчисляем как среднюю из внутригрупповых дисперсии:

где – групповые дисперсии,

n j – число единиц в группах.

Групповые средние отличаются одна от другой и от общей средней, т.е. варьируют. Их вариацию называют межгрупповой вариацией. Для ее характеристики исчисляют средний квадрат отклонений групповых средних от общей средней:

где j групповые средние, – общая средняя, n j – число единиц в группе.

Межгрупповая дисперсия (дисперсия групповых средних) измеряет вариацию результатного признака за счет факторного признака, положенного в основании группировки.

При сравнении колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях с различной величиной средней арифметической пользуются относительными показателями вариации.

Эти показатели вычисляются как отношение абсолютных показателей вариации к средней арифметической (или медиане)

Коэффициент вариации

Относительное линейное отклонение

Коэффициент осцилляции

Наиболее часто применяемый показатель относительной колеблемости – коэффициент вариации , который показывает среднее отклонение от среднего значения признака в процентах.

Его используют для: сравнительной оценки вариации; характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%, т.е. меньше 33%.

Законы вариации .

Закон вариации индивидуальных значений признака или «правило трех сигм». Бельгийский статистик А.Кетле обнаружил, что вариации некоторых массовых явлений подчиняются закону распределения ошибок, открытому К.Гауссом и П. Лапласом почти одновременно. Кривая, отображающая это распределение, имеет вид колокола (рис.2).

По нормальному закону (термин предложен английским статистиком К.Пирсоном) распределения колеблемость индивидуальных значений признака находится в пределах
(правило трех сигм).

Нормальному закону распределения подчиняются естественные свойства человека (рост, вес, физическая сила), характеристики промышленных изделий (размер, вес, электрическое сопротивление, упругость и т.п.). В сфере быстроизменяющихся общественных явлений действие этого закона проявляется сравнительно редко. Однако, в ряде случаев, использование правила трех сигм практически возможно.

Закон вариации средних величин . Вариация средних величин меньше вариации индивидуальных значений признака. Средние значения признака изменяются в пределах:
, где n – число единиц.

Предмет статистической науки и задачи статистики на современном этапе

Статистика произошло от лат «ststus»-состояние или положение. Статистика - это совокупность цифр; это вид деятельности по сбору и анализу данных; это наука сформировавшаяся в 18в и изначально называл «политическая арифметика». Предмет статист - количественная сторона массовых соц-экон явл в неразрывной связи с их качественной стороной в конкретн услов места и времени. Объект – общество происходящие в нем процессы, т.е. совокупность соц-экономических явлений. Основн метод статистики – закон больших чисел. Важнейшие задачи стат-ки – организ стат наблюдений; обраб-ка данных и получение системы обобщ показателей для анализа; предоставлен гос управл достов информации для своевремен принятия управл решений; публикац информации для информиров-я по соц-экон процессам. Стат. исследования проходят след этапы : 1.статистичек наблюдение(формы и виды сбора информ);2.стасистическа сводка и группировка(систематизация);3.расчет и анализ обобщающих показателей(абсолютн и относ велич, средн велич, показатели вариации, показатели выборочного наблюдения, показатели рядов динамики, индексы).

Статистическая совокупность, ее виды. Единицы совокупности и классификация их признаков.

Статистическая совокупность – совокупность однородных по какому-либо признаку предметов, ограниченных пространством и временем. Совокупность называется однородной, если один или несколько изучаемых существенных признаков ее объектов являются общими для всех единиц. Совокупность, в которую входят явления разного типа, считается разнородной. Пример СС - множество студентов некоторого вуза, обучающихся на 2-ом курсе дневного отделения. Данное множество является качественно однородным, так как объединяет молодых людей, обучающихся в одном и том же вузе на 2-ом курсе дневного отделения. В то же время элементы данного множества - студенты отличаются друг от друга успеваемостью, способностями, состоянием здоровья и т.п. Единица совокупности (элемент) - частный случай проявления изучаемой закономерности; это первичный элемент статистической совокупности, являющийся носителем признаков, подлежащих регистрации и основой ведущегося при обследовании счета. Признак - это свойство, характеристика единицы статистической совокупности. Например, единица статистической совокупности - «студент» имеет следующие признаки: фамилия, имя, отчество, возраст, оценки по предметам, посещаемость занятий и т.д Чем более однороднее совокупность, тем больше общих признаков имеют ее единицы и меньше варьируют их значения.