Средние величины и показатели вариации в статистике. Показатели вариации

Средняя величина – это обобщающая характеристика варьирующего признака единиц качественно однородной совокупности.

Средние величины используются в планировании, анализе выполнения планов, расчетах экономической эффективности общественного производства и т.д. Сравнивая изменение средних уровней во времени, статистика тем самым характеризует важнейшие закономерности развития явлений.

В статистике применяются различные виды средних величин: средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя хронологическая средняя квадратическая и средняя кубическая.

Наиболее распространенным видом средних величин является средняя арифметическая. Она рассчитывается в двух формах – простой и взвешенной.

Средняя арифметическая простая называется так потому, что в основе ее вычисления лежит простое суммирование. Чтобы определить ее, все показатели варьирующего признака суммируются и делятся на их количество.

Формула средней арифметической простой:

Где х – варианты; n – число вариант.

Формула средней арифметической взвешенной:

, где х – варианты; f – веса.

Эта средняя называется взвешенной потому, что для ее определения значения признака, по которым эта средняя исчисляется, не просто складываются, а предварительно умножаются на частоту (взвешиваются).

Применяется эта средняя в том случае, если показатели в совокупности встречаются несколько раз (т.е. повторяются).

Иногда среднюю арифметическую величину исчисляют по данным интервального вариационного ряда (когда варианты представлены в виде интервалов «от – до»). Для исчисления средней нужно прежде всего получить середину интервала каждой группы, а затем расчет производится по формуле арифметической взвешенной.

Средняя гармоническая взвешенная рассчитывается по формуле:

, где х – варианты; W – объем признака.

Средняя гармоническая применяется в тех случаях, когда отсутствует показатель частоты. Она представляет собой величину обратную средней арифметической из обратных значений признака

Модой называют то значение признака, которое наиболее часто встречается в данной совокупности.

Для интервальных вариационных рядов мода определяется по формуле:

М 0 = х мо + i мо *
, где

х мо - нижняя граница интервала, содержащего моду;

i мо - величина модального интервала;

f мо - частота модального интервала;

f мо-1 - частота интервала, предшествующего модальному;

f мо+1 – частота интервала, следующего за модальным.

Медианой называют значение признака, приходящееся на середину ранжированной совокупности.

М е = х ме + i ме *
, где

х ме - нижняя граница интервала, содержащего медиану;

i ме - величина медианного интервала;

∑f - сумма частот;

S ме-1 - сумма накопленных частот, предшествующих медианному интервалу;

f ме – частота медианного интервала.

Изменение значений признака в пределах изучаемой совокупности называется вариацией .

Для характеристики величины колебания признака в статистике вычисляют следующие показатели вариации:

    размах вариации;

    среднее линейное отклонение;

    средний квадрат отклонения (дисперсия);

    среднее квадратическое отклонение;

    коэффициент вариации.

Абсолютные и относительные показатели вариации, характеризующие изменчивость значений признака, позволяют оценить степень однородности совокупности, типичности и устойчивости средней.

Размах вариации (R) – наиболее простой измеритель вариации и представляет собой разность между наибольшим и наименьшим значениями признака

R = x max – x min , где

x max – наибольшее значение признака;

x min – наименьшее значение признака.

Среднее линейное отклонение (ι) этосредняяарифметическая из абсолютных отклонений индивидуальных значений признака от общей средней.

(простое);
(взвешенное);

Средний квадрат отклонения, или дисперсия представляет собой среднюю арифметическую из квадратов отклонений вариант от общей средней

=
(простая);
=
(взвешенная)

Среднее квадратическое отклонение – квадратный корень из дисперсии

;
;

Размах вариации, среднее линейное и среднее квадратическое отклонение являются абсолютными показателями вариации

Коэффициент вариации является относительным показателем вариации, выражается в %. Он представляет собой отношение среднего квардратического отклонения к средней величине признака:

V=

Чем больше коэффициент вариации, тем менее однородна совокупность и тем менее типична средняя величина, тем менее она характеризует изучаемое явление.

Пример:

По трем предприятиям, вырабатывающим один вид изделий, известны следующие данные за отчетный месяц:

Определите: 1) среднюю выработку одного рабочего; 2) среднюю себестоимость единицы продукции; 3)среднюю численность рабочих на одно предприятие.

    Определим среднюю выработку одного рабочего:

    Определим среднюю себестоимость единицы продукции:

    Определим среднее число рабочих:

Пример:

Имеются данные о распределении 100 ткачих по дневной выработке:

На основании данных вычислите:

    среднюю дневную выработку 1 ткачихи;

    моду и медиану

Дневная выработка, м

Число ткачих

интервала (х)

Накопленные частоты

120 и выше

    Средняя дневная выработка одной ткачихи определяется по формуле средней арифметической взвешенной

    Модальное значение выработки вычислим по формуле

М 0 = х мо + i мо *

3.Значение медианы вычислим по формуле:

М е = х ме + i ме *

Пример:

По обувной фабрике имеются следующие данные:

Определите процент брака в среднем по фабрике за 1 и 2 кварталы

Сделайте вывод.

Средний процент брака за 1 квартал определяется по формуле:

Средний процент брака за 2 квартал определяется по формуле:

Вывод: удельный вес бракованной продукции во втором квартале по сравнению с первым уменьшился на 0,2%.

Пример:

Известны данные о распределении 20 заводов отрасли по стоимости основных средств:

Определите:

1) среднюю стоимость основных средств на один завод по отрасли;

2) размах вариации, среднее линейное отклонение, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Сделайте вывод.

Стоимость

основных

средств (млрд. руб.)

Середина

интервала

I
I*f

(
) 2

(
) 2 *f

    Определим среднюю стоимость основных средств

млрд. руб.

    Вычислим размах вариации

R = x max – x min ,= 14 - 4 = 10 млрд. руб.

Определим среднее линейное отклонение

млрд. руб.

Дисперсию признака вычислим по следующей формуле

=

Среднее квадратическое отклонение

млрд. руб.

Коэффициент вариации

V=

Вывод: средняя стоимость основных средств по отрасли составляет 9,7 млрд. руб. Совокупность однородна, т.к. коэффициент вариации 25,4%, т.е. вариация признака умеренная.

Средняя величина - это обобщающая характеристика совокупности однотипных явлений по изучаемому признака.

Выбор средней определяется экономическим содержанием определенного показателя и исходных данных. В каждом конкретном случае применяется одна из средних величин:

Арифметическая

Гармоническая

Квадратичная

Геометрическая

Каждая из них может быть простой и взвешенной. Перечисленные средние относятся к классу степенных средних и определяются формулой (при различных значениях m):

При m = -1 средняя гармоническая;

m = 0 средняя геометрическая

m = 1 средняя арифметическая;

m = 2 средняя квадратическая;

Средняя арифметическая простая - это самая часто используемая средняя величина, которая получается, если подставить в общую формулу m=1. Средняя арифметическая простая имеет следующий вид:

где X - значения величин, для которых необходимо рассчитать среднее значение; N - общее количество значений X (число единиц в изучаемой совокупности).

Средняя арифметическая взвешенная вычисляется когда варианты встречаются не одинаковое число раз.

Число одинаковых значений и признаков в рядах распределения называется частотой или весом (f). Средняя арифметическая взвешенная имеет следующий вид:

Для вычисления средней арифметической взвешенной необходимо:

Каждую варианту умножить на вес признака (x*f)

Найти сумму этих произведений

Сумму произведений вариант

Средняя гармоническая простая применяется в тех случаях, когда вес каждого варианта =1, и когда индивидуальное значение обратного признака встречается по 1 разу. Средняя гармоническая простая обратная средней арифметической из обратных значений признака.

Средняя гармоническая простая применяется для расчета средней трудоемкости и средней производительности труда.

Средняя гармоническая взвешенная применятся, когда статистическая информация не содержит частой по отдельным вариантам совокупности, а представлена как их произведение, и когда имеются данные об индивидуальных значениях признака и общем объеме совокупности, но неизвестны частоты.

Средняя квадратическая простая применяется для расчета среднего диаметра стволов деревьев, клубней, труб и т.д. Т.е. она применятся для обобщения признаков, выраженных линейными мерами каких-либо площадей. Средняя квадратическая простая определяется путем деления суммы квадратов отдельных значений признаков на их число и извлечение из полученного частного квадратного корня.

Средняя квадратическая взвешенная применяется в том случае, если будет частота повторения признака.

Средняя геометрическая простая применяется в тех случаях, когда индивидуальное значение признака представляет собой относительные величины динамики. Вычисляется путем извлечения корня степени n из произведений отдельных значений признака.

Модой называется наиболее часто встречающаяся величинв признака. Определение моды зависит от того, в каком ряду представлен вальрирующий признак, если вальрирующий признак представлен в в идее дискретного ряда распределения, то для определения моды не требуется никаких вычислений. В таком ряду модой будет то значение признака, которое обладает наибольшей частотой. Если значение признака представлены в виде интервального вида, то мода определяется:

где Мо - мода;

ХНМо - нижняя граница модального интервала

;hМо - размах модального интервала (разность между его верхней и нижней границей);

fМо - частота модальноого интервала;

fМо-1 - частота интервала, предшествующего модальному;

fМо+1 - частота интервала, следующего за модальным.

Медианой называется варианта, расположенная в середине вариационного ряда. Если ряд распределения дискретный и имеет нечетное число членов, то медианой будет варианта, находящаяся в середине упорядоченного ряда. А если упорядоченный ряд состоит из четного числа членов, то медианой будет средняя арифметическая двух вариант, расположенных в середине ряда. Медиану для интервального вариационного ряда рассчитывают:

где Ме - медиана;

НМе - нижняя граница медианного интервала;

hМе - размах медианного интервала;

fМе - частота медианного интервала;

fМе-1 - сумма частот интервалов, предшествующих медианному.

Показатели вариаций- отклонение индивидуальных показателей от средней величины.

Существуют следующие показатели вариаций:

Размах вариации или лимит изменчивости

Среднее линейное отклонение

Дисперсия

Среднее квадратическое отклонение

Коэффициент вариации

Размах вариации- разность между наибольшим и наименьшим значением вальрирующего признака.

Размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду.

Среднее линейное отклонение- сумма отклонений каждой варианты от своей средней арифметической без учета знака, деленная на число вариант. Существует простое и взвешенное.

Среднее линейное отклонение дает лишь приближенную характеристику вариации.

Дисперсия- среднее арифметическое квадратов отклонений каждого значения признака от общей средней.

Для расчета простой дисперсии находят отклонения каждой варианты от средней, затем отклонения возводят в квадрат, суммируют и делят на число вариант.

Простая дисперсия:

Взвешенная:

Среднее квадратическое отклонение- корень квадратный из дисперсии.

Среднее квадратическое отклонение обладает большей степенью точности и находит применение при любом анализе статистических совокупностей. Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее совокупность и тем более типичней будет средняя величина.

Коэффициент вариаций- относительная мера изменчивости признака. % отношение среднего квадратического отклонения к средней арифметической.

Чем больше коэффициент вариации, тем больше разброс значений признака вокруг средней, тем менее однородней совокупность по своему составу. Совокупность считается количественно однородной, если коэффициент вариаций не превышает 33%.

Реферат

Средние величины и показатели вариации

1.Сущность средних в статистике

2.Виды средних величин и способы их расчёта

3.Основные показатели вариации и их значение в статистике

1. Сущность средних величин в статистике

В процессе изучения массовых социально-экономических явлений возникает необходимость выявления их общих свойств, типичных размеров и характерных признаков. Необходимость в обобщающем среднем показателе возникает в том случае, когда признаки, характеризующие единицы изучаемой совокупности, количественно варьируют. Например, размер дневной выработки ткачей на текстильной фабрике зависит от общих условий производства, ткачи используют одинаковое сырьё, работают на одинаковых станках и т.д. В то же время часовая выработка отдельных ткачей колеблется, т.е. варьирует, так как зависит от индивидуальных особенностей каждого ткача (его квалификации, профессионального опыта и т.д.). Чтобы характеризовать дневную выработку всех ткачей предприятия, необходимо исчислить среднюю величину дневной выработки, так, как, только, в, этом, показателе найдут отражение общие для ткачей условия производства.

Таким образом, исчисление средних обобщающих показателей означает отвлечение (абстрагирование) от особенностей, отражающихся в величине признака у отдельных единиц, и выявление общих для данной совокупности типичных черт и свойств.

Таким образом, средней величиной в статистике является обобщённая, количественна характеристика признака и статистической совокупности. Она выражает характерную, типичную величину признака у единиц совокупности, образующихся в данных условиях места и времени под влиянием всей совокупности факторов. Действие разнообразных факторов порождает колебание, вариацию усредняемого признака. Средняя величина является общей мерой их действия, равнодействующей всех этих факторов. Средняя величина характеризует совокупность по усредняемому признаку, но относится к единице совокупности. Например, средняя выработка продукции на одного рабочего данного предприятия представляет собой отношение всей выработки (за любой период времени) к общей (средней за тот же период) численности его рабочих. Она характеризует производительность труда данной совокупности, но относится к одному рабочему. В средней величине массового явления погашаются индивидуальные различия единиц статистической совокупности в значениях усредняемого признака, обусловленные случайными обстоятельствами. Вследствие этого взаимопогашения в средней проявлявляется общее, закономерное свойство данной статистической совокупности явлений. Между средней и индивидуальными значениями осреднённого признака существует диалектическая связь как между общим и отдельным. Средняя является важнейшей категорией статистической науки и важнейшей формой обобщающих показателей. Многие явления общественной жизни становятся ясными, определёнными, лишь, будучи обобщенными, в форме средних величин. Таковы, например, упомянутая выше производительность труда, совокупность рабочих, урожайность сельскохозяйственных культур и т.д. Средняя выступает в статистике важнейшим методом научного обобщения. В этом смысле говорят о методе средних величин, который широко применяется в экономической науке. Многие категории экономической науки определяются с использованием понятия средней.

Основным условием правильного применения средней величины является однородность статистической совокупности по усредняемому признаку. Однородной статистической совокупностью называется такая совокупность, в которой её составные элементы (единицы) сходны между собой по существенным для данного исследования признакам и относятся к одному и тому же типу явлений. Однородная совокупность, будучи однородна по одним признакам, может быть разнородной по другим. Только в средних для таких совокупностей проявляются специфические особенности, закономерности развития анализируемого явления. Средняя вычисленная для неоднородной статистической совокупности, т.е. такой в которой объединены качественно различные явления, теряет своё научное значений. Такие средние являются фиктивными, не только не дающими представления о действительности, но и искажающими её. Для формирования однородных статистических совокупностей производится соответствующая группировка. С помощью группировок и в качественно однородной совокупности могут быть выделены характерные в количественном отношении группы. Для каждой из них может быть вычислена своя средняя, называемая средней групповой (частной) в отличие от общей средней (для совокупности в целом).

2. Виды средних величин

Большое значение в методологии средних величин имеют вопросы выбора формы средней, т.е. формулы по которой можно правильно вычислить среднюю величину, и выбора весов средней. Наиболее часто в статистике применяются средняя агрегатная, средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратичная, мода и медиана. Применение той или иной формулы зависит от содержания усредняемого признака и конкретных данных, по которым её необходимо рассчитать. Для выбора формы средней можно воспользоваться так называемым средним исходным соотношением.

2.1 Средняя арифметическая

Средняя арифметическая - одна из наиболее распространенных форм средней величины. Средняя арифметическая рассчитывается как частное от деления суммы индивидуальных значений (вариантов) варьирующего признака на их число. Средняя арифметическая применяется в тех случаях, когда объём варьирующего признака явлений однородной статистической совокупности, образуется путём суммирования значений признака всех единиц явлений статистической совокупности. Различают следующие средне арифметические величины:

1) Простая средняя арифметическая , которая определяется путём простого суммирования количественных значений варьирующего признака и деления этой сумы на их варианты и рассчитывается по следующей формуле:


Х - средняя величина статистической совокупности,

x i - сумма отдельных варьирующих вариантов явлений статистической совокупности,

n i - количество варьирующих вариантов явлений статистической совокупности.

2) Среднеарифметическая взвешенная - средняя величина признака явления, вычисленная с учётом весов. Веса средних величин - частоты, с которыми отдельные значения признака осредняемого принимаются в расчёт при исчислении его средней величины. Выбор весов средней величины зависит от сущности усредняемого признака и характера данных, которыми располагают для вычисления средних величин. В качестве весов средних величин могут быть показатели численности единиц или размеры частей статистической совокупности (в форме абсолютных или относительных величин), обладающих данным вариантом (значением) усредняемого признака явления статистической совокупности, а также величины показателя связанного с усредняемым признаком. Среднеарифметическая взвешенная рассчитывается по следующей формуле:


X- средняя арифметическая взвешенная,

х - величина отдельных варьирующих вариантов явлений статистической совокупности,

Назначение простой, и взвешенной средней арифметической является определение среднего значения варьирующего признака. Если в изучаемой статистической совокупности варианты значений признака встречаются по одному разу или имеют одинаковый вес, то применяется простая средняя арифметическая, если же варианты значений данного признака встречаются в изучаемой совокупности по несколько раз или имеют различные веса, для определения среднего значения варьирующего признака применяется средняя арифметическая взвешенная.

2.2 Средняя гармоническая

Средняя гармоническая применяется для расчёта средней величины тогда, когда непосредственные данные о весах отсутствуют, а известны варианты усредняемого признака (х) и произведения значений вариантов на количество единиц, обладающих данным его значением w (w = xf).

Данная средняя рассчитывается по следующим формулам:

1.) Среднегармоническая простая:

Х - средняя гармоническая простая,

n - количество варьирующих вариантов явлений статистической совокупности.

2) Среднегармоническая взвешенная:

Х - средняя гармоническая взвешенная,

х - сумма отдельных варьирующих вариантов явлений статистической совокупности,

При использовании гармонической взвешенной выявляют веса и таким образом получают тот же результат, который дал бы расчёт по средней арифметической взвешенной, если бы были известны все необходимые для этого данные.

2.3 Средняя агрегатная

Средняя агрегатная рассчитывается по формуле:

X - средняя агрегатная,

х - сумма отдельных варьирующих вариантов явлений статистической совокупности,

Средняя агрегатная вычисляется в тех случаях, когда известны (имеются) значения числителя и значения знаменателя исходного соотношения средней.

2.4 Средняя геометрическая

По данным выборочного обследования произведена группировка вкладчиков по размеру вклада в Сбербанке города:

Определите:

1) размах вариации;

2) средний размер вклада;

3) среднее линейное отклонение;

4) дисперсию;

5) среднее квадратическое отклонение;

6) коэффициент вариации вкладов.

Решение:

Данный ряд распределения содержит открытые интервалы. В таких рядах условно принимается величина интервала первой группы равна величине интервала последующей, а величина интервала последней группы равна величине интервала предыдущей.

Величина интервала второй группы равна 200, следовательно, и величина первой группы также равна 200. Величина интервала предпоследней группы равна 200, значит и последний интервал будет иметь величину, равную 200.

1) Определим размах вариации как разность между наибольшим и наименьшим значением признака:

Размах вариации размера вклада равен 1000 рублей.

2) Средний размер вклада определим по формуле средней арифметической взвешенной.

Предварительно определим дискретную величину признака в каждом интервале. Для этого по формуле средней арифметической простой найдём середины интервалов.

Среднее значение первого интервала будет равно:

второго - 500 и т. д.

Занесём результаты вычислений в таблицу:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х xf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Итого 400 - 312000

Средний размер вклада в Сбербанке города будет равен 780 рублей:

3) Среднее линейное отклонение есть средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней:

Порядок расчёта среднего линейонго отклонения в интервальном ряду распределения следующий:

1. Вычисляется средняя арифметическая взвешенная, как показано в п. 2).

2. Определяются абсолютные отклонения вариант от средней:

3. Полученные отклонения умножаются на частоты:

4. Находится сумма взвешенных отклонений без учёта знака:

5. Сумма взвешенных отклонений делится на сумму частот:

Удобно пользоваться таблицей расчётных данных:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Итого 400 - - - 81280

Среднее линейное отклонение размера вклада клиентов Сбербанка составляет 203,2 рубля.

4) Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической.

Расчёт дисперсии в интервальных рядах распределения производится по формуле:

Порядок расчёта дисперсии в этом случае следующий:

1. Определяют среднюю арифметическую взвешенную, как показано в п. 2).

2. Находят отклонения вариант от средней:

3. Возводят в квадрат отклонения каждой варианты от средней:

4. Умножают квадраты отклонений на веса (частоты):

5. Суммируют полученные произведения:

6. Полученная сумма делится на сумму весов (частот):

Расчёты оформим в таблицу:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Итого 400 - - - 23040000

Вариация -- это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.

Например, работники фирмы различаются по доходам, затратам времени на работу, росту, весу, любимому занятию в свободное время и т.д.

Вариация возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Таким образом, величина каждого варианта объективна.

Исследование вариации в статистике имеет большое значение, помогает познать сущность изучаемого явления. Особенно актуально оно в период формирования многоукладной экономики. Измерение вариации, выяснение ее причины, выявление влияния отдельных факторов дает важную информацию (например, о продолжительности жизни людей, доходах и расходах населения, финансовом положении предприятия и т.п.) для принятия научно обоснованных управленческих решений.

Средняя величина дает обобщающую характеристику признака изучаемой совокупности, но она не раскрывает строения совокупности, которое весьма существенно для ее познания. Средняя не показывает, как располагаются около нее варианты осредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина признака в двух совокупностях может быть одинаковой, но в одном случае все индивидуальные значения отличаются от нее мало, а в другом -- эти отличия велики, т.е. в одном случае вариация признака мала, а в другом -- велика, это имеет весьма важное значение для характеристики надежности средней величины.

Чем больше варианты отдельных единиц совокупности различаются между собой, тем больше они отличаются от своем средней, и наоборот, -- чем меньше варианты отличаются друг от друга, тем меньше они отличаются от средней, которая в тан ком случае будет более реально представлять всю совокупность. Вот почему ограничиваться вычислением одной средней в ряде случаев нельзя. Нужны и другие показатели, характеризующие отклонения отдельных значений от общей средней.

Это можно показать на таком примере. Предположим, что одинаковую работу выполняют две бригады, каждая -- из трех человек. Пусть количество деталей, шт., изготовленных за смену отдельными рабочими, составляло:

в первой бригаде -- 95, 100, 105 (= 100 шт.);

во второй бригаде -- 75, 100, 125 (= 100 шт.).

Средняя выработка на одного рабочего в обеих бригадах одинакова и составляет= = 100 шт., однако колеблемость выработки отдельных рабочих в первой бригаде значительно меньше, чем во второй.

Поэтому возникает необходимость измерять вариацию признака в совокупностях. Для этой цели в статистике применяют ряд обобщающих показателей.

  • Ш К показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, коэффициент вариации.
  • Ш Самым элементарным показателем вариации признака является размах вариации R, представляющий собой разность между максимальным и минимальным значениями признака:

В нашем примере размах вариации сменной выработки деталей составляет: в первой бригаде -- R1= 10 шт. (т.е. 105 -- 95); во второй бригаде -- R2= 50 шт. (т.е. 125 -- 75), что в 5 раз больше.

Это свидетельствует о том, что при численном равенстве средняя выработка первой бригады более «устойчива». Размах вариации может служить базой расчета возможных резервов роста выработки. Таких резервов больше у второй бригады, поскольку в случае достижения всеми рабочими максимальной для этой бригады выработки деталей, ею может быть изготовлено 375 шт., т.е. (3x125), а в первой - только 315 шт., т.е. (3 х 105).

Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. При изучении вариации нельзя ограничиваться только определением ее размаха. Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и даёт обобщённую характеристику. Простейший показатель такого типа - среднее линейное отклонение

Ш Среднее линейное отклонение d представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (при этом всегда предполагают, что среднюю вычитают из варианта: ().

Среднее линейное отклонение:

Для несгруппированных данных

где n - число членов ряда;

Для сгруппированных данных

где -- сумма частот вариационного ряда.

В формулах (5.18) и (5,19) разности в числителе взяты по модулю, (иначе в числителе всегда будет ноль -- алгебраическая сумма отклонений вариантов от их средней арифметической). Поэтому среднее линейное отклонение как меру вариации признака применяют в статистической практике редко (только в тех случаях, когда суммирование показателей без учета знаков имеет экономический смысл). С его помощью, например, анализируется состав работающих, ритмичность производства, оборот внешней торговли.

Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины, она вычисляется по формулам простой и взвешенной дисперсий (в зависимости от исходных данных):

§ простая дисперсия для несгруппированных данных

§ взвешенная дисперсия для вариационного ряда

Формула (5.21) применяется при наличии у вариантов своих весов (или частот вариационного ряда).

Формулу для расчета дисперсии (5.20) можно преобразовать, учитывая, что


т.е. дисперсия равна разности средней из квадратов вариантов и квадрата их средней.

Техника вычисления дисперсии по формулам (5.20), (5.21) достаточно сложна, а при больших значениях вариантов и частот может быть громоздкой.

Расчет можно упростить, используя свойства дисперсии (доказываемые в математической статистике). Приведем два из них:

первое -- если все значения признака уменьшить или увеличить на одну и ту же постоянную величину А, то дисперсия от этого не изменится;

второе -- если все значения признака уменьшить или увеличить в одно и то же число раз (i раз), то дисперсия соответственно уменьшится или увеличится в i2 раз. Используя второе свойство дисперсии, разделив все варианты на величину интервала, получим следующую формулу вычисления дисперсии в вариационных рядах с равными интервалами по способу моментов:

где -- дисперсия, исчисленная по способу моментов;

i - величина интервала;

новые (преобразованные) значения вариантов (А -- условный ноль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой);

Момент второго порядка;

Квадрат момента первого порядка.

Расчет дисперсии по формуле (5.23) менее трудоемок.

Дисперсия имеет большое значение в экономическом анализе. В математической статистике важную роль для характеристики качества статистических оценок играет их дисперсия. Ниже, в частности, будет показано разложение дисперсии на соответствующие элементы, позволяющие оценить влияние различных факторов, обуславливающих вариацию признака; использование дисперсии для построения показателей тесноты корреляционной связи при оценке результатов выборочных наблюдений.

  • Ш Среднее квадратическое отклонение равно корню квадратному из дисперсии:
    • § для несгруппированных данных

§ для вариационного ряда

Среднее квадратическое отклонение -- это обобщающая характеристика размеров вариации признака в совокупности; оно показывает, на сколько в среднем отклоняются конкретные варианты от их среднего значения; является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, поэтому экономически хорошо интерпретируется.

Обозначим: 1 -- наличие интересующего нас признака; 0 -- его отсутствие; р -- доля единиц, обладающих данным признаком; q -- доля единиц, не обладающих данным признаком; p + q =1. Исчислим среднее значение альтернативного признака и его дисперсию. Среднее значение альтернативного признака

вариация средний величина квадратический

так как р + q = 1.

Дисперсия альтернативного признака

Подставив в формулу дисперсии q = 1- р, получим

Таким образом, = pq -- дисперсия альтернативного признака равна произведению доли единиц, обладающих признаком, на долю единиц, не обладающих данным признаком.

Например, если на 10 000 человек населения района приходится 4500 мужчин и 5500 женщин, то

Дисперсия альтернативного признака = pq = 0,45*0,55 = 0,2475.

Предельное значение дисперсии альтернативного признака равно 0,25. Оно получается при р = 0,5.

Среднее квадратическое отклонение альтернативного признака

Если, например, 2% всех деталей бракованные (р = 0,02), то 98% -- годные (q = 0,98), тогда дисперсия доли брака

0,02- 0,98 = 0,0196.

Среднее квадратическое отклонение доли брака составит:

0,14, т.е. = 14%.

При вычислении средних величин и дисперсии для интервальных рядов распределения истинные значения признака заменяются центральными (серединными) значениями интервалов, которые отличаются от средней арифметической значений, включенных в интервал. Это приводит к появлению систематической погрешности при расчете дисперсии. В.Ф.Шеппард установил, что погрешность в расчете дисперсии, вызванная применением сгруппированных данных, составляет 1/12 квадрата величины интервала (т.е. i2/12) как в сторону занижения, так и в сторону завышения величины дисперсии.

Поправка Шеппарда должна применяться, если распределение близко к нормальному, относится к признаку с непрерывным характером вариации, построено по большому количеству исходных данных (n>500). Однако исходя из того, что в ряде случаев обе погрешности, действуя в противоположных направлениях, нейтрализуются и компенсируют друг друга, можно иногда отказаться от введения поправок.

Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее (количественно) совокупность и тем более типичной будет средняя величина.

В статистической практике часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. Для подобных сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией заработной платы, выраженной в рублях.

Для осуществления такого рода сравнений, а также сравнений колеблемости одного и того же признака в нескольких совокупностях с различным средним арифметическим используют относительный показатель вариации -- коэффициент вариации.

Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:

Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33 %.

Покажем расчет различными способами показателей вариации на примере данных о сменной выработке рабочих бригады, представленных интервальным рядом распределения (табл. 5.7).

Исчислим среднесменную выработку, шт.:

Рассчитаем дисперсию выработки по (5.21):

Найдем среднее квадратическое отклонение, шт.:

Определим коэффициент вариации, %:

Таким образом, данная бригада рабочих достаточно однородна по выработке, поскольку вариация признака составляет лишь 8%.

Теперь выполним расчет дисперсии по формуле (5.22) и по способу моментов по формуле (5.23), для расчета воспользуемся данными табл. 5.7, графы 8-11.

Расчет дисперсии по формуле (5.20):


Расчет дисперсии по способу моментов, см. формулу (5.21):

где А = 50 -- центральный вариант с наибольшей частотой;

i = 20 -- величина интервала данного ряда;

Таблица 5.7

Распределение рабочих по сменной выработке изделия А и расчетные значения для исчисления показателей вариации

Группы рабочих по сменной выработке изделий, шт.

Число рабочих

Середина интервала x

Расчетные значения

Как видим, наименее трудоемким является метод исчисления дисперсии способом моментов.