Сводка и группировка статистических данных

Упорядочение, систематизация и обобщение статистических данных проводятся на втором этапе статистического исследования в процессе сводки и группировки данных, полученных при статистическом наблюдении. Только надлежащая обработка статистического материала позволяет выявить сущность социально-экономических явлений, характерные черты и существенные особенности отдельных типов, обнаружить закономерности и тенденции их развития.

Сводка - представляет собой комплекс последовательных операций по обобщению конкретных, единичных фактов, образующих совокупность, для выявления характерных черт и явлений, а также закономерностей, присущих изучаемому явлению.

По объёму выполняемых работ сводки бывают:

Простая сводка - операция по подсчёту общих итогов по совокупности единиц наблюдения.

Сложная сводка - представляет собой комплекс операций, включающих группировку единиц совокупности, подсчёт итогов по каждой группе и по всему объекту в целом и представление результатов группировки и сводки в виде статистических таблиц.

По форме обработки материала сводка бывает:

· Децентрализованная - при которой разработка материала производится последовательными этапами.

· Централизованная - при которой весь первичный материал поступает в одну организацию, где подвергается обработке от начала до конца.

По технике выполнения сводка бывает:

· Механизированная - при которой все операции осуществляются с помощью электронно-вычислительных машин.

· Ручная - при которой все основные операции осуществляются вручную.

В соответствии с сущностью статистической сводки как второго этапа статистического исследования задачи ее можно сформулировать как получение обобщающих показателей для информационно-справочных и аналитических целей. Сводка массовых статистических данных осуществляется по заранее разработанным программе и плану. В процессе разработки программы

определяются подлежащее и сказуемое сводки.

Подлежащее-это объект исследования, расчлененный на группы и подгруппы.

Сказуемое - показатели, которые характеризуют подлежащее сводки. Программа сводки определяется задачами статистического исследования.

Однако можно выделить общие вопросы, решаемые в программе групповой сводки:

выделение групп, на которые должна быть расчленена совокупность в зависимости от задач исследования и сущности изучаемых явлений;

определение перечня группировочных признаков, позволяющих отнести отдельные единицы изучаемой совокупности в ту или иную группу в пределах выделенной системы групп;

установление границ каждой группы при группировке по количественным признакам;

установление системы показателей для количественной и качественной характеристики выделенных групп.

Статистическая сводка выполняется по заранее продуманному плану. В плане сводки решаются вопросы о способах проведения работы по обобщению информации - вручную или механизированным способом, о последовательности отдельных операций сводки, выполняемых в децентрализованном и централизованном порядке. В плане статистической сводки устанавливаются сроки выполнения каждого этапа и сводки в целом, а также способы изложения результатов сводки. Это могут быть ряды распределения, статистические таблицы и статистические графики.

Группировкой называют разделение множества единиц изучаемой совокупности на группы по определённым существенным для них признакам.

Обобщение статистических показателей, собранных в ходе статистического наблюдения, производится при помощи сводки и группировки.

Сводка представляет собой комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

Группировка - это распределение множества единиц исследуемой совокупности по группам в соответствии с существенным для данной группы признаком. Метод группировки позволяет обеспечивать первичное обобщение данных, представление их в более упорядоченном виде. Благодаря группировке можно соотнести сводные показатели по совокупности в целом со сводными показателями по группам. Появляется возможность сравнивать, анализировать причины различий между группами, изучать взаимосвязи между признаками.

Группировка позволяет делать вывод о структуре совокупности и о роли отдельных групп этой совокупности. Именно группировка формирует основу для последующей сводки и анализа данных.

Признаки, по которым проводится группировка, называют группировочными признаками. Группировочный признак иногда называют основанием группировки. Правильный выбор существенного группировочного признака дает возможность сделать научно обоснованные выводы по результатам статистического исследования.

После определения группировочного признака и границ групп строится ряд распределения.

Рядом распределения в статистике называется ряд цифровых показателей, представляющих распределение единиц совокупности по одному существенному признаку, разновидности которого расположены в определенной последовательности.

Если для построения группировки используется только один признак, то такую группировку называются простой , если группировка проводится по нескольким признакам, ее называют сложной .

Процедура определения оптимального числа групп основана на применении формулы Стерджесса:

n - число групп;

N - число единиц совокупности.

Из формулы видно, что выбор числа групп зависит от объема совокупности. Если групп оказывается много, и они включают малое число единиц, то групповые показатели могут стать ненадежными.

Определение числа групп тесно связано с понятием величина интервала : чем больше число групп, тем меньше величина интервала, и наоборот.

Интервал - разница между максимальным и минимальным значениями признака в каждой группе.

Каждый интервал имеет нижнюю (наименьшее значение признака) и верхнюю (наибольшее значение признака) границы или одну из них. Поэтому величина интервала представляет собой разность между верхней и нижней границами интервала.

Группировку с равными интервалами строят тогда, когда исследуются количественные различия в величине признака внутри групп одинакового качества, а также если распределение носит более или менее равномерный характер.

Величину равного интервала можно вычислить по формуле:

h - величина равного интервала;

x max , x min - наибольшее и наименьшее значения признака в совокупности;

n - число групп.

Если величина равного интервала рассчитывается по данной формуле, то следует знаменатель предварительно округлить до целого числа (как правило, всегда большего), так как количество групп не может быть дробным числом.

Виды группировок. Статистическая таблица

Виды группировок зависят от целей и задач, которые они выполняют. С помощью метода статистических группировок выделяют качественно однородные совокупности, изучают структуры совокупности и изменения, происходящие в них, а также решают задачи по исследованию существующих связей и зависимостей.

С известной мерой условности для выполнения этих задач группировки соответственно делят на типологические, структурные и аналитические.

Метод типологической группировки заключается в выявлении в качественно разнородной совокупности однородных групп. При этом очень важно правильно отобрать группировочный признак, который поможет идентифицировать выбранный тип. Типологические группировки широко применяются в исследовании социально-экономических явлений.

Метод структурной группировки есть разделение однородной совокупности на группы по тому или иному варьирующему группировочному признаку. На основе структурных изменений изучаются закономерности общественных явлений.

Метод аналитической группировки заключается в исследовании взаимосвязей между факторными признаками в качественно однородной совокупности. С помощью аналитических группировок удается выявлять признаки, которые могут выступать или причиной, или следствием того или иного явления. В аналитических группировках чаще всего используются неравные интервалы.

Результаты группировочного материала оформляются в виде таблиц, где он излагается в наглядно-рациональной форме. Не всякая таблица может быть статистической. Табличные формы календарей, тестовых и опросных листов, таблица умножения не являются статистическими.

Статистическая таблица - это цифровое выражение итоговой характеристики всей наблюдаемой совокупности или ее составных частей по одному или нескольким существенным признакам. Статистическая таблица содержит два элемента: подлежащее и сказуемое.

Различают простые, групповые и комбинационные таблицы.

В простых таблицах , как правило, содержится справочный материал, где дается перечень групп или единиц, составляющих объект изучения. При этом части подлежащего не являются группами одинакового качества, отсутствует систематизация изучаемых единиц. Сказуемое этих таблиц содержит абсолютные величины, отражающие объемы изучаемых процессов.

Групповые и комбинационные таблицы предназначены для научных целей, где, в отличие от простых таблиц, в сказуемом - средние и относительные величины на основе абсолютных величин.

Групповая таблица - это таблица, где статистическая совокупность разбивается на отдельные группы по какому-либо одному существенному признаку, при этом каждая группа характеризуется рядом показателей.

Комбинационная таблица - это таблица, где подлежащее представляет собой группировку единиц совокупности по двум и более признакам, которые распределяются на группы сначала по одному признаку, а затем на подгруппы по другому признаку внутри каждой из уже выделенных групп. Комбинационная таблица устанавливает существенную связь между факторами группировки. Такого рода статистические таблицы позволяют осуществить всесторонний анализ, но они менее наглядны.

При составлении таблиц необходимо соблюдать общие правила:

таблица должна быть легко обозримой;

общий заголовок должен кратко выражать основное содержание;

наличие строк «общих итогов»;

наличие нумерации строк, которые заполняются данными;

соблюдение правила округления чисел.

На основе информации, собранной в ходе статистического наблюдения, как правило, нельзя непосредственно выявить и охарактеризовать закономерности социально-экономических явлений. Это связано с тем, что наблюдение дает сведения по каждой единице исследуемого объекта. Полученные данные не являются обобщающими показателями. С их помощью нельзя сделать выводы в целом об объекте без предварительной обработки данных.

Поэтому цель следующего этапа статистического исследования - систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих статистических показателей.

Сводка представляет собой комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

Таким образом, если при статистическом наблюдении собирают данные о каждой единице объекта, то результатом сводки являются подробные данные, отражающие в целом всю совокупность.

Статистическая сводка должна вестись на основе предварительного теоретического анализа явлений и процессов. Это необходимо для того, чтобы во время сводки не потерять информацию об исследуемом явлении; кроме того, все статистические итоги должны отражать характерные черты объекта.

Сводка может быть различной, в зависимости от ряда характеризующих ее признаков.

По глубине обработки данных сводка бывает простая и сложная.Простой сводкой называется операция по подсчету общих итогов по совокупности единиц наблюдения или общего объема изучаемого показателя. Например, чтобы получить общую численность студентов вузов в России, достаточно сложить данные по всем высшим учебным заведениям страны.

Сложная сводка представляет собой комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление результатов группировки и сводки в виде статистических таблиц.

Проведению сводки предшествует разработка ее программы, которая состоит из следующих этапов:

    выбор группировочных признаков;

    определение порядка формирования групп;

    разработка системы статистических показателей для характеристики групп и объекта в целом;

    разработка системы макетов статистических таблиц, в которых должны быть представлены результаты сводки.

По форме обработки данных сводка бывает децентрализованная и централизованная.

При децентрализованной сводке (именно она используется, как правило, при обработке статистической отчетности) разработка материала производится последовательными этапами.

При централизованной сводке весь первичный материал поступает в одну организацию, где и подвергается обработке от начала и до конца. Централизованная сводка обычно используется для обработки материалов единовременных статистических обследований.

По технике исполнения сводка может быть компьютерной и ручной.

Компьютерная сводка - это способ выполнения сводки статистических данных, при котором все операции осуществляются с использованием компьютеров и программных продуктов, позволяющих обработать любые объемы информации с различной степенью детализации. Приручной сводке все основные операции (подсчет групповых и общих итогов) осуществляются вручную.

Для проведения сводки составляется план, в котором излагаются организационные вопросы: кем и когда будут осуществляться все операции, порядок ее проведения, состав сведений, подлежащих опубликованию в периодической печати.

Сводка представляет собой комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

Результатом сводки являются подробные данные, отражающие в целом всю совокупность.

По глубине обработки материала сводка бывает простая и сложная.

Простой сводкой называется операция по подсчету общих итогов по совокупности единиц наблюдения.

Сложная сводка – комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление результатов группировки и сводки в виде статистических таблиц.

Разработка программы сводки состоит из следующих этапов: выбор группировочных признаков; определение порядка формирования групп; разработка системы статистических показателей для характеристики групп и объекта в целом; разработка системы макетов статистических таблиц, в которых должны быть представлены результаты сводки.

По форме обработки материала сводка бывает децентрализованная (обработка материала производится этапами: например, отчеты предприятий сводятся статистическими органами субъектов РФ, а уже итоги по региону поступают в Госкомстат России) и централизованная (весь первичный материал поступает в одну организацию, где и подвергается обработке от начала до конца).

Группировкой называется расчленение множества единиц изучаемой совокупности на группы по определенным существенным для них признакам.

Статистические группировки по задачам, решаемым с их помощью, делятся на: типологические, структурные и аналитические.

Типологическая группировка – это разделение исследуемой качественно разнородной совокупности на классы, социально-экономические типы, однородные группы единиц в соответствии с правилами научной группировки. Примером является группировка промышленных предприятий по формам собственности.

При проведении типологической группировки основное внимание должно быть уделено идентификации типов социально-экономических явлений.

Структурной называется группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-либо варьирующему признаку.

Аналитическая группировка выявляет взаимосвязи между изучаемыми явлениями и их признаками.

Процесс построения группировок состоит из следующих этапов.

1. Определение группировочного признака.

Группировочным признаком называется признак, по которому проводится разбивка единиц совокупности на отдельные группы. Его часто называют основанием группировки.

В основание группировки могут быть положены как количественные, так и качественные признаки. Первые имеют числовое выражение (объем торгов, возраст человека и т.д.), а вторые отражают состояние единицы совокупности (пол человека, национальность, и т.д.)


Всю совокупность признаков можно разделить на две группы: факторные и результативные. Факторными называются признаки, под воздействием которых изменяются другие признаки и образуют группу результативных признаков.

2. Определение количества групп.

Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности. Степени вариации признака.

При построении группировки по качественному признаку групп будет столько, сколько имеется градаций, видов, состояний у этого признака (пол – 2, регионов России – 89 и т.д.).

Если группировка проводится по количественному признаку, то

необходимо обратить внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.

Чем больше колеблемость группировочного признака, тем больше следует образовать групп.

Если распределение признака условно равномерно, то для определения количества групп используется формула Стерджесса:

Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному.

3. Определение интервала группировки.

Интервал – значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей называется наименьшее значение признака в интервале, а верхней – наибольшее значение признака в нем. Величина интервала – разность между верхней и нижней границами интервала.

Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами .

Величина равного интервала определяется по следующей формуле:

Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения (крайние точки).

Полученная величина является шагом интервала.

Открытые интервалы – те, у которых указана только одна граница.

Закрытые интервалы – те, у которых обозначены обе границы.

Ширина открытого интервала принимается равной ширине соседнего с ним закрытого интервала.

Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку.

В зависимости от признака, положенного в основу группировки различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды, построенные по качественным признакам.

Вариационными рядами называют ряды распределения, построенные по количественному признаку. Каждый вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду, т.е. конкретное значение варьирующего признака. Частоты – это численности отдельных вариантов или каждой группы вариационного ряда, показывающие, как часто встречается та или иная варианта в ряду. Частостями называют частоты, выраженные в процентах или долях единицы.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды. В случае дискретной вариации величина количественного признака принимает только целые значения. В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения.

Ряды распределения анализируются с помощью графического изображения.

Полигон используется при изображении дискретных вариационных рядов. При этом, на оси абсцисс откладываются значения признака, а на оси ординат – частоты.

Гистограмма применяется для изображения интервальных рядов. При этом, на оси абсцисс откладываются интервалы признака, на оси ординат – частоты. В случае, если интервальный ряд построен с неравными интервалами, то вместо частот на ось ординат наносится плотность распределения признака в соответствующих интервалах.

Плотность распределения – это частота, рассчитанная на единицу ширины интервала.

Для изображения вариационных рядов может также использоваться кумулятивная кривая. При помощи кумуляты (кривая сумм) изображается ряд накопленных частот, которые определяются последовательным суммированием частот по группам и показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение. На ось абсцисс наносятся значения признака, а на оси ординат откладываются накопленные частоты. Если при графическом изображении кумуляты поменять местами оси, то в результате получится график, который называется огива.

Вторичная группировка – операция по образованию новых групп на основе ранее осуществленной группировки.

Применяют два способа для образования новых групп:

1. способ укрупнения интервалов – объединение первоначальных интервалов – используется в случае перехода от более мелких интервалов к более крупным, а также в случаях, когда границы новых и старых интервалов совпадают.

2. способ долевой перегруппировки – создание новых интервалов на основе закрепления за каждой группой определенной доли единиц совокупности.

Статистической называется таблица, которая содержит числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой экономического анализа.

По логическому содержанию таблица представляет собой статистическое предложение. Подлежащим статистической таблицы называется объект, характеризующийся цифрами. Обычно подлежащее располагается в левой части таблицы, в наименовании

строк. Сказуемое статистической таблицы образует система показателей, которыми характеризуется подлежащее (объект изучения). Сказуемое формирует верхние заголовки и составляет содержание граф.

По характеру подлежащего различают простые и сложные таблицы. Простые таблицы бывают монографические и перечневые. Сложные таблицы, в свою очередь, делятся на групповые и комбинационные.


Если в подлежащем представлена только одна группа или один объект, то таблица называется простой монографической . Если в подлежащем представлен несгруппированный перечень единиц, то таблица называется простой перечневой .

Если в подлежащем представлена группировка единиц совокупности по одному признаку, то таблица называется сложной групповой . Если же в подлежащем представлена группировка единиц по нескольким признакам, то таблица называется сложной комбинационной .

По разработке сказуемого различают таблицы с простой и сложной разработкой сказуемого. При простой разработке сказуемого показатель, определяющий его, не подразделяется на подгруппы, и итоговые значения получаются путем простого суммирования значений по каждому признаку отдельно, независимо друг от друга.

Сложная разработка сказуемого предполагает деление признака на формирующие его подгруппы.

Существует множество видов графических изображений. Классификация видов графиков представлена на рис. 3.1.

Сводка – представляет собой комплекс последовательных операций по обобщению конкретных единичных фактов, образующих статистическую совокупность. Для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Сводка в зависимости от ряда характеризующих её признаков может быть:

По глубине, обработке исходной информации сводка бывает простая и сложная. Простая сводка – это операция по подсчёту общих итогах по совокупности единиц наблюдения или общего объёма статистических показателей. Сложная сводка представляет собой комплекс мер, включающих группировку единиц наблюдения, подсчёт итогов по каждой группе и по всему объекту и представление результатов группировки и сводки в виде статистических таблиц. Сводка, как этап статистического наблюдения включает следующие этапы:

а) выбор группировочных признаков;

б) порядок определения числа групп;

в) разработка системы статистических показателей для характеристики отдельных групп и объекта в целом;

По форме обработки, сводка может быть децентрализованной и централизованной. При децентрализованной сводке разработка материала производится последовательными этапами. При централизованной сводке вся первичная информация поступает в одну организацию, которая производит расчёт.

Группировки – группировкой называется метод разделения множества единиц статистической совокупности на группы по существенным для них признакам (в результате получаются качественно-однородные группы). В зависимости от целей и задач исследования существуют следующие виды группировок:

Типологические (разбиение исследуемой совокупности, качественно разнородной на различные классы, типы и виды. Под однородностью единиц совокупности понимается подчинение всех единиц совокупности одному закону развития). Данный вид группировок даёт возможность выделить в составе массового явления те части, которые однородны по качеству и условиям развития. При построении типологической группировки особое внимание уделяется идентификация типов и выбору группировочных признаков.

Группировочный признак – признак на основе которого происходит выделение различных групп (группировка производится только по существенным признакам и признакам следствия).

Выделение групп и подгрупп происходит на основе определения класса признаков. Либо качественные, либо количественные;

Структурная (делит однородную в качественном отношении совокупность на основе определённых или существенных признаков на группы, характеризующие состав групп или и структуру. В основу структурной группировки могут быть положены как качественные, так и количественные признаки. Структурная группировка по атрибутивному признаку отличаются друг от друга по характеру признака. Число групп определяется числом градаций признака);

Аналитическая (выявляет взаимосвязи между изучаемыми социально-экономическими явлениями и признаками их характеризующего. Особенностью аналитической группировки является то, что в основу группировки положен факторный признак. Аналитические нруппировки по числу признаков могут быть простыми, если 1 группировочный признак в основе, или сложный, если в основе больше 1-го группировочного признака).

Число групп на которое необходимо разделить статистическую совокупность определяет на основе использования формулы Стерджесса - n=1+3,322 lgN (n – число групп, на которое предполагается разбить статистическую совокупность, N – число единиц статистической совокупности).

Разбиение всех совокупностей происходит на основе образования интервалов.