Представление статистической информации. Графическое представление статистической информации. Понятие о статистике. Предмет и метод статистики

ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ СТАТИСТИЧЕСКИХ ДАННЫХ, метод наглядного изображения и обобщения данных о социально-экономических явлениях посредством геометрических образов, рисунков или схематических географических карт и пояснительных надписей к ним. Графическое представление статистических данных отчётливо и наглядно отображает взаимосвязь между явлениями и процессами общественной жизни, основные тенденции их развития, степень их распространения в пространстве; позволяет увидеть как всю совокупность явлений в целом, так и отдельные его части.

Для графического представления статистических данных используются разнообразные виды статистических графиков. Каждый график состоит из графического образа и вспомогательных элементов. К ним относятся: экспликация графика, пространственные ориентиры, масштабные ориентиры, поле графика. Вспомогательные элементы делают возможным чтение графика, его понимание и использование. Графики можно классифицировать по ряду признаков: в зависимости от формы графического образа они могут быть точечными, линейными, плоскостными, пространственными и фигурными. По способу построения графики делятся на диаграммы и статистические карты.

Наиболее распространённый способ графических изображений - диаграмма. Это чертёж, на котором статистические данные представлены как геометрические фигуры или знаки, а территория, к которой относятся эти данные, указана только словесно. Если диаграмма наложена на географическую карту или на план территории, к которой относятся статистические данные, то график называется картодиаграммой. Если же статистические данные изображены путём штриховки или раскраски соответствующей территории на географической карте или плане, то график называется картограммой.

Для сравнения одноимённых статистических данных, характеризующих разные объекты или территории, могут быть использованы различные виды диаграмм. Наиболее наглядны столбиковые диаграммы, на которых статистические данные изображаются в виде вытянутых по вертикали прямоугольников. Их наглядность достигается сравнением высоты столбиков (рис. 1).

Если базовая линия расположена вертикально, а столбики горизонтально, то диаграмма называется полосовой (ленточной). На рисунке 2 приведена полосовая диаграмма сравнения, характеризующая территорию земного шара.

Диаграммы, предназначенные для популяризации, иногда строятся в виде стандартных фигур - рисунков, характерных для изображаемых статистических данных, что делает диаграмму более выразительной, привлекает к ней внимание. Такие диаграммы называются фигурными или изобразительными (рис. 3).

Большую группу показательных графиков составляют структурные диаграммы. Метод графического изображения структуры статистических данных заключается в составлении структурных круговых или секторных диаграмм (рис. 4).

Для изображения и анализа развития явлений во времени строятся диаграммы динамики: столбиковые, ленточные, квадратные, круговые, линейные, радиальные и др. Выбор вида диаграммы зависит от особенностей исходных данных, цели исследования. Например, если имеется ряд динамики с несколько неравноотстоящими уровнями во времени (1913, 1940, 1950, 1980, 2000, 2005), то используют столбиковые, квадратные или круговые диаграммы. Они зрительно впечатляют, хорошо запоминаются, но не пригодны для изображения большого числа уровней. Если число уровней в ряду динамики велико, то применяются линейные диаграммы, которые воспроизводят процесс развития в виде непрерывной ломаной линии (рис. 5).

Нередко на одном линейном графике приводится несколько кривых, дающих сравнительную характеристику динамики различных показателей или одного и того же показателя в разных странах (рис. 6).

Для отображения зависимости одного показателя от другого строится диаграмма взаимосвязи. Один показатель принимается за Х, а другой за Y (т. е. функцию от Х). Строится прямоугольная система координат с масштабами для показателей, и в ней вычерчивается график (рис. 7).

Развитие вычислительной техники и прикладного программного обеспечения сделало возможным создание географических информационных систем (ГИС), представляющих качественно новый этап в графическом представлении информации. ГИС обеспечивают сбор, хранение, обработку, доступ, отображение и распространение пространственно-координированных данных; включают большое количество графических и тематических баз данных в соединении с модельными и расчётными функциями, позволяющими представлять информацию в пространственном (картографическом) виде, получать в различном масштабе многослойные электронные карты региона. По территориальному охвату различают глобальные, субконтинентальные, государственные, региональные и локальные виды ГИС. Предметная ориентация ГИС определяется решаемыми с её помощью задачами, среди которых могут быть инвентаризация ресурсов, анализ, оценка, мониторинг, управление и планирование.

Лит.: Герчук Я. П. Графические методы в статистике. М., 1968; Теория статистики / Под редакцией Р. А. Шмойловой. 4-е изд. М., 2005. С. 150-83.

1. Понятие статистики

Статистика одна из древнейших отраслей знаний, возникшая на базе хозяйственного учета. Ее возникновение связано с потребностями общества в различного рода сведениях.

Полагают, что термин статистика произошел от латинских слов stato (государство) и status (положение, состояние).

Под статистикой в широком смысле понимается наука, которая изучает с количественной стороны массовые явления и их закономерности.

Общая теория статистики – методологическая наука, наука о методе, который применим для выявления закономерностей в любой области, где выводы строятся на основе массового наблюдения, где имеет место вариация признака у единичных элементов совокупности, где общие закономерности могут проявляться только через взаимопогашение случайностей у отдельных единиц.

2. Статистика как наука

2.1 Пути развития статистики

Развитие статистики как науки шло по двум направлениям:

1-ое направление возникло в Германии и известно как государствоведение или описательная школа. Представители этой школы основной своей задачей считали описание достопримечательностей государства без анализа закономерностей и взаимосвязей между ними. Основателем описательной школы был немецкий ученый Герман Конринг.

2-ое направление развития статистики возникло в Англии, и оно известно под названием политическая арифметика. Представители этой школы своей главной задачей считали выявление на основе большого числа наблюдений различных закономерностей и взаимосвязей изучаемых явлений. Основателем школы был Уильям Петти.

2.2 Предмет статистики и основные понятия

Обобщил теоретические сведения из государствоведения и учет по практическим работам представителей школы политической арифметики бельгийский ученый математик Адольф Кетие. Он же дал определение предмета статистики – это массовые явления, связанные с жизнью общества и человека. Он также увидел в статистике орудие социального познания.

Отличительные черты массовых явлений:

1. Каждый элемент множества обладает как индивидуальными или отличительными признаками, так и общими или сходными.

2. Характеристики одного из элементов массового явления не могут быть получены на основе характеристик других элементов.

Определение: Изучаемые статистикой массовые явления в виде множества однокачественных единиц с отличающимися индивидуальными признаками, называются статистическими совокупностями. Исходя, из этого можно сказать, что предметом статистики являются различные статистические совокупности, исследования которых связано с количественной характеристикой и выявлением присущих им закономерностей. Статистическая совокупность одно из главных понятий статистической науки. С ним связаны и такие понятия как: единица совокупности. Определение: Элементы, множество которых образует изучаемую совокупность, называется единицами. Признаки единиц совокупности:

Каждая единица совокупности может быть охарактеризована разного рода качественными и количественными признаками.

Если определенный признак имеет разные значения у определенных единиц совокупности, то это называется вариацией. Определение: Закономерность, выявленная на основе массового наблюдения, т.е. проявившаяся в большой массе явлений через преодоление свойственной ее единичным элементом случайности, называется статистической закономерностью. Основная задача статистики – это абстрагироваться от случайного и выявить типичное, закономерное.

Существует три способа выявления закономерностей:

1. логический;

2. эмпирический;

3. на основе закона больших чисел.


2.3 Метод статистики

Массовое наблюдение, группировка и сводка его результатов, вычисление и анализ обобщающих показателей. Все это вместе и дает метод статистики.

3.Статистическое наблюдение

3.1 Статистическое наблюдение, как этап статистического исследования. План статистического наблюдения

Статистическое наблюдение является первым этапом статистического исследования.

Определение: Статистическое наблюдение – это научно организованный сбор массовых данных об исследуемых процессах и явлениях, который осуществляется по заранее разработанной программе.

Требования к массовым данным:

Статистические данные должны быть достаточно полными. Всякое явление обладает многообразными взаимосвязанными признаками. Полнота данных обеспечивает охват наиболее существенных признаков, необходимых для получения объективных выводов. Если данные статистического наблюдения относятся к различным отрезкам времени территориям, то необходимо обеспечить их сопоставимость. Под сопоставимостью статистических сведений подразумевается единообразие их единиц измерения, стоимостных оценок, границ административных территорий, временных характеристик и т.д. Прежде чем начать статистическое наблюдение, требуется установить порядок его проведения. Для этого разрабатывается подробный план наблюдения, который содержит:

1. программно-методологическую часть:

2. организационную часть.

1. Программно-методологические вопросы плана наблюдения.

В этой части плана должны быть определены:

а) цель и задачи наблюдения:

б) объект и единицы, подлежащие обследованию;

в) программа наблюдения.

Программа наблюдения представляет собой перечень вопросов, на которые предполагается получить ответы в ходе обследования. Программа должна отличаться полнотой сведений и широтой охвата. Формулировки вопросов должны быть по возможности краткими и ясными, исключать неточность и расплывчатость в ответах, при необходимости для единого толкования и понимания вопросов дается подсказка. В программной методологической части наблюдения указывается конкретный инструментарий статистического исследования, т.е. бланки, в которых должны содержаться ответы на сформулированные вопросы, а так же инструкции по их заполнению.

2. Организационные вопросы плана наблюдения.

Для успешной организации наблюдения и полноты охвата совокупности разрабатывается организационный план наблюдения.

В нем указывается:

а) субъект наблюдения:

б) сроки и место проведения исследования;

в) организация сбора данных и технологии их обработки.


3.2 Формы и виды статистического наблюдения

Формы, виды и способы статистического наблюдения.

Организационные формы статистического наблюдения

Виды статистического наблюдения

Способы статистического наблюдения

по времени регистрации фактов

по охвату единиц совокупности

1. Статистическая отчетность.

2. Специально организованное наблюдение.

3. Регистровое наблюдение.

1. Текущее или непрерывное.

2. Прерывное:

а) периодическое;

б) единовременное.

1. Сплошное.

2. Несплошное:

а) выборочное;

б) основного массива;

в)монографическое.


1. Непосредственное.

2. Документальное.

а) экспедиционный;

б) саморегистрации;

в) корреспондентский;

г) анкетный;

д) явочный.

В отечественной статистике используются три организационные формы (типы) статистического наблюдения:

1. Отчетность – это основная форма статистического наблюдения, с помощью которой статистические органы в определенные сроки получают от предприятий, учреждений и организаций необходимые данные в виде установленных в законном порядке отчетных документов, скрепляемых подписями лиц, ответственных за их предоставление и достоверность собираемых сведений.

Делится: телефонную, телетайпную, почтовую.

2. Специально организованное наблюдение проводится с целью получения сведений, отсутствующих в отчетности, или для проверки ее данных. Практическая статистика проводит переписи населения, материальных ресурсов, многолетних насаждений, неустановленного оборудования, строек незавершенного строительства оборудования и др. Кроме переписей статистика проводит и другие специально организованные наблюдения, в частности бюджетные обследования, которые характеризуют структуру потребительских расходов и доходов семей.

3. Регистровое наблюдение – это форма непрерывного статистического наблюдения за долговременными процессами, имеющими фиксированное начало, стадию развития и фиксированный конец. Оно основано на ведении статистического регистра. Регистр представляет собой систему, постоянно следящую за состоянием единицы наблюдения и оценивающую силу воздействия различных факторов на изучаемые показатели.

В практике статистики различают регистры населения и регистры предприятий.

Виды статистического наблюдения по времени регистрации фактов

Текущее наблюдение ведется систематически, по мере возникновения явлений. При периодическом наблюдении регистрация исследуемых явлений проводится через определенные, обычно одинаковые промежутки времени. Единовременное наблюдение проводится один раз для решения какой-либо задачи или повторяется эпизодически через определенные периоды времени, по мере надобности.

Виды статистического наблюдения по охвату единиц совокупности

При сплошном наблюдении регистрируются все без исключения единицы совокупности. При выборочном наблюдении обследуется отобранная в случайном порядке часть единиц совокупности с целью характеристики всей совокупности.

При несовершенно сплошном наблюдении (основного массива) обследованию подвергается основная часть совокупности и сознательно исключается некоторая часть, о которой заведомо известно, что она не играет большой роли в характеристике всей совокупности. Монографическое наблюдение состоит в подробном описании небольшого числа или отдельных типичных единиц совокупности.

Способы регистрации фактов или способы получения первичного материала

Непосредственное наблюдение осуществляется путем регистрации изучаемых единиц и их признаков специально выделенными лицами на основе непосредственного осмотра, подсчета, взвешивания, показания приборов и т.д. Документальное наблюдение основано на использовании в качестве источника статистических сведений различных документов первичного учета предприятий, учреждений, организаций. При опросе статистические материалы получают путем регистрации ответов, которые дают опрашиваемые лица. Экспедиционный способ заключается в том, что специально подготовленные регистраторы путем опроса заполняют формулы, одновременно контролируя привольность получаемых сведений. При саморегистрации или самоисчислении работники статистических органов раздают опросные бланки опрашиваемым лицам, инструктируют их, а затем собирают заполненные формуляры, контролируя полноту и правильность полученных сведений. Анкетный опрос состоит в том, что разработанная анкета рассылается кругу лиц и после заполнения возвращается органам, проводящим наблюдения. Корреспондентский заключается в организации статистическими органами специальной сети корреспондентов из лиц, проживающих на местах, которые проводят наблюдение согласно разработанному бланку и инструкции и сообщают сведения статистическим органам. Явочный предусматривает представление сведений в органы, ведущие наблюдение в явочном порядке.

4. Сводка и группировка статистических данных

4.1 Задачи и виды статистической сводки


Определение: Сводка представляет собой комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

Таким образом, если при статистическом наблюдении собирают данные о каждой единице объекта, то результатом сводки являются подробные данные, отражающие в целом свою совокупность.

Статистическая сводка должна вестись на основе предварительного теоретического анализа явлений и процессов.

По глубине обработки материала сводка бывает простая и сложная.

Простой сводкой называется операция по подсчету общих итогов по совокупности единиц наблюдения.

Сложная сводка представляет собой комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление результатов группировки и сводки в виде статистических таблиц.

Проведение сводки предшествует разработка ее программы, которая состоит из следующих этапов:

Выбор группировочных признаков;

Определение порядка формирования групп;

Разработка системы статистических показателей для характеристики групп и объекта в целом;

Разработка макетов статистических таблиц, в которых должны быть представлены результаты сводки.

По форме обработки материала сводка бывает децентрализованная и централизованная.

При децентрализованной сводке (именно она используется, как правило, при обработке статистической отчетности) разработка материала проводится последовательными этапами. Так, отчеты предприятий сводятся статистическими органами субъектов Российской Федерации, а уже итоги по региону поступают в Госкомстат России, и там определяются показатели в целом по народному хозяйству страны. При централизованной сводке весь первичный материал поступает в одну организацию, где и подвергается обработке от начала и до конца. Централизованная сводка обычно используется для обработки материалов единовременных статистических обследований. По техники выполнения статистическая сводка подразделяется на механизированную и ручную.

Для проведения сводки составляется план, в котором излагаются организационные вопросы: кем и когда будут осуществляться все операции, порядок ее проведения, состав сведений, подлежащих опубликованию в периодической печати.


4.2 Метод группировки в статистике

Статистическая группировка – это расчленение всей совокупности материалов на группы и подгруппы по существенным признакам для всестороннего изучения явлений и процессов общественной жизни.

Признак, положенный в основу называется группировочный.

Для построения групп в статистике используют в основном два вида признаков:

1. количественные (численные);

2. качественные (атрибутивные).

Группировка по одному признаку называется простой , а группировки по двум и более признакам взятыми в сочетании друг с другом, называются комбинационными (сложными).

После того, как выбран группировочный признак, производится выбор числа групп. Если в основу группировки положен качественный признак, то вопрос о числе групп решается автоматически – их будет столько, сколько качественных состояний принимает изучаемая совокупность (ее единицы).

При группировке по количественным признакам возникает вопрос об определении интервалов группировки. Величиной интервала называется разность между максимальным и минимальным значением признака в каждой группе. В зависимости от характера распределений единиц совокупности по данному признаку интервалы могут быть по величине разными и неравными. Если распределение признака в границах его вариации достаточно равномерно, то диапазон колебаний признака разбивают на равные интервалы, длину которых определяют по формуле:

где X mak и X min соответственно максимальное и минимальное значение признака в данной совокупности,

n – число образуемых групп.

Число групп может быть заданно на основе предыдущих исследований. В том случае, если вопрос о числе групп приходиться решать самостоятельно, то можно использовать формулу Стерджесса для определения оптимального числа групп:



n – число групп

N – число единиц совокупности

Различают закрытые интервалы, в которых дана верхняя и нижняя граница, и открытые, в которых имеется только одна граница: верхняя или нижняя.

Статистические группировки по задачам, решаемым с их помощью, делятся на:

Типологическая группировка – это разделение исследуемой качественно разнородной совокупности на классы, социально-экономические типы, однородные группы единиц в соответствии с правилами научной группировки.

Структурной называется группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-либо варьирующему признаку.

Аналитической называется группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками.


4.3 Ряды распределения в статистике

Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку.

В зависимости от признака положенного в основу образования ряда распределения, различают:

1. Атрибутивные – ряды распределения, построенные по качественным признакам.

2. Вариационные – ряды распределения, построенные по количественному признаку. Любой вариационный признак состоит из 2-х элементов: вариантов и частот.

Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду.

Частоты – это численности отдельных вариантов или каждой группы вариационного ряда.

Частостями называют частоты, выраженные в долях единицы или в процентах к итогу.

В зависимости от характера вариации признака различают:

1. Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку (величина количественного признака принимает только целые значения).

2. Интервальный вариационный ряд – он целесообразен при непрерывной вариации признака, а также, если дискретная вариация проявляется в широких пределах, т.е. число вариантов дискретного признака достаточно велико.

Удобнее всего ряды распределения анализировать при помощи их угарического изображения.

Полигон используется при изображении дискретных вариационных рядов.

Гистограмма принимается для изображения интервального вариационного ряда.

5. Статистические показатели

Статистический показатель представляет собой количественную характеристику социально-экономических явлений и процессов в условиях качественной определенности. Качественная определенность показателя заключается в том, что он непосредственно связан с внутренним содержанием изучаемого явления или процесса, его сущностью.

Как правило, изучаемые статистикой процессы и явления достаточно сложны, и их сущность не может быть отражена посредством одного отдельно взятого показателя. В таких случаях используется система статистических показателей (совокупность взаимосвязанных показателей, имеющая одноуровневую или многоуровневую структуру и нацеленная на решение конкретной статистической задачи).


5.1 Абсолютные и относительные показатели

Абсолютные статистические показатели.

Статистические показатели в форме абсолютных величин характеризуют абсолютные размеры изучаемых статистикой процессов и явлений: их массу, площадь, объем, протяженность; отражают их временные характеристики, а также могут представлять объем совокупности, т.е. число составляющих ее единиц.

Индивидуальные абсолютные показатели, как правило, получают непосредственно в процессе статистического наблюдения как результат замера, взвешивания, подсчета и оценки интересующего количественного признака.

Сводные объемные показатели получают в результате сводки и группировки индивидуальных значений (характеризуют объем признака или объем совокупности как в целом по изучаемому объекту, так и по какой-либо его части).

Абсолютные статистические показатели выражаются в следующих единицах измерения:

Натуральные (тонны, килограммы, километры, штуки);

Стоимостные (денежная оценка социально-экономическим явлениям и процессам);

Трудовые (человеко-дни, человеко-часы).

Относительные статистические показатели.

Относительный показатель представляет собой результат деления одного абсолютного показателя на другой и выражает соотношение между количественными характеристиками социально-экономических процессов и явлений. В числителе показатель называется текущим или сравниваемым, в знаменателе называется основанием или базой сравнения.

Если база сравнения принимается за 1, то относительный показатель выражается в коэффициентах, если база принимается за 100, то выражается в процентах (%), если за 1000, выражается в промилле (%0), если база принимается за 10.000, то выражается в продецимилле.

Проценты, как правило, используются в тех случаях, когда сравниваемый абсолютный показатель превосходит базисный не более чем в 2-3 раза. Проценты же свыше 200-300 обычно заменяются кратным отношением, коэффициентом.


5.2 Средние показатели (величины)

Средняя величина, представляющая собой обобщенную количественную характеристику признака в статистической совокупности в конкретных условиях места и времени, является наиболее распространенной формой статистических показателей.

Рассмотрим типы средних, которые рассчитываются для случаев, когда каждая из вариант вариационного ряда встречается только один раз (тогда средняя называется простой, или невзвешенной) и когда вариант или интервалы повторяются (средняя взвешенная). Число повторений вариант – частота. При выборе того или иного типа средней следует исходить из принципа осмысленности результата при суммировании или при взвешивании.

Средняя арифметическая.

X – степенная средняя;

Z – показатель степени, определяющий тип средней;

Xi – варианты;

mi – частоты или статистические веса вариантов.

Средняя гармоническая (z=-1).


Репетиторство

Нужна помощь по изучению какой-либы темы?

Наши специалисты проконсультируют или окажут репетиторские услуги по интересующей вас тематике.
Отправь заявку с указанием темы прямо сейчас, чтобы узнать о возможности получения консультации.

Значение графического метода в анализе и обобщении данных велико. Графическое изображение, прежде всего, позволяет осуществить контроль достоверности статистических показателей, так как, представленные на графике, они более ярко показывают имеющиеся неточности, связанные либо с наличием ошибок наблюдения, либо с сущностью изучаемого явления. С помощью графического изображения возможны изучение закономерностей развития явления, установление существующих взаимосвязей. Простое сопоставление данных не всегда дает возможность уловить наличие причинных зависимостей, в то же время их графическое изображение способствует выявлению причинных связей, в особенности в случае установления первоначальных гипотез, подлежащих затем дальнейшей разработке.

Статистический график – это чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются с помощью условных геометрических образов или знаков. Графический образ – это совокупность точек, линий и фигур, с помощью которых изображаются статистические данные. Вспомогательными элементами графика являются:

    Поле графика – это часть плоскости, где расположены графические образы. Поле графика имеет определенные размеры, которые зависят от его назначения.

    Пространственные ориентиры графика задаются в виде системы координатных сеток. Система координат необходима для размещения геометрических знаков в поле графика. Используются как прямоугольные, так и полярные системы координат.

    Масштабные ориентиры используются для сопоставления графического отображения объекта и его реальных размеров. Задаются масштабные ориентиры системой масштабных шкал или масштабными знаками.

    Экспликация графика состоит из объяснения предмета, изображаемого графиком (название), и смыслового значения каждого знака, применяемого на графике.

Статистические графики классифицируют по назначению (содержанию), способу построения и характеру графического образа (рис.1).

Рис.1. Классификация статистических графиков

По способу построения графических образов выделяют:

    Диаграммы – графическое изображение статистических данных, наглядно показывающее соотношение между сравниваемыми величинами.

    Статистические карты

Различают следующие основные виды диаграмм: линейные, столбиковые, полосовые, секторные, квадратные, круговые, фигурные.

Линейные диаграммы применяются для характеристики динамики, т.е. оценки изменения явлений во времени. По оси абсцисс откладываются периоды времени или даты, а по оси ординат – уровни ряда динамики. На одном графике может быть размещено несколько диаграмм, что позволяет сравнивать динамику различных показателей, либо одного показателя по разным регионам или странам.

Рис.2. Динамика объема импорта легковых автомобилей в РФ

за 2006-1кв. 2010г.г.

Столбиковые диаграммы могут быть использованы:

    для анализа динамики социально-экономических явлений;

    оценки выполнения плана;

    характеристики вариации в рядах распределений;

    для пространственных сопоставлений (сравнения по территориям, странам, фирмам);

    для изучения структуры явлений.

Столбики располагаются вплотную или раздельно на одинаковом расстоянии. Высота столбиков должна быть пропорциональна числовым значениям уровней признака.

Рис.3. Динамика удельного веса Белоруссии в товарообороте РФ со странами СНГ

Для характеристики структуры социально-экономических явлений широко используются секторные диаграммы . Для ее построения круг следует разделить на секторы пропорционально удельному весу частей в общем объеме. Сумма удельных весов равна 100%, что соответствует общему объему изучаемого явления.

Рис.4. Географическое распределение товарооборота РФ со странами СНГ

Полосовые диаграммы состоят из прямоугольников, расположенных горизонтально (полосами).

Иногда для сравнительного анализа по регионам, странам используют диаграммы фигур-знаков (диаграммы геометрических фигур). Данные диаграммы отражают размер изучаемого объекта в соответствии с размером своей площади.

Статистические карты применяются для оценки географического размещения явлений и сравнительного анализа по территориям.

Статистические карты включают картограммы и картодиаграммы. Различие между ними состоит в способах отображения статистических данных на картах.

Картограмма показывает территориальное распределение изучаемого признака по отдельным районам и используется для выявления закономерностей этого распределения. Картограммы делятся на фоновые и точечные. Фоновые картограммы разной густотой цветовой окраски характеризуют интенсивность какого-либо показателя в пределах территориальной единицы. На точечной картограмме уровень выбранного явления изображается с помощью точек.

Картодиаграмма – это сочетание географической карты или ее схемы с диаграммой. Она позволяет отразить специфику каждого района в распределении изучаемого явления, его структурные особенности.

В настоящее время разработаны различные пакеты прикладных программ компьютерной графики, например, Excel, Statgraf, Statistica.

Статистические данные должны быть представлены так, чтобы ими можно было пользоваться. Существует 3 основных формы представления статистических данных :

  1. Текстовая – включение данных в текст;
  2. Табличная – представление данных в таблицах;
  3. Графическая – выражение данных в виде графиков.

Текстовая форма применяется при малом количестве цифровых данных.

Табличная форма применяется чаще всего, так как является более эффективной формой представления статистических данных. В отличие от математических таблиц, которые по начальным условиям позволяют получить тот или иной результат, статистические таблицы рассказывают языком цифр об изучаемых объектах.

Статистическая таблица – это система строк и столбцов, в которых в определенной последовательности и связи излагается статистическая информация о социально-экономических явлениях.

Например, в следующей таблице представлена информация о внешней торговле России, выражать которую в текстовой форме было бы неэффективным.

1995 2000 2001 2002 2003 2004 2005 2006 2007
Миллиардов долларов США
Внешнеторговый оборот 145,0 149,9 155,6 168,3 212,0 280,6 369,2 468,6 578,2
Экспорт 82,4 105,0 101,9 107,3 135,9 183,2 243,8 303,9 355,2
Импорт 62,6 44,9 53,8 61,0 76,1 97,4 125,4 164,7 223,1
Сальдо торгового баланса 19,8 60,1 48,1 46,3 59,9 85,8 118,4 139,2 132,1
со странами дальнего зарубежья
экспорт 65,4 90,8 86,6 90,9 114,6 153,0 210,2 260,6 301,5
импорт 44,3 31,4 40,7 48,8 61,0 77,5 103,5 140,1 191,2
сальдо торгового баланса 21,2 59,3 45,9 42,1 53,6 75,5 106,7 120,4 110,3
со странами СНГ
экспорт 17,0 14,3 15,3 16,4 21,4 30,2 33,5 43,4 53,7
импорт 18,3 13,4 13,0 12,2 15,1 19,9 21,9 24,6 31,9
сальдо торгового баланса -1,4 0,8 2,2 4,2 6,3 10,3 11,7 18,8 21,9

Различают подлежащее и сказуемое статистической таблицы. В подлежащем указывается характеризуемый объект – либо единицы совокупности, либо группы единиц, либо совокупность в целом. В сказуемом дается характеристика подлежащего, обычно в числовой форме. Обязателен заголовок таблицы, в котором указывается к какой категории и к какому времени относятся данные таблицы.

По характеру подлежащего статистические таблицы подразделяются на простые, групповые и комбинационные. В подлежащем простой таблицы объект изучения не подразделяется на группы, а дается либо перечень всех единиц совокупности, либо указывается совокупность в целом. В подлежащем групповой таблицы объект изучения подразделяется на группы по одному признаку, а в сказуемом указываются число единиц в группах (абсолютное или в процентах) и сводные показатели по группам. В подлежащем комбинационной таблицы совокупность подразделяется на группы не по одному, а по нескольким признакам.

При построении таблиц необходимо руководствоваться следующими общими правилами.

  1. Подлежащее таблицы располагается в левой (реже – верхней) части, а сказуемое – в правой (реже – нижней).
  2. Заголовки столбцов содержат названия показателей и их единицы измерения.
  3. Итоговая строка завершает таблицу и располагается в ее конце, но иногда бывает первой: в этом случае во второй строке делается запись «в том числе», и последующие строки содержат составляющие итоговой строки.
  4. Цифровые данные записываются с одной и той же степенью точности в пределах каждого столбца, при этом разряды чисел располагаются под разрядами, а целая часть отделяется от дробной запятой.
  5. В таблице не должно быть пустых клеток: если данные равны нулю, то ставится знак «–» (прочерк); если данные не известны, то делается запись «сведений нет» или ставится знак «…» (троеточие). Если значение показателя не равно нулю, но первая значащая цифра появляется после принятой степени точности, то делается запись 0,0 (если, скажем, была принята степень точности 0,1).

Иногда статистические таблицы дополняются графиками, когда ставится цель подчеркнуть какую-то особенность данных, провести их сравнение. Графическая форма является самой эффективной формой представления данных с точки зрения их восприятия. С помощью графиков достигается наглядность характеристики структуры, динамики, взаимосвязи явлений, их сравнения.

Статистические графики – это условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков или географических карт-схем. Графическая форма облегчает рассмотрение статистических данных, делает их наглядными, выразительными, обозримыми. Однако графики имеют определенные ограничения: прежде всего, график не может включить столько данных, сколько может войти в таблицу; кроме того, на графике показываются всегда округленные данные – не точные, а приблизительные. Таким образом, график используется только для изображения общей ситуации, а не деталей. Последний недостаток – трудоемкость построения графиков. Он может быть преодолен использованием персонального компьютера (например, «Мастером диаграмм» из пакета Microsoft Office Excel).

:

Текстовая форма

Табличная форма

Статистическая таблица

Статистические графики – это условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков или географических карт-схем. Графическая форма облегчает рассмотрение статистических данных, делает их наглядными, выразительными, обозримыми. Однако графики имеют определенные ограничения: прежде всего, график не может включить столько данных, сколько может войти в таблицу; кроме того, на графике показываются всегда округленные данные – не точные, а приблизительные. Таким образом, график используется только для изображения общей ситуации, а не деталей. Последний недостаток – трудоемкость построения графиков. Он может быть преодолен использованием персонального компьютера (например, «Мастером диаграмм» из пакета Microsoft Office Excel).

Определение эмпирической функции распределения.

Выборочная (эмпири́ческая) фу́нкция распределе́ния в математической статистике - это приближение теоретической функции распределения, построенное с помощью выборки из него.

Определение

Пусть - выборка из распределения случайной величины , задаваемого функцией распределения . Будем считать, что , где , - независимые случайные величины, определённые на некотором пространстве элементарных исходов . Пусть . Определим случайную величину следующим образом:

где - индикатор события , - функция Хевисайда. Таким образом, выборочная функция распределения в точке равна относительной частоте элементов выборки, не превосходящих значение . Случайная величина называется выборочной функцией распределения случайной величины и является аппроксимацией для функции . Существует результат, показывающий, что при функция равномерно сходится к , и указывающий скорость сходимости.

Гистограмма

Гистограмма используется для графического представления распределений непрерывно варьирующих признаков и состоит из примыкающих друг к другу прямоугольников, как показано на рис. 2.1. Основание каждого прямоугольника равно ширине интервала группировки, а высота его такова, что площадь прямоугольника пропорциональна частоте (или частости) попадания в данный интервал. Если ряд безинтервальный, то ширина всех столбцов выбирается произвольной, но одинаковые. Таким образом, высоты прямоугольников должны быть пропорциональны величинам

где n i - частота i -го интервала группировки; h i - ширина i -го интервала группировки.

На графике гистограммы основание прямоугольников откладывается по оси абсцисс (x ), а высота - по оси ординат (у ) прямоугольной системы координат.

Однако в тех случаях, когда ширина всех интервалов группировки одинакова, вид гистограммы не изменится, если по оси ординат откладывать не величины р i , а частоты интервалов n i .

Рис. 2.1. Гистограмма распределения результатов в предыдущем примере (когда ширина некоторых интервалов группировки неодинакова).

В этом случае чтобы не нарушить принцип построения гистограммы (площади прямоугольников пропорциональны частотам интервалов), по оси ординат уже нельзя откладывать частоты, а надо – высоты прямоугольников (которые должны быть пропорциональны отношениям ).

Полигон частот

Другим распространенным способом графического представления является полигон частот.

Полигон частот образуется ломаной линией, соединяющей точки, соответствующие срединным значениям интервалов группировки и частотам этих интервалов, срединные значения откладываются по оси х , а частоты – по оси у .

Из сравнения двух рассмотренных способов графического представления эмпирических распределений следует, что для получения полигона частот из построенной гистограммы нужно середины вершин прямоугольников, образующих гистограмму, соединить отрезками прямых. Пример полигона частот представлен на рис. 2.2.

Рис. 2.2. Полигон частот

Полигон частот используется для представления распределений как непрерывных, так и дискретных признаков. В случае непрерывного распределения полигон частот является более предпочтительным способом графического представления, чем гистограмма, если график эмпирического распределения описывается плавной зависимостью.

21.Гипо́теза (др.-греч. ὑπόθεσις - предположение; от ὑπό - снизу, под + θέσις - тезис) - предположение или догадка; утверждение, предполагающее доказательство, в отличие отаксиом

Постулатов, не требующих доказательств. Гипотеза считается научной, если она удовлетворяет критерию Поппера, т.е. потенциально может быть проверена критическим экспериментом, а так же если она соответствует другим критериям, отличающим науку от не науки.

Статистическая гипотеза – это предположение о свойствах случайных величин или событий, которое мы хотим проверить по имеющимся данным. Примеры статистических гипотез в педагогических исследованиях :

Гипотеза 1. Успеваемость класса стохастически (вероятностно) зависит от уровня обучаемости учащихся.

Гипотеза 2. Усвоение начального курса математики не имеет существенных различий у учащихся, начавших обучение с 6 или 7 лет.

Гипотеза 3. Проблемное обучение в первом классе эффективнее по сравнению с традиционной методикой обучения в отношении общего развития учащихся.

Пример 1. Процесс производства некоторого медицинского препарата весьма сложен. Несущественные на первый взгляд отклонения от технологии вызывают появление высокотоксичной побочной примеси. Токсичность этой примеси может оказаться столь высокой, что даже такое ее количество, которое не может быть обнаружено при обычном химическом анализе, может оказаться опасным для человека, принимающего это лекарство. В результате, прежде чем выпускать в продажу вновь произведенную партию, ее подвергают исследованию на токсичность биологическими методами. Малые дозы лекарства вводятся некоторому количеству подопытных животных, например, мышей, и результат регистрируют. Если лекарство токсично, то все или почти все животные гибнут. В противном случае норма выживших велика.

Исследование лекарства может привести к одному из возможных способов действия: выпустить партию в продажу (а 1), вернуть партию поставщику для доработки или, может быть, для уничтожения (а 2).

Ошибки двух видов, связанные с действиями а 1 и а 2 совершенно различны, различна и важность избежания их. Сначала рассмотрим случай, когда применяется действие а 1 , в то время когда предпочтительнее а 2 . Лекарство опасно для пациента, в то время как оно признано безопасным. Ошибка этого вида может вызвать смерть пациентов, употребляющих этот препарат. Это ошибка первого рода, так как нам важнее ее избежать.

Рассмотрим случай когда предпринимается действие а 2 , в то время когда а 1 является более предпочтительным. Это означает, что вследствие неточностей в проведении эксперимента партия нетоксичного лекарства классифицировалась как опасная. Последствия ошибки могут выражаться в финансовом убытке и в увеличении стоимости лекарства. Однако случайное отвержение совершенно безопасного лекарства, очевидно, менее нежелательно, чем, пусть даже изредка происходящие гибели пациентов. Отвержение нетоксичной партии лекарства – ошибка второго рода.

Допустимая вероятность ошибки первого рода (Ркр) может быть равна 5% или 1% (0.05 или 0.01).

22. Проверка статистической гипотезы (testing statistical hypotheses) - это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных.

Статистический тест или статистический критерий - строгое математическое правило, по которому принимается или отвергается статистическая гипотеза .

· 23.классификация гипотез

· простая – указано одно обстоятельство, при наличии или отсутствии которого действует юридическая норма;

· сложная – наличие в гипотезе одновременно двух или более обстоятельств, в совокупности обусловливающих действие нормы;

· альтернативная – указано несколько вариантов обстоятельств (альтернативных), при которых возможно действие нормы. В этом случае при наступлении одного из них норма является действующей;

Параметрической гипотезой называется гипотеза о значениях параметров распределения или о сравнительной величине параметров двух распределений. Примером параметрической статистической гипотезы является гипотеза оравенстве математических ожиданий двух нормальных совокупностей.

Непараметрическими гипотезами называются гипотезы о виде распределенияслучайной величины.

Нулевой, основной или проверяемой гипотезой называется первоначально выдвинутая гипотеза, которая обозначается Н0 .

Статистическая гипотеза представляет собой некоторое предположение о законе распределения случайной величины или о параметрах этого закона, формулируемое на основе выборки . Примерами статистических гипотез являются предположения: генеральная совокупность распределена по экспоненциальному закону; математические ожидания двух экспоненциально распределенных выборок равны друг другу. В первой из них высказано предположение о виде закона распределения, а во второй – о параметрах двух распределений. Гипотезы, в основе которых нет никаких допущений о конкретном виде закона распределения, называют непараметрическими , в противном случае – параметрическими .

Гипотезу, утверждающую, что различие между сравниваемыми характеристиками отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями в выборках, на основании которых производится сравнение, называют нулевой (основной) гипотезой и обозначают Н 0 . Наряду с основной гипотезой рассматривают и альтернативную (конкурирующую, противоречащую) ей гипотезу Н 1 . И если нулевая гипотеза будет отвергнута, то будет иметь место альтернативная гипотеза.

Различают простые и сложные гипотезы. Гипотезуназывают простой , если она однозначно характеризует параметр распределения случайной величины. Например, если  является параметром экспоненциального распределения, то гипотеза Н 0 о равенстве  = 10–простая гипотеза. Сложной называют гипотезу, которая состоит из конечного или бесконечного множества простых гипотез. Сложная гипотеза Н 0 о неравенстве  > 10 состоит из бесконечного множества простых гипотез Н 0 о равенстве  =b i , где b i – любое число, большее 10. Гипотеза Н 0 о том, что математическое ожидание нормального распределения равно двум при неизвестной дисперсии, тоже является сложной. Сложной гипотезой будет предположение о распределении случайной величины Х по нормальному закону, если не фиксируются конкретные значения математического ожидания и дисперсии.

Проверка гипотезы основывается на вычислении некоторой случайной величины – критерия, точное или приближенное распределение которого известно. Обозначим эту величину через z , ее значение является функцией от элементов выборки z =z (x 1 , x 2 , …, x n ). Процедура проверки гипотезы предписывает каждому значению критерия одно из двух решений – принять или отвергнуть гипотезу. Тем самым все выборочное пространство и соответственно множество значений критерия делятся на два непересекающихся подмножества S 0 и S 1 . Если значение критерия z попадает в область S 0 , то гипотеза принимается, а если в область S 1 , – гипотеза отклоняется. Множество S 0 называется областью принятия гипотезы или областью допустимых значений , а множество S 1 – областью отклонения гипотезы или критической областью . Выбор одной области однозначно определяет и другую область.

Принятие или отклонение гипотезы Н 0 по случайной выборке соответствует истине с некоторой вероятностью и, соответственно, возможны два рода ошибок. Ошибка первого рода возникает с вероятностью  тогда, когда отвергается верная гипотеза Н 0 и принимается конкурирующая гипотеза Н 1 . Ошибка второго рода возникает с вероятностью  в том случае, когда принимается неверная гипотеза Н 0 , в то время как справедлива конкурирующая гипотеза Н 1 . Доверительная вероятность – это вероятность не совершить ошибку первого рода и принять верную гипотезу Н 0 . Вероятность отвергнуть ложную гипотезу Н 0 называется мощностью критерия . Следовательно, при проверке гипотезы возможны четыре варианта исходов, табл. 3.1.

Таблица 3.1.

Например, рассмотрим случай, когда некоторая несмещенная оценка параметра  вычислена по выборке объема n , и эта оценка имеет плотность распределения f (), рис. 3.1.

Рис. 3.1. Области и отклонения гипотезы

Предположим, что истинное значение оцениваемого параметра равно Т . Если рассматривать гипотезу Н 0 о равенстве  =Т , то насколько велико должно быть различие между  и Т , чтобы эту гипотезу отвергнуть. Ответить на данный вопрос можно в статистическом смысле, рассматривая вероятность достижения некоторой заданной разности между  и Т на основе выборочного распределения параметра  .

Целесообразно полагать одинаковыми значения вероятности выхода параметра  за нижний и верхний пределы интервала. Такое допущение во многих случаях позволяет минимизировать доверительный интервал, т.е. повысить мощность критерия проверки. Суммарная вероятность того, что параметр  выйдет за пределы интервала с границами  1– /2 и   /2 , составляет величину  . Эту величину следует выбрать настолько малой, чтобы выход за пределы интервала был маловероятен. Если оценка параметра попала в заданный интервал, то в таком случае нет оснований подвергать сомнению проверяемую гипотезу, следовательно, гипотезу равенства  =Т можно принять. Но если после получения выборки окажется, что оценка выходит за установленные пределы, то в этом случае есть серьезные основания отвергнуть гипотезу Н 0 . Отсюда следует, что вероятность допустить ошибку первого рода равна  (равна уровню значимости критерия).

Если предположить, например, что истинное значение параметра в действительности равно Т +d , то согласно гипотезе Н 0 о равенстве  =Т – вероятность того, что оценка параметра  попадет в область принятия гипотезы, составит  , рис. 3.2.

При заданном объеме выборки вероятность совершения ошибки первого рода можно уменьшить, снижая уровень значимости  . Однако при этом увеличивается вероятность ошибки второго рода  (снижается мощность критерия). Аналогичные рассуждения можно провести для случая, когда истинное значение параметра равно Т d .

Единственный способ уменьшить обе вероятности состоит в увеличении объема выборки (плотность распределения оценки параметра при этом становится более "узкой"). При выборе критической области руководствуются правилом Неймана – Пирсона: следует так выбирать критическую область, чтобы вероятность  была мала, если гипотеза верна, и велика в противном случае. Однако выбор конкретного значения  относительно произволен. Употребительные значения лежат в пределах от 0,001 до 0,2. В целях упрощения ручных расчетов составлены таблицы интервалов с границами  1– /2 и   /2 для типовых значений  и различных способов построения критерия.

При выборе уровня значимости необходимо учитывать мощность критерия при альтернативной гипотезе. Иногда большая мощность критерия оказывается существеннее малого уровня значимости, и его значение выбирают относительно большим, например 0,2. Такой выбор оправдан, если последствия ошибок второго рода более существенны, чем ошибок первого рода. Например, если отвергнуто правильное решение "продолжить работу пользователей с текущими паролями", то ошибка первого рода приведет к некоторой задержке в нормальном функционировании системы, связанной со сменой паролей. Если же принято решения не менять пароли, несмотря на опасность несанкционированного доступа посторонних лиц к информации, то эта ошибка повлечет более серьезные последствия.

В зависимости от сущности проверяемой гипотезы и используемых мер расхождения оценки характеристики от ее теоретического значения применяют различные критерии. К числу наиболее часто применяемых критериев для проверки гипотез о законах распределения относят критерии хи-квадрат Пирсона, Колмогорова, Мизеса, Вилкоксона, о значениях параметров – критерии Фишера, Стьюдента.

25. КРИТИЧЕСКАЯ ОБЛАСТЬ - часть выборочного пространства такая, что попадание в нее наблюденного значения случайной величины, с распределением к-рой связана проверяемая гипотеза, влечет отказ от этой гипотезы

Критическими точками (границами) k кр называют точки, отделяющие критическую область от области принятия гипотезы.
Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.

Случайная погрешность измерения образуется под влиянием большого числа факторов , сопутствующих процессу измерения. В каждой конкретной ситуации работает свой механизм образования погрешности. Поэтому естественно предположить, что каждой ситуации должен соответствовать свой тип распределения погрешности. Однако во многих случаях имеются возможности еще до проведения измерений сделать некоторые предположения о форме функции распределения, так что после проведения измерений остается только определить значения некоторых параметров, входящих в выражение для предполагаемой функции распределения.

Случайная погрешность характеризует неопределенность наших знаний об истинном значении измеряемой величины, полученных в результате проведенных наблюдений. Согласно К. Шеннону мерой неопределенности ситуации, описываемой случайной величиной X, является энтропия


являющаяся функционалом дифференциальной функции распределения . Можно предположить, что любой процесс измерения формируется таким образом, что неопределенность результата наблюдений оказывается наибольшей в некоторых пределах, определяемых допускаемыми значениями погрешности. Поэтому наиболее вероятными должны быть такие распределения , при которых энтропия обращается в максимум.

Для выявления вида наиболее вероятных распределений рассмотрим несколько наиболее типичных случаев .

1. В классе распределений результатов наблюдений , обладающих определенной зоной рассеивания между значениями х = b и х = а шириной b-а =, найдем такое, которое обращает в максимум энтропию при наличии ограничивающих условий:
, , ,
где - математическое ожидание результатов наблюдений. Решение поставленной задачи находится методом множителей Лагранжа.

Искомая плотность распределения результатов наблюдений описывается выражением

Определим числовые характеристики равномерного распределения. Математическое ожидание случайной погрешности находим по формуле (10):

Дисперсию случайной равномерно распределенной погрешности можно найти по формуле (18):

В силу симметрии распределения относительно математического ожидания коэффициент асимметрии должен равняться нулю:

Для определения эксцесса найдем вначале четвертый момент случайной погрешности:

Поэтому

В заключение найдем веро-ятность попадания случайной погрешности в заданный интервал , равный заштрихованной площади на рис.7

2. В классе распределений результатов наблюдений , обладающих определенной дисперсией , найдем такое, которое обращает в максимум энтропию при наличии ограничений:

, , , .

Решение этой задачи также находится методом множителей Лагранжа. Искомая плотность распределения результатов наблюдений описывается выражением

Распределение, описываемое уравнениями (25) и (26), называется нормальным или распределением Гаусса .

На рис.8 изображены кривые нормального распределения случайных погрешностей для различных значений среднеквадратического отклонения .

Из рисунка видно, что по мере увеличения среднеквадратического отклонения распределение все более и более расплывается, вероятность появления больших значений погрешностей возрастает, а вероятность меньших погрешностей сокращается, т.е. увеличивается рассеивание результатов наблюдений.

Вычислим вероятность попадания результата наблюдения в некоторый заданный интервал :

Заменим переменные:

После чего получим следующее выражение для искомой вероятности:

Интегралы, стоящие в квадратных скобках, не выражаются в элементарных функциях, поэтому их вычисляют с помощью так называемого нормированного нормального распределения с дифференциальной функцией

С помощью функции Ф(z ) вероятность находят как

(29)

При использовании данной формулы следует иметь в виду тождество

Вытекающее непосредственно из определения функции Ф(z ).

Широкое распространение нормального распределения погрешностей в практике измерений объясняется центральной предельной теоремой теории вероятностей, являющейся одной из самых замечательных математических теорем, в разработке которой принимали участие многие крупнейшие математики - Муавр, Лаплас, Гаусс, Чебышев и Ляпунов. Центральная предельная теорема утверждает, что распределение случайных погрешностей будет близко в нормальному всякий раз, когда результаты наблюдения формируются под влиянием большого числа независимо действующих факторов, каждый из которых оказывает лишь незначительное действие по сравнению с суммарным действием всех остальных.

3. Предположим, что результаты наблюдений распределены нормально, но их среднеквадратическое отклонение является величиной случайной, изменяющейся от опыта к опыту. Такое предположение более осторожное, чем предположение о неизменности в течение всего времени измерений. В этом случае, рассуждая таким же образом, как и прежде, легко найти, что энтропия обращается в максимум, если результаты наблюдений имеют распределение Лапласа с плотностью

(30)

где - математическое ожидание, - среднеквадратическое отклонение результатов наблюдения. Распределением Лапласа следует пользоваться в тех случаях, когда точностные характеристики заранее неизвестны или нестабильны во времени.

Дифференциальная функция распределения случайных погрешностей получается подстановкой и в выражение (30):

Асимметрия распределения равна нулю, поскольку распределение симметрично относительно нуля, а эксцесс в соответствии с формулой (22) составляет

Таким образом, по сравнению с нормальным распределением (Ех = 0) равномерное распределение является более плосковершинным (Ех = -1.2), а распределение Лапласа - более островершинным (Ех = 3).

Формы представления статистических данных.

Статистические данные должны быть представлены так, чтобы ими можно было пользоваться. Существует 3 основных формы представления статистических данных :

Текстовая – включение данных в текст;

Табличная – представление данных в таблицах;

Графическая – выражение данных в виде графиков.

Текстовая форма применяется при малом количестве цифровых данных.

Табличная форма применяется чаще всего, так как является более эффективной формой представления статистических данных. В отличие от математических таблиц, которые по начальным условиям позволяют получить тот или иной результат, статистические таблицы рассказывают языком цифр об изучаемых объектах.

Статистическая таблица – это система строк и столбцов, в которых в определенной последовательности и связи излагается статистическая информация о социально-экономических явлениях.

Различают подлежащее и сказуемое статистической таблицы. В подлежащем указывается характеризуемый объект – либо единицы совокупности, либо группы единиц, либо совокупность в целом. В сказуемом дается характеристика подлежащего, обычно в числовой форме. Обязателен заголовок таблицы, в котором указывается к какой категории и к какому времени относятся данные таблицы.

По характеру подлежащего статистические таблицы подразделяются на простые, групповые и комбинационные. В подлежащем простой таблицы объект изучения не подразделяется на группы, а дается либо перечень всех единиц совокупности, либо указывается совокупность в целом. В подлежащем групповой таблицы объект изучения подразделяется на группы по одному признаку, а в сказуемом указываются число единиц в группах (абсолютное или в процентах) и сводные показатели по группам. В подлежащем комбинационной таблицы совокупность подразделяется на группы не по одному, а по нескольким признакам.

При построении таблиц необходимо руководствоваться следующими общими правилами.

Подлежащее таблицы располагается в левой (реже – верхней) части, а сказуемое – в правой (реже – нижней).

Заголовки столбцов содержат названия показателей и их единицы измерения.

Итоговая строка завершает таблицу и располагается в ее конце, но иногда бывает первой: в этом случае во второй строке делается запись «в том числе», и последующие строки содержат составляющие итоговой строки.

Цифровые данные записываются с одной и той же степенью точности в пределах каждого столбца, при этом разряды чисел располагаются под разрядами, а целая часть отделяется от дробной запятой.

В таблице не должно быть пустых клеток: если данные равны нулю, то ставится знак «–» (прочерк); если данные не известны, то делается запись «сведений нет» или ставится знак «…» (троеточие). Если значение показателя не равно нулю, но первая значащая цифра появляется после принятой степени точности, то делается запись 0,0 (если, скажем, была принята степень точности 0,1).

Иногда статистические таблицы дополняются графиками, когда ставится цель подчеркнуть какую-то особенность данных, провести их сравнение. Графическая форма является самой эффективной формой представления данных с точки зрения их восприятия. С помощью графиков достигается наглядность характеристики структуры, динамики, взаимосвязи явлений, их сравнения.