Сколько людей поместится на земле. Сколько же людей способна выдержать планета Земля? «Вымирание» развитых стран

Выборочный метод в социологии.

Большинство социологических исследований носит не сплошной, а выборочный характер: по строгим правилам отбирается определенное количество людей, отражающих по социально-демографическим признакам структуру изучаемого объекта. Такое исследование называется выборочным.

При построении социологической выборки используется множество специальных терминов, в том числе два важнейших – генеральная ивыборочная совокупность .

Совокупность, из которой отбираются варианты для совместного изучения, называется генеральной, а отобранная из генеральной совокупности часть ее членов носит название выборки ,или выборочной совокупности . Объем генеральной совокупности обозначается символом N , а объем выборочной совокупности – n .

Генеральной совокупностью считают все население или ту его часть, которую социолог намерен изучить, совокупность людей, обладающих одним или несколькими свойствами, подлежащими изучению. Часто генеральная совокупность (еще называемая популяцией) настолько крупная, что опрос каждого представителя чрезвычайно обременителен и дорогостоящ. Это те, на кого направлен теоретический интерес социолога (в том смысле, что узнать о каждом представителе генеральной совокупности ученый может только косвенно – на основе информации о выборочной совокупности).

Выборкой называется совокупность элементов объекта социологического исследования, подлежащая непосредственному изучению. Понятие выборки в статистике и социологии рассматривается в двух значениях:

– выборка (как результат действия) – представительная часть генеральной совокупности, в которой закон распределения признака соответствует закону распределения этого признака в генеральной совокупности;

– выборка (как способ или процесс действия) – способ отбора объектов генеральной совокупности в выборочную.

Выборка должна наилучшим образом репрезентировать объект исследования (генеральную совокупность).

Выборочная совокупность – уменьшенная модель генеральной совокупности. Иначе говоря, это множество людей, которых социолог опрашивает. В выборку, или выборочную совокупность, входят только те, кого социолог намеревается непосредственно опросить. Представим, что предметом его исследования, т. е. темой, выступает экономическая активность пенсионеров. Все пенсионеры – пожилые люди в возрасте старше 55 (женщины) и 60 (мужчины) лет – будут составлять генеральную совокупность. По специальным формулам социолог рассчитал, что ему достаточно опросить 2,5 тысячи пенсионеров. Это и станет его выборочной совокупностью.

Основное правило ее составления гласит: каждый элемент генеральной совокупности должен иметь одинаковые шансы попасть в выборку .Но как этого добиться? Прежде всего, надо узнать как можно больше свойств, или параметров, генеральной совокупности, например, разброс в возрасте, доходах, национальности, местах проживания респондентов. Разброс в возрасте респондентов называется вариацией ,конкретные величины возраста – значениями , а совокупность всех значений образует переменную .



Таким образом, переменная «возраст» имеет значения от 0 до 70 (средняя продолжительность жизни) и более лет. Значения группируются в интервалы: 0–5, 6–10, 11–15 лет и т. д. Их можно группировать иначе, все зависит от задач исследования. Интервалы значений переменной «возраст» в случае с пенсионерами начинаются с 55 и 60 лет.

Все население, целая нация или очень большая социальная группа редко выступают генеральной совокупностью. В большинстве эмпирических исследований социолога интересует частная проблема, например, рост числа разводов среди молодых семей в крупных городах или интерес к инвестиционной деятельности среди представителей среднего класса столичного города. Разводы и инвестиционная деятельность – это те темы, которые интересуют конкретного исследователя в данный период времени. Соответственно все люди, втянутые в этот процесс или участвующие в данном событии, будут называться группой интереса .Их могут быть тысячи или десятки тысяч человек. Они составляют исходную популяцию, или генеральную совокупность, из которой социолог строит выборочную совокупность и опрашивает ее.

Сущность выборочного метода заключается в том, чтобы по свойствам части (выборки) судить о численных характеристиках целого (генеральной совокупности), по отдельным группам элементов – об их общей совокупности, которая иногда мыслится как совокупность неограниченно большого объема. Основу выборочного метода составляет та внутренняя связь, которая существует в популяциях между единичным и общим, частью и целым.

Репрезентативной выборкой в социологии считается такая выборочная совокупность, основные характеристики которой полностью совпадают (представлены в той же пропорции или с той же частотой) с такими же характеристиками генеральной совокупности. Только для этого типа выборки результаты обследования части единиц (объектов) можно распространять на всю генеральную совокупность. Необходимое условие для построения репрезентативной выборки – наличие информации о генеральной совокупности, т. е. либо полный список единиц (субъектов) генеральной совокупности, либо информация о структуре по характеристикам, существенно влияющим на отношение к предмету исследования.

Под репрезентативностью в социологии понимают такие свойства выборки, которые позволяют ей выступать на момент опроса моделью, представителем генеральной совокупности. Иными словами, репрезентативная выборка представляет собой точную модель генеральной совокупности, которую она должна отражать (по значимым для исследования параметрам). В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно применить ко всей совокупности.

Репрезентативным считается такое исследование, при котором отклонение в выборочной совокупности по контрольным признакам не превышает 5 %. При пилотажном опросе небольшой генеральной совокупности (например, в рамках факультета численностью до 100–250 человек) репрезентативным будет сплошное анкетирование. В масштабах вуза достаточно будет опросить 25 % от общего числа студентов.

Как только социолог определился с тем, кого он хочет опросить, он определил основу выборки .После чего решается вопрос о типе выборки.

Типами выборки называются основные разновидности статисти-ческой выборки: случайная (вероятностная) и неслучайная (невероятностная). Тип выборки говорит о том, как люди попадают в выборочную совокупность, объем выборки сообщает о том, какое их количество туда попало.

Перейдем к характеристике наиболее распространенных выборок.

В формировании выборочной совокупности важную роль играет определение ее объема и обеспечение репрезентативности.

«Если тип выборки говорит о том, как попадают люди в выборочную совокупность, то объём выборки сообщает о том, какое их количество попало сюда». То есть объем выборки - это количество единиц попавших в выборочную совокупность. И очень важно, чтобы выборка была репрезентативной, то есть не искажала представлений о генеральной совокупности в целом. «Требования репрезентативности выборки означают, что по выделенным параметрам (критериям) состав обследуемых должен приближаться к соответствующим пропорциям в генеральной совокупности».

Одна из ключевых проблем, встающих, как правило, перед социологом, решающим: доверять полученным в ходе него данным или нет, это то, сколько же человек должно быть опрошено для того, чтобы получить действительно репрезентативную информацию. К сожалению, единой и четкой формулы, используя которую можно было бы рассчитать оптимальный объем выборочной совокупности, не существует в природе. И объясняется это весьма просто. Дело в том, что определение объема выборочной совокупности - это проблема не столько статистическая, сколько содержательная.

Иными словами, объем выборочной совокупности зависит от множества факторов, основные из них следующие:

  • 1. затраты на сбор информации, включая временные;
  • 2. стремление к определённой статистической достоверности результатов, которую надеется получить исследователь;
  • 3. ценность и новизна информации, получаемой в результате опроса.

Объем выборки обусловлен степенью однородности или неоднородности, генеральной совокупности, количеством характеризующих ее признаков. Однородной считается совокупность, в которой контролируемый признак, например уровень грамотности, распределён равномерно, то есть не образует пустот и сгущений, тогда опросив лишь несколько человек, можно сделать вывод о том, что большинство людей грамотны. Чем более однородна генеральная совокупность, тем меньше объем выборки. Например, «допустим, мы осуществляем отбор из генеральной совокупности в 2000 человек, контролируя состав выборочной совокупности по признаку «пол»»: 70% мужчин и 30% женщин. Согласно теории вероятности, можно предположить, что примерно среди каждых десяти отбираемых респондентов встретятся три женщины. Если мы хотим опросить по крайней мерее 90 женщин, то исходя из вышеупомянутого соотношения, нам необходимо отобрать не менее 300 человек. А теперь предположим, что в генеральной совокупности 90% мужчин и 10% женщин. В этом случае, чтобы в выборочную совокупность попало 90 женщин, необходимо отобрать уже не менее 900 человек». Из примера видно, что объем выборки зависит от разброса признака (дисперсии), и его нужно вычислять по признаку, дисперсия значений которого наибольшая.

«Степень однородности социального объекта зависит, в сущности, от того, насколько детально мы намерены его исследовать. Практически любой, самый «элементарный» объект оказывается чрезвычайно сложным. Лишь в анализе мы представляем его как относительно простой, выделяя те или иные его свойства. Чем более основательным и детальным будет анализ, чем больше свойств данного объекта мы намерены принять во внимание в их сочетании, а не изолированно, тем больше должен быть объем выборки».

В репрезентативной выборке все элементы генеральной совокупности представлены в той же пропорции. Но как бы тщательно не соблюдать этот принцип, случайные ошибки все же будут. Мы имеем возможность определять ошибку репрезентативности. Ошибкой репрезентативности, как правило, называют «расхождение между двумя совокупностями - генеральной, на которую направлен теоретический интерес социолога и представление о свойствах которой он хочет получить в конечном итоге, и выборочной, на которую направлен практический интерес социолога, которая выступает одновременно как объект обследования и средство получить информацию о генеральной совокупности». Важно учитывать, что при помощи выборочного метода никогда нельзя получить абсолютно точную оценку наблюдаемого признака, всегда существует вероятность ошибки, но, если вероятность ошибки мала, то она скорее всего не произойдет. В отечественной литературе наряду с термином «ошибка репрезентативности» встречается и другой - «ошибка выборки». Обычно они используются как синонимы, но понятие «ошибка выборки» количественно более точное, чем «ошибка репрезентативности». Ошибка выборки - это «отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности. На практике она определяется путём сравнения известных характеристик генеральной совокупности с выборочными средними».

Репрезентативность выборки определяется двумя компонентами: систематическими и случайными ошибками. Случайные ошибки связаны «со статистическими погрешностями (зависят от динамики исследуемых признаков) и непредвиденными нарушениями процедуры сбора информации (процедурные ошибки, допущенные при регистрации признаков)». Случайные ошибки уменьшаются с увеличением объема выборочной совокупности. Случайную ошибку можно измерить методами математической статистики, если при формировании выборочной совокупности соблюдался принцип случайности, обеспечивающийся строго определенными правилами, которые составляют метод формирования выборочной совокупности, и устранить.

На практике принцип случайности соблюсти очень сложно, а иногда просто невозможно, что приводит к появлению систематической ошибки, которые возникают «из-за неполной объективности выборки генеральной совокупности (недостаток информации о генеральной совокупности, отбор наиболее «удобных» для исследования элементов генеральной совокупности), а так же из-за несоответствия выборки целям и задачам исследования». Иногда такие ошибки называют ошибками смещения. Они возникают при различных телевизионных опросах, когда телеведущий предлагает телезрителям позвонить по определённым номерам телефонов, послать смс-сообщение и высказать своё мнение по какой-то проблеме. Естественно мы не можем утверждать что эти люди отражают мнение всего населения страны, и даже телеаудитории. Вероятнее всего в таких опросах участвуют более образованные и активные люди, чем вся генеральная совокупность, поэтому любой телевизионный опрос содержит в себе систематическое искажение и носит поверхностный характер.

Но систематические ошибки возникают и в ходе корректно организованного опроса. Например, на улице на вопросы интервьюера отвечают только те, кто никуда не спешит. Искажения можно избежать, если соблюдать принципы случайного отбора и опрашивать, к примеру, каждого десятого прохожего.

Причины возникновения систематических ошибок:

  • 1. «в ходе исследования была не правильно составлена основа выборки (использовались устаревшие, неполные данные либо отсутствовала статистика по некоторым важным для формирования выборки признакам),
  • 2. неудачно выбран способ отбора единиц наблюдения,
  • 3. часть респондентов по разным причинам «выпала» из опроса (отсутствовала, отказалась отвечать) и так далее».

При помощи математических средств такие ошибки устранить невозможно, поэтому необходимо осуществить логический анализ причин появления систематических ошибок и разработать меры, которые смогли бы их устранить. «Величину ошибок смещения определить при помощи математических формул практически не возможно, поэтому они автоматически переходят на результаты и выводы исследования. Ошибки смещения бывают обычно следствием:

  • - неверных исходных статистических данных о параметрах контрольных признаков генеральной совокупности;
  • - слишком малого (статистически не значимого) объёма выборочной совокупности;
  • - неверного применения способа отбора единиц анализа (например, отбор из неверно составленного списка, неудачный выбор места и времени проведения опроса)» .

Существуют определённые пределы ошибки выборки, которые зависят от цели исследования. В экономических и демографических прогнозах, например при переписи населения, требуется повышенная надёжность и точность. Для таких прогнозов существенные ошибки оборачиваются миллионными потерями материальных ресурсов и просчетами в прогнозах и планировании. Но чаще поводятся социологические исследования для уяснения общих тенденций, общей ориентировки в социальной сфере не требующие стопроцентной надёжности. Существует приблизительная оценка на надёжность результатов исследования: «повышенная надёжность допускает ошибку выборки до 3%. Обыкновенная - до 3-10%, приближенная - то 10 до 20%, ориентировочная - от 20 до 40%, а прикидочная - более 40%».

Таким образом, существует несколько способов, чтобы избежать ошибки:

  • § каждый элемент генеральной совокупности должен иметь одинаковую вероятность попасть в выборочную совокупность;
  • § генеральная совокупность должна быть желательно однородной;
  • § необходимо иметь сведения о структуре генеральной совокупности и её характерные черты;
  • § при составлении выборочной совокупности заранее учесть случайные и систематические ошибки.

Например, если опросив 380 человек в поселении, где общая численность платёжеспособного населения 10 тысяч человек, мы выявили что 36% опрошенных покупателей, предпочитают отечественную продукцию, то с 95-процентной степенью вероятности мы можем утверждать, что отечественную продукцию постоянно покупают 46±5% (то есть от 41 до 51%) жителей этого поселения.

Многие обстоятельства усложняют проблему расчёта выборки и нередко могут привести к тому, что формально-статистически репрезентативная выборка окажется качественно непредставительной».

Качество выборки оценивают по двум показателям: репрезентативность и надежность. О репрезентативности уже говорилось выше. А чтобы создать надежную выборку необходимо правильно построить ее основу. Для этого соблюдаются следующие требования:

  • 1. Полнота выборки, которая требует наличия всех элементов генеральной совокупности в основе выборки. Если в выборку не включены многие единицы наблюдения, тем более, несущие в себе существенные особенности и характеристики объекта, то результаты исследования будут неполными и однобокими.
  • 2. Отсутствие дублирования, которое подразумевает недопустимость повторного включения в выборку одной и той же единицы наблюдения (например, ученик перешел учиться в другую школу, его включили в новый список, не вычеркнув при этом из старого, таким образом, он дважды попал в выборку).
  • 3. Точность информации выборки, предполагающая исключение несуществующих единиц наблюдения из основы выборки. Например, в избирательных списках, которые готовятся для очередных выборов депутатов различного уровня, нередко остаются умершие люди или жильцы снесенных домов.
  • 4. Адекватность, которая означает, что основа составленной выборки должна соотноситься с решением поставленных в исследовании задач. Например, полный список всех учащихся школы -- хорошая основа для того, чтобы сформировать выборку при изучении проблемы общей успеваемости. Но если нас интересует отношение старшеклассников к основным учебным дисциплинам, то этот список может быть использован только для формирования новой основы выборки -- списка старшеклассников.
  • 5. Удобство работы с основой выборки, при котором необходимо четко пронумеровать все элементы, которые в нее входят, а составленные списки централизованно хранить.

«Существует два основных подхода к обоснованию репрезентативности выборки:

  • 1. При статистическом подходе репрезентативность обеспечивается специальными вероятностными методами извлечения выборки. Для обобщения результатов исследования на генеральную совокупность применяются строгие индуктивные процедуры статистического вывода, оценивается ошибка выборки с заданной вероятностью.
  • 2. Внестатистическое обоснование репрезентативности предполагает теоретическое доказательство того, что выборка достаточно хорошо представляет генеральную совокупность. При использовании этого подхода статистическое оценивание ошибок выборки не производится».

На первый взгляд, кажется, что обеспечить репрезентативность выборки на практике просто невозможно, но на самом деле всё зависит от программных целей и задач исследования.

Если мы проводим обследование большой общественной значимости, по завершению которого нужно будет сделать выводы обо всей генеральной совокупности, то необходимо чётко следовать всем требования репрезентативной выборочной процедуры, так как ошибки в таких исследованиях недопустимы.

Если перед нами стоят более скромные задачи и уровень надежности выводов можно смело понизить, то необходимо следовать всем требованиям по качественному представительству выборочной совокупности. Если мы решим подчёркивать статистическую надёжность данных, то введём в заблуждение тех людей, кто привык верить математическим расчётам. Нельзя забывать, что та информация, которую мы получаем путём опросов и других способов, лишь условно переводится в количественные показатели. И не редкость когда количественные показатели только приблизительно отражают существо социальных процессов. «Поэтому усилия, направленные на строгость статистического обоснования результатов, приобретают смысл только при условии серьёзного качественного анализа проблемы, содержательного её изучения».

Необходимо помнить, что социолог должен сосредотачивать своё внимание именно на существе социальных проблем, привлекать к работе других специалистов, практиков и теоретиков, внимательно изучать литературу в области экономики, психологии, социологии о предмете исследования. И для решения статистических задач, по поводу типа и объема выборки, он сначала должен чётко сформулировать конкретные вопросы, которые необходимо решить, а уже потом обращаться к соответствующим расчётам различных статистик.

РЕПРЕЗЕНТАТИВНОСТЬ ДАННЫХ

РЕПРЕЗЕНТАТИВНОСТЬ ДАННЫХ (от франц. representatif - показательный), свойство экспериментальных данных (количественные характеристики, цифр и других результатов) натурных наблюдений, проб, выборов, изъятых из природной среды, экосистемы и т. д. быть бесспорными объективными критериями истины наблюдаемых явлений.

Экологический энциклопедический словарь. - Кишинев: Главная редакция Молдавской советской энциклопедии . И.И. Дедю . 1989 .


Смотреть что такое "РЕПРЕЗЕНТАТИВНОСТЬ ДАННЫХ" в других словарях:

    репрезентативность - в прямом смысле способность дать представление; термин свойственен статистике. Репрезентативность статистических объектов (предметов, изучаемых статистическим методом см. статистика) способность данных предметов, намеченных для выборочного… … Справочный коммерческий словарь

    РЕПРЕЗЕНТАТИВНОСТЬ - (от франц. representatif представительный) представительность, показательность выборки по отношению ко всей совокупности данных, из которых была сделана выборка (в статистике, метеорологии); в социологии репрезентативность достигается с помощью… … Профессиональное образование. Словарь

    репрезентативность участка - 3.1.13 репрезентативность участка: Степень представительности наблюдательного участка, обеспечивающая соответствие данного места наблюдений предъявляемым требованиям и получение сравнимых между собой данных, которые могут быть использованы для… …

    - (от франц. représentatif представляющий собой что либо, показательный) в статистике, главное свойство выборочной совокупности, состоящее в близости её характеристик (состава, средних величин и др.) к соответствующим характеристикам… … Большая советская энциклопедия

    РЕПРЕЗЕНТАТИВНОСТЬ - – 1) свойство выборочной совокупности представлять характеристики генеральной совокупности; означает, что с некоторой наперед заданной или определенной статистически погрешностью можно считать, что представленное в выборочной совокупности… … Современный образовательный процесс: основные понятия и термины

    Репрезентативность - свойство выборочной совокупности воспроизводить характеристики генеральной совокупности. Другими словами, Р. выборки означает, что с некоторой погрешностью можно отождествить установленное на выборочной совокупности распределение изучаемых… … Социологический справочник

    Опрос почтовый - разновидность опроса анкетного. При О. п. анкета распространяется среди потенциальных респондентов с помощью почтовой службы как самостоятельное почтовое отправление по специально отобранным адресам тех диц, которые в совокупности, по мнению… … Социологический справочник

    Опрос прессовый - разновидность опроса анкетного. При О. п. анкета публикуется на страницах газет, журналов и возможность ее заполнения и возврата исследователям ограничена только совокупностью читателей соответствующего периодического издания, причем той ее… … Социологический справочник

    КИЭР - (Kiaei) Андерс Николай (1838 1919) норв. статистик. С 1867 возглавлял Статистич. бюро Мин ва внутр. дел в 1877 1913 директор Центр. бюро статистики Норвегии. По поручению Междунар. статистич. ин та разрабатывал проекты переписей нас. для стран… … Демографический энциклопедический словарь

    РД 52.10.728-2010: Основные требования к компетентности лабораторий при проведении мониторинга состояния и загрязнения морской среды - Терминология РД 52.10.728 2010: Основные требования к компетентности лабораторий при проведении мониторинга состояния и загрязнения морской среды: 1.1.9 государственная наблюдательная сеть: Наблюдательная сеть федерального органа исполнительной… … Словарь-справочник терминов нормативно-технической документации

Книги

  • Методологические и методические подходы к проведению социологических опросов в системе обязательного медицинского страхования (ОМС) , Коллектив авторов. В работе рассматриваются актуальные методологические и методические вопросы повышения эффективности функционирования единой системы и модели организации и проведения социологических опросовэлектронная книга
  • Антикоррупционная экспертиза нормативно-правовых актов и их проектов , Россинская Е. (сост.). Настоящее издание является сборником научных статей, посвященных вопросам антикоррупционной экспертизы нормативно-правовых актов и их проектов. Рассмотрены коррупциогенность информационного…

Между временным рядом и случайной выборкой существуют принципиальные различия. Во-первых, элементы случайной выборки являются статистически независимыми, а элементы временного ряда - нет, т.к. во временном ряде можно проследить тенденцию развития и прогнозировать значения на будущее. Во-вторых, члены временного ряда не являются одинаково распределенными. В-третьих, у случайной выборки математическое ожидание, дисперсия, среднеквадратическое отклонение являются постоянными, в отличии от временного ряда, который отражает динамику развития какого-либо признака во времени, в связи с чем могут меняться во времени и числовые характеристики.

Репрезентативность выборки - это соответствие характеристик выборки характеристикам генеральной совокупности. Репрезентативность выборки определяет на сколько можно переносить выводы, сделанные по исследуемой выборке, на генеральную совокупность. Для обеспечения высокой репрезентативности выборки необходимо обеспечить большой объем выборки и наличие в ней, элементов из всех групп генеральной совокупности. Для достижения высокой репрезентативности временного ряда необходимо анализировать достаточно продолжительный объем данных, изменяющихся во времени, т.к. например, наличие данные о часовом газопотреблении за 1 января в течение нескольких лет не позволит прогнозировать объем газопотребления за другие даты. Т.е. для обеспечения репрезентативности временного ряда необходимо обеспечить наличие ряда наблюдений, в различные периоды времени.

Репрезентативность выборки определяется в первую очередь ее объемом. К тому же отбор показателей должен осуществляться из однородных групп, причем вероятность попадания любого элемента генеральной совокупности в выборку должна быть одинаковой для всех элементов. В свою очередь на объем выборки влияет способ осуществления отбора. Объем выборки определяется рядом факторов: объем генеральной совокупности, t-критерий Стьюдента, дисперсия выборки, предельная ошибка выборки и т.д. В случае временного ряда репрезентативность достигается наличием информации по разным временным периодам.

На мой взгляд, при исследовании всего временного ряда в целом удобно осуществлять типический отбор, разбив генеральную совокупность на группы, соответствующие одним суткам. И затем для каждых суток по дате выберем случайным образом одно из часовых потреблений. По полученному ряду нельзя будет судить о суточных колебаниях газопотребления, но общую тенденцию проследить будет возможно.

В нашем же случае, при исследовании относительно стабильной области газопотребления, наоборот, больший интерес составляют суточные колебания, поэтому, выборку будем осуществлять из подгрупп соответствующих одному времени потребления.

Таким образом, выберем в качестве базовой 25%-ю выборку генеральной совокупности, т.е. выберем из каждой группы часовых значений 0,25*52=13 значений случайным образом. Пронумеруем все даты (52 шт.), и с помощью функции СЛУЧМЕЖДУ(1;52) определим по 13 значений каждой часовой группы.

Рисунок 18 - Определение номеров элементов, включаемых в выборку

Т.к. функция СЛУЧМЕЖДУ() пересчитывает значения после каждого операции, сохраним найденные значения в формате чисел без формулы.

Рисунок 19 - Формирование 25%-й выборки

Переместим сформированную выборку на отдельный лист.

Рисунок 20 - Сформированная базовая выборка

Основными характеристиками типической выборки являются объем выборки, выборочная средняя, выборочная дисперсия, средняя из внутригрупповых дисперсий, а также средняя и предельная ошибки выборки. В виду того, что все группы равны по числу наблюдений, среднюю из внутригрупповых дисперсий рассчитываем как среднюю арифметическую простую. Внутригрупповые и выборочную дисперсии найдем с помощью функции ДИСП().

Для типического повторного отбора средняя ошибка равна:

Для типического повторного отбора предельная ошибка равна:

Значение t-критерия Стьюдента находится по специальным таблицам. При вероятности 99,7% t=3.

Таблица 6 - Характеристики базовой выборки

Разделим базовую выборку на две подвыборки: первая будет охватывать значения от 0:00 до 11:00 включительно, вторая от 12:00 до 23:00 включительно. Гистограммы будем строить по алгоритму, рассмотренному на прошлом занятии. Для построения гистограмм определим количество и ширину интервалов для базовой выборки, а для подвыборок частоты будем определять по границам интервалов базовой выборки для наглядности изображения гистограмм.

Таблица 7 - Данные для построения гистограмм

Интервал

нижняя граница

верхняя граница

базовая выборка

подвыборка 1

подвыборка 2

Уже глядя на таблицу можно сказать о том, что законы распределения базовой выборки и подвыборок будут отличаться. Что подтверждает предположения, выдвинутые в п.1 и 2 о различиях между выборкой и временным рядом и репрезентативности данных временного ряда.

Рисунок 21 - Гистограмма по базовой выборке и по подвыборкам

Внешний вид диаграмм по базовой выборке и по подвыборкам 1 и 2 различается. В первых интервалах частоты по базовой выборке ближе к частотам подвыборки 1, в последних - подвыборки 2. Это связано с тем, что до 11:00 объем часового газопотребления меньше, чем после 11:00. Данная гистограмма прекрасно иллюстрирует различие между выборкой и временным рядом и статистическую зависимость элементов временных рядов. Законы распределения всех трех рассматриваемых элементов различны.

Найдем характеристики двух подвыборок.

Таблица 8 - Характеристики подвыборок

Характеристики подвыборок

Подвыборка 1 до 11:00

Подвыборка 2 с 12:00

Значение

Значение

Изменение значения относительно характеристик базовой выборки

Выборочная средняя

Выборочная дисперсия

Средняя из внутригрупповых дисперсий

Объем выборки

Ошибки выборки

предельная

Выборочная средняя в первой и второй подвыборках отличаются от средней базовой выборки на -4,23% и +4,23% соответственно. Этот факт подтверждает возможность изменения характеристик во временных рядах по времени.

Выборочная дисперсия во второй подвыборке меньше дисперсии базовой выборки на 55,56%. Данное различие является очень существенным.

Сокращение объема выборки обусловлено разбиением базовой выборки на две равные части.

Ошибки выборки в двух подвыборках значительно выше ошибок базовой выборки.

Определим доверительные интервалы для математических ожиданий базовой выборки и двух подвыборок с помощью функции ДОВЕРИТ.

Таблица 9 - Определение границ доверительных интервалов для математического ожидания

Изобразим схематически доверительные вероятности для математических ожиданий трех рассматриваемых выборок.

Рисунок 22 - Схематическое изображение доверительных интервалов математических ожиданий базовой выборки и подвыборок

Доверительные интервалы не пересекаются между собой, следовательно вероятность равенства математических ожиданий базовой выборки и какой-либо из подвыборок равна 0. Рассчитаем для математического ожидания каждой подвыборки доверительный интервал, используя стандартное отклонение базовой выборки.

Таблица 10 - Расчет новых доверительных интервалов

Для первой подвыборки доверительный интервал изменился незначительно, т.к. стандартное отклонение первой подвыборки близко к стандартному отклонению базовой выборки. Для второй подвыборки доверительный интервал увеличился почти в два раза, что обусловлено аналогичным увеличением задаваемого стандартного отклонения. Расширение доверительного интервала связано с увеличением стандартного отклонения, которое характеризует разброс случайной величины относительно среднего значения. Увеличивается стандартное отклонение, следовательно, увеличивается разброс, что приводит к расширению границ доверительного интервала. Также косвенно обосновать расширение доверительного интервала возможно по правилу трех сигм, которое утверждает: вероятность того, что случайная величина отклонится от своего математического ожидание на величину, большую чем утроенное среднее квадратичное отклонение, практически равна нулю. Чем больше значение стандартного отклонения, тем шире интервал колебаний случайной величины, и следовательно, тем шире доверительный интервал для математического ожидания. Значительное увеличение ошибок выборки и отсутствие пересечений в доверительных интервалах базовой выборки и подвыборок делают данные подвыборки не репрезентативной с точки зрения исследования всего временного ряда динамики часового газопотребления. Данные подвыборки могут быть использованы для анализа и прогноза газопотребления в различное время суток с 0:00 до 11:00 и с 12:00 до 23:00. По такому же принципу можно было сформировать подвыборки и прогнозировать часовое газопотребление в стабильный период в дневное и ночное время. В главе была изучена возможность использования части временного ряда вместо целого при анализе и прогнозе. Значительное увеличение ошибок выборки и отсутствие пересечений в доверительных интервалах базовой выборки и подвыборок делают данные подвыборки не репрезентативной с точки зрения исследования всего временного ряда динамики часового газопотребления. Данные подвыборки могут быть использованы для анализа и прогноза газопотребления в различное время суток с 0:00 до 11:00 и с 12:00 до 23:00. По такому же принципу можно было сформировать подвыборки и прогнозировать часовое газопотребление в стабильный период в дневное и ночное время.

Понятие репрезентативности часто встречается в статистических отчетностях и при подготовке выступлений и докладов. Пожалуй, без нее трудно представить себе какой-либо из видов подачи информации на обозрение.

Репрезентативность - что это?

Репрезентативность отражает, насколько выбранные объекты или части соответствуют содержанию и смыслу совокупности данных, из которой они были выбраны.

Другие определения

Понятие репрезентативности можно раскрывать в разных контекстах. Но по своему смыслу репрезентативность - это соответствие черт и свойств выбранных единиц из общей совокупности, которые точно отражают характеристики всей генеральной базы данных в целом.

Также репрезентативность информации определяют как способность выборочных данных представить параметры и свойства совокупности, важные с точки зрения проводимого исследования.

Репрезентативная выборка

Принцип формирования выборки заключается в избрании наиболее важных и точно отображающих свойства общей совокупности данных. Для этого используются различные методы, которые позволяют получать точные результаты и общее представление о используя только выборочные материалы, описывающие качества всех данных.

Таким образом, нет необходимости изучать весь материал, а достаточно рассмотреть выборочную репрезентативность. Что это? Это выборка отдельных данных для того, чтобы иметь понятие об общей массе информации.

Их в зависимости от способа различают как вероятностные и невероятностные. Вероятностная - это выборка, которая производится путем вычисления наиболее важных и интересных данных, являющихся в дальнейшем представителями генеральной совокупности. Это обдуманный выбор или случайная выборка, тем не менее, обоснованная своим содержанием.

Невероятностная - это одна из разновидностей случайной выборки, составляющаяся по принципу обычной лотереи. В таком случае не учитывается мнение того, кто составляет такую выборку. Используется лишь слепой жребий.

Вероятностная выборка

Вероятностные выборки также могут подразделяться на несколько видов:

  • Одна из самых простых и понятных принципов - это нерепрезентативная выборка. К примеру, такой способ часто используется при проведении социальных опросов. При этом участники опроса не выбираются из толпы по каким-либо определенным признакам, и получение информации производится у первых 50 людей, принявших участие в нём.
  • Преднамеренные выборки отличаются тем, что имеют ряд требований и условий при отборе, однако все же полагаются на случайное совпадение, не преследуя своей целью достижение хорошей статистики.
  • Выборка на основании квот - это еще одна из вариаций невероятностной выборки, которая часто используется для исследования больших совокупностей данных. Для нее используется множество условий и норм. Подбираются объекты, которые должны им соответствовать. То есть на примере социального опроса можно предположить, что опрошены будут 100 человек, но только мнение некоторого числа людей, которые будут соответствовать установленным требованиям, будут учтены при составлении статистического отчета.

Вероятностные выборки

Для вероятностных выборок исчисляется ряд параметров, которым объекты в выборке будут соответствовать, и среди них разными способами могут избираться именно те факты и данные, которые будут представлены как репрезентативность данных выборки. Такими способами вычисления нужных данных могут быть:

  • Простая случайная выборка. Заключается в том, что среди выбранного сегмента совершенно случайным методом лотереи выбирается необходимое количество данных, которые будут являться репрезентативной выборкой.
  • Систематическая и случайная выборка дает возможность составить систему вычисления необходимых данных на основе случайно выбранного сегмента. Таким образом, если первое случайное число, которое указывает на порядковый номер данных, выбранных из общей совокупности, будет 5, то последующими данными, которые будут выбраны, могут стать, например, 15, 25, 35 и так далее. Этот пример наглядно объясняет, что даже случайный выбор может основываться на систематических вычислениях необходимых исходных данных.

Выборка потребителей

Осмысленная выборка - это способ, который заключается в рассмотрении каждого отдельного сегмента, и на основании его оценки составляется совокупность, отражающая характеристики и свойства общей базы данных. Таким образом набирается большее количество данных, соответствующих требованиям репрезентативной выборки. Можно легко отобрать некоторое количество вариантов, которые не войдут в общее число, не потеряв при этом качество отобранных данных, представляющих общую совокупность. Таким способом определяется репрезентативность результатов исследования.

Размер выборки

Не последний вопрос, который необходимо решить, - это размер выборки для репрезентативного представления генеральной совокупности. Размер выборки не всегда зависит от количества исходников в генеральной совокупности. Однако репрезентативность выборочной совокупности напрямую зависит от того, на сколько сегментов должен быть в итоге разделён результат. Чем больше таких сегментов, тем больше данных попадает в результативную выборку. Если результаты требуют общего обозначения и не требуют конкретики, тогда, соответственно, выборка становится меньше, поскольку, не вдаваясь в детали, информация излагается более поверхностно, а значит, ее прочтение будет общим.

Понятие ошибки репрезентативности

Ошибка репрезентативности - это конкретные расхождения между характеристиками генеральной совокупности и выборочных данных. При проведении любого выборочного исследования невозможно получить абсолютно точные данные, как при полном исследовании генеральных совокупностей и выборки, представленной лишь частью сведений и параметров, тогда как более детальное изучение возможно только при исследовании всей совокупности. Таким образом, неизбежны некоторые погрешности и ошибки.

Виды ошибок

Различают некоторые ошибки, которые возникают при составлении репрезентативной выборки:

  • Систематические.
  • Случайные.
  • Преднамеренные.
  • Непреднамеренные.
  • Стандартные.
  • Предельные.

Основанием для появления случайных ошибок может быть несплошной характер исследования общей совокупности. Обычно случайная ошибка репрезентативности имеет незначительный размер и характер.

Систематические ошибки между тем возникают при нарушении правил отбора данных из общей совокупности.

Средняя ошибка - это разница между усредненными значениями выборки и основной совокупностью. Она не зависит от количества единиц в выборке. Она обратно пропорциональна Тогда чем больше объем, тем меньше значение средней ошибки.

Предельная ошибка - это наибольшая возможная разница между усредненными значениями сделанной выборки и общей совокупностью. Такая ошибка охарактеризовывается как максимум вероятных ошибок при заданных условиях их появления.

Преднамеренные и непреднамеренные ошибки репрезентативности

Ошибки смещения данных бывают преднамеренными и непреднамеренными.

Тогда причинами появления преднамеренных ошибок является подход к подбору данных по методу определения тенденций. Непреднамеренные ошибки возникают еще на стадии подготовки выборочного наблюдения, формирования репрезентативной выборки. Для недопущения подобных ошибок необходимо создать хорошую основу для выборки, составляющей списки единиц отбора. Она должна полностью соответствовать целям проведения выборки, быть достоверной, охватывающей все аспекты исследования.

Валидность, надежность, репрезентативность. Расчет ошибок

Расчет ошибки репрезентативности (Мм) средней арифметической величины (М).

Среднее квадратическое отклонение: численность выборки (>30).

Ошибка репрезентативности (Мр) и (Р): численность выборки (n>30).

В том случае, когда приходится изучать совокупность, где количество выборки мало и составляет меньше 30 единиц, тогда число наблюдений станет меньше на одну единицу.

Величина ошибки прямо порциональна объему выборки. Репрезентативность информации и вычисление степени возможности составления точного прогноза отражает определенная величина предельной ошибки.

Репрезентативные системы

Не только в процессе оценки подачи информации используется репрезентативная выборка, но и сам человек, получающий информацию, использует репрезентативные системы. Таким образом, мозг обрабатывает некоторое создавая репрезентативную выборку из всего потока информации, чтобы качественно и быстро оценить подаваемые данные и понять суть вопроса. Ответить на вопрос: «Репрезентативность - что это?» - в масштабах человеческого сознания довольно просто. Для этого мозг использует все подвластные в зависимости от того, какую именно информацию необходимо вычленить из общего потока. Таким образом, различают:

  • Визуальную репрезентативную систему, где задействуются органы зрительного восприятия глаза. Люди, часто использующие подобную систему, называются визуалами. С помощью этой системы человек обрабатывает информацию, поступающую в виде изображений.
  • Аудиальная репрезентативная система. Главный орган, который используется - это слух. Информация, подаваемая в виде звуковых файлов или речи, обрабатываются именно этой системой. Люди, лучше воспринимающие информацию на слух, называются аудиалами.
  • Кинестетическая репрезентативная система представляет собой обработку потока информации, путем восприятия его с помощью обонятельных и осязательных каналов.

  • Дигитальная репрезентативная система используется вместе с другими как средство получения информации извне. восприятие и осмысление полученных данных.

Итак, репрезентативность - что это? Простая выборка из множества или неотъемлемая процедура при обработке информации? Однозначно можно сказать, что репрезентативность во многом определяет наше восприятие потоков данных, помогая вычленить из него наиболее веские и значимые.