Сколько людей вмещает земля. Сколько людей поместится на Земле? Для того чтобы избежать субъективных суждений, следует использовать научные методы подсчета участников массовых мероприятий

Репрезентативность выборки

Наименование параметра Значение
Тема статьи: Репрезентативность выборки
Рубрика (тематическая категория) Психология

Требования к выборке

К выборке применяется ряд обязательных требований, опре­делœенных, прежде всœего, целями и задачами исследования. Плани­рование эксперимента должно включать в себя учет, как объёма выборки, так и ряда ее особенностей. Так, в психологических ис­следованиях важно требование однородности выборки. Оно озна­чает, что психолог, изучая, к примеру, подростков, не может, включать в эту же выборку взрослых людей. Напротив, исследо­вание, выполненное методом возрастных срезов, принципиаль­но предполагает наличие разновозрастных испытуемых. При этом и в данном случае должна соблюдаться однородность выборки, но уже по другим критериям, в первую очередь таким, как возраст, пол. Основаниями для формирования однородной выборки могут служить разные характеристики, такие, как уровень интеллекта͵ национальность, отсутствие определœенных заболеваний и т.д., исходя из целœей исследования.

В общей статистике имеется понятие повторной и безповторной выборки, или, иначе говоря, выборки с возвратом и без возврата. В качестве примера приводится, как правило, выбор шара, доставаемого из какой-либо емкости. В случае выборки с возвратом каждый выбранный шар опять возвращается в емкость и, следовательно, должна быть выбран снова. При бесповторном выборе однажды выбранный шар откладывается в сторону и больше не может участвовать в выборке. В психологических исследованиях можно найти аналоги подобного рода способам организации выборочного исследования, поскольку психологу нередко приходится несколько раз тестировать одних и тех же испытуемых при помощи одной и той же методики. При этом, строго говоря, повторной в данном случае является процедура тес­тирования. Выборка испытуемых при полной тождественности состава в случае повторных исследований всœегда будет иметь не­которые отличия, обусловленные функциональной и возрастной изменчивостью, присущей всœем людям. Подобная выборка по ха­рактеру проведения процедуры является повторной, хотя смысл термина здесь, очевидно, иной, чем в случае с шарами.

Важно подчеркнуть, что всœе требования, предъявляемые к любой выборке, сводятся к тому, что на ее базе психологом должна быть получена наиболее полная, неискаженная инфор­мация об особенностях генеральной совокупности, из которой взята эта выборка. Иными словами, выборка должна как можно более полно отражать характеристики изучаемой генеральной со­вокупности.

Состав экспериментальной выборки должен представлять (моделировать) генеральную совокупность, поскольку выводы, полученные в эксперименте, предполагается в дальнейшем пе­ренести на всю генеральную совокупность. По этой причине выборка должна обладать особым качеством - репрезентативностью, позволяющим распространить полученные на ней выводы на всю генеральную совокупность.

Репрезентативность выборки очень важна, тем не менее, по объективным причинам соблюдать её крайне сложно. Так, хоро­шо известен факт, что от 70% до 90% всœех психологических ис­следований поведения человека проводились в США в 60-х годах XX века с испытуемыми-студентами колледжей, причем боль­шинство из них были студентами психологами. В лабораторных исследованиях, выполняемых на животных, наиболее распрост­раненным объектом изучения являются крысы. По этой причине неслу­чайно психологию называли раньше ʼʼнаукой о студентах-второ­курсниках и белых крысахʼʼ. Студенты психологических коллед­жей составляют всœего 3% от общей численности населœения США. Очевидно, что выборка студентов нерепрезентативна в качестве модели, претендующей на представительство всœего населœения страны.

Репрезентативная выборка, или, как еще говорят, предста­вительная выборка, - это такая выборка, в которой всœе основ­ные признаки генеральной совокупности представлены прибли­зительно в той же пропорции и с той же частотой, с которой данный признак выступает в данной генеральной совокупности. Иными словами, репрезентативная выборка представляет собой меньшую по размеру, но точную модель той генеральной сово­купности, которую она должна отражать. В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно с большой долей уверенности считать применимыми ко всœей генеральной совокупности. Это распространение результатов принято называть генерализуемостью.

В идеале репрезентативная выборка должна быть такой, чтобы каждая из базовых изучаемых психологом характерис­тик, черт, особенностей личности и т.п. была бы представлена в ней пропорционально этим же особенностям в генеральной совокупности. Согласно этим требованиям процедура форми­рования выборки должна иметь внутреннюю логику, способ­ную убедить исследователя, что при сравнении с генеральной совокупностью она действительно окажется репрезентатив­ной, представительной.

В своей конкретной деятельности психолог действует следую­щим образом: устанавливает подгруппу (выборку) внутри гене­ральной совокупности, подробно изучает эту выборку (проводит с ней экспериментальную работу), а затем, в случае если это позволяют результаты статистического анализа, распространяет полученные выводы на всю генеральную совокупность. Это и есть основные этапы работы психолога с выборкой.

Начинающий психолог должен иметь в виду часто повторяю­щуюся ошибку: каждый раз, когда он осуществляет сбор любых данных любым методом и из любого источника, у него всœегда появляется соблазн распространить свои выводы на всю гене­ральную совокупность. Для того чтобы избежать подобной ошиб­ки, нужно не просто обладать здравым смыслом, но, прежде всœе­го, хорошо владеть основными понятиями математической ста­тистики.

Репрезентативность выборки - понятие и виды. Классификация и особенности категории "Репрезентативность выборки" 2017, 2018.

Между временным рядом и случайной выборкой существуют принципиальные различия. Во-первых, элементы случайной выборки являются статистически независимыми, а элементы временного ряда - нет, т.к. во временном ряде можно проследить тенденцию развития и прогнозировать значения на будущее. Во-вторых, члены временного ряда не являются одинаково распределенными. В-третьих, у случайной выборки математическое ожидание, дисперсия, среднеквадратическое отклонение являются постоянными, в отличии от временного ряда, который отражает динамику развития какого-либо признака во времени, в связи с чем могут меняться во времени и числовые характеристики.

Репрезентативность выборки - это соответствие характеристик выборки характеристикам генеральной совокупности. Репрезентативность выборки определяет на сколько можно переносить выводы, сделанные по исследуемой выборке, на генеральную совокупность. Для обеспечения высокой репрезентативности выборки необходимо обеспечить большой объем выборки и наличие в ней, элементов из всех групп генеральной совокупности. Для достижения высокой репрезентативности временного ряда необходимо анализировать достаточно продолжительный объем данных, изменяющихся во времени, т.к. например, наличие данные о часовом газопотреблении за 1 января в течение нескольких лет не позволит прогнозировать объем газопотребления за другие даты. Т.е. для обеспечения репрезентативности временного ряда необходимо обеспечить наличие ряда наблюдений, в различные периоды времени.

Репрезентативность выборки определяется в первую очередь ее объемом. К тому же отбор показателей должен осуществляться из однородных групп, причем вероятность попадания любого элемента генеральной совокупности в выборку должна быть одинаковой для всех элементов. В свою очередь на объем выборки влияет способ осуществления отбора. Объем выборки определяется рядом факторов: объем генеральной совокупности, t-критерий Стьюдента, дисперсия выборки, предельная ошибка выборки и т.д. В случае временного ряда репрезентативность достигается наличием информации по разным временным периодам.

На мой взгляд, при исследовании всего временного ряда в целом удобно осуществлять типический отбор, разбив генеральную совокупность на группы, соответствующие одним суткам. И затем для каждых суток по дате выберем случайным образом одно из часовых потреблений. По полученному ряду нельзя будет судить о суточных колебаниях газопотребления, но общую тенденцию проследить будет возможно.

В нашем же случае, при исследовании относительно стабильной области газопотребления, наоборот, больший интерес составляют суточные колебания, поэтому, выборку будем осуществлять из подгрупп соответствующих одному времени потребления.

Таким образом, выберем в качестве базовой 25%-ю выборку генеральной совокупности, т.е. выберем из каждой группы часовых значений 0,25*52=13 значений случайным образом. Пронумеруем все даты (52 шт.), и с помощью функции СЛУЧМЕЖДУ(1;52) определим по 13 значений каждой часовой группы.

Рисунок 18 - Определение номеров элементов, включаемых в выборку

Т.к. функция СЛУЧМЕЖДУ() пересчитывает значения после каждого операции, сохраним найденные значения в формате чисел без формулы.

Рисунок 19 - Формирование 25%-й выборки

Переместим сформированную выборку на отдельный лист.

Рисунок 20 - Сформированная базовая выборка

Основными характеристиками типической выборки являются объем выборки, выборочная средняя, выборочная дисперсия, средняя из внутригрупповых дисперсий, а также средняя и предельная ошибки выборки. В виду того, что все группы равны по числу наблюдений, среднюю из внутригрупповых дисперсий рассчитываем как среднюю арифметическую простую. Внутригрупповые и выборочную дисперсии найдем с помощью функции ДИСП().

Для типического повторного отбора средняя ошибка равна:

Для типического повторного отбора предельная ошибка равна:

Значение t-критерия Стьюдента находится по специальным таблицам. При вероятности 99,7% t=3.

Таблица 6 - Характеристики базовой выборки

Разделим базовую выборку на две подвыборки: первая будет охватывать значения от 0:00 до 11:00 включительно, вторая от 12:00 до 23:00 включительно. Гистограммы будем строить по алгоритму, рассмотренному на прошлом занятии. Для построения гистограмм определим количество и ширину интервалов для базовой выборки, а для подвыборок частоты будем определять по границам интервалов базовой выборки для наглядности изображения гистограмм.

Таблица 7 - Данные для построения гистограмм

Интервал

нижняя граница

верхняя граница

базовая выборка

подвыборка 1

подвыборка 2

Уже глядя на таблицу можно сказать о том, что законы распределения базовой выборки и подвыборок будут отличаться. Что подтверждает предположения, выдвинутые в п.1 и 2 о различиях между выборкой и временным рядом и репрезентативности данных временного ряда.

Рисунок 21 - Гистограмма по базовой выборке и по подвыборкам

Внешний вид диаграмм по базовой выборке и по подвыборкам 1 и 2 различается. В первых интервалах частоты по базовой выборке ближе к частотам подвыборки 1, в последних - подвыборки 2. Это связано с тем, что до 11:00 объем часового газопотребления меньше, чем после 11:00. Данная гистограмма прекрасно иллюстрирует различие между выборкой и временным рядом и статистическую зависимость элементов временных рядов. Законы распределения всех трех рассматриваемых элементов различны.

Найдем характеристики двух подвыборок.

Таблица 8 - Характеристики подвыборок

Характеристики подвыборок

Подвыборка 1 до 11:00

Подвыборка 2 с 12:00

Значение

Значение

Изменение значения относительно характеристик базовой выборки

Выборочная средняя

Выборочная дисперсия

Средняя из внутригрупповых дисперсий

Объем выборки

Ошибки выборки

предельная

Выборочная средняя в первой и второй подвыборках отличаются от средней базовой выборки на -4,23% и +4,23% соответственно. Этот факт подтверждает возможность изменения характеристик во временных рядах по времени.

Выборочная дисперсия во второй подвыборке меньше дисперсии базовой выборки на 55,56%. Данное различие является очень существенным.

Сокращение объема выборки обусловлено разбиением базовой выборки на две равные части.

Ошибки выборки в двух подвыборках значительно выше ошибок базовой выборки.

Определим доверительные интервалы для математических ожиданий базовой выборки и двух подвыборок с помощью функции ДОВЕРИТ.

Таблица 9 - Определение границ доверительных интервалов для математического ожидания

Изобразим схематически доверительные вероятности для математических ожиданий трех рассматриваемых выборок.

Рисунок 22 - Схематическое изображение доверительных интервалов математических ожиданий базовой выборки и подвыборок

Доверительные интервалы не пересекаются между собой, следовательно вероятность равенства математических ожиданий базовой выборки и какой-либо из подвыборок равна 0. Рассчитаем для математического ожидания каждой подвыборки доверительный интервал, используя стандартное отклонение базовой выборки.

Таблица 10 - Расчет новых доверительных интервалов

Для первой подвыборки доверительный интервал изменился незначительно, т.к. стандартное отклонение первой подвыборки близко к стандартному отклонению базовой выборки. Для второй подвыборки доверительный интервал увеличился почти в два раза, что обусловлено аналогичным увеличением задаваемого стандартного отклонения. Расширение доверительного интервала связано с увеличением стандартного отклонения, которое характеризует разброс случайной величины относительно среднего значения. Увеличивается стандартное отклонение, следовательно, увеличивается разброс, что приводит к расширению границ доверительного интервала. Также косвенно обосновать расширение доверительного интервала возможно по правилу трех сигм, которое утверждает: вероятность того, что случайная величина отклонится от своего математического ожидание на величину, большую чем утроенное среднее квадратичное отклонение, практически равна нулю. Чем больше значение стандартного отклонения, тем шире интервал колебаний случайной величины, и следовательно, тем шире доверительный интервал для математического ожидания. Значительное увеличение ошибок выборки и отсутствие пересечений в доверительных интервалах базовой выборки и подвыборок делают данные подвыборки не репрезентативной с точки зрения исследования всего временного ряда динамики часового газопотребления. Данные подвыборки могут быть использованы для анализа и прогноза газопотребления в различное время суток с 0:00 до 11:00 и с 12:00 до 23:00. По такому же принципу можно было сформировать подвыборки и прогнозировать часовое газопотребление в стабильный период в дневное и ночное время. В главе была изучена возможность использования части временного ряда вместо целого при анализе и прогнозе. Значительное увеличение ошибок выборки и отсутствие пересечений в доверительных интервалах базовой выборки и подвыборок делают данные подвыборки не репрезентативной с точки зрения исследования всего временного ряда динамики часового газопотребления. Данные подвыборки могут быть использованы для анализа и прогноза газопотребления в различное время суток с 0:00 до 11:00 и с 12:00 до 23:00. По такому же принципу можно было сформировать подвыборки и прогнозировать часовое газопотребление в стабильный период в дневное и ночное время.

Понятие репрезентативности в социологическом исследовании

Другими словами, репрезентативность – это качество выборки. Выборка может быть репрезентативной или нерепрезентативной. Если в социологическом исследовании применялась большая группа людей, то выборка будет репрезентативной.

Определение 2

Выборка – это отобранное определенное количество элементов генеральной совокупности. Репрезентативная выборка характерна тем, что все элементы генеральной совокупности представлены в той же пропорции.

Репрезентативность выборки социологического исследования определяется двумя случайными компонентами: ошибками, которые были допущены при регистрации и случайными ошибками.

Пример 1

Например: если объект социологического исследования сложный и имеет несколько элементов, то потребуется большее количество интервьюеров. Не всегда все интервьюеры имеют хорошую квалификацию, что может привести к ошибкам при регистрации. В отличие от этого, проведение выборочного исследования интервьюерами, которые более подготовлены и проинструктированы, ведёт к уменьшению количества ошибок, то есть к случайным ошибкам.

Построение выборки сводится к трём основным проблемам:

  • определить объем выборки (то есть построить определенную процедуру, для того чтобы выборка была репрезентативной);
  • определить объём выборки (количество, которое нужно опросить);
  • оценка качества выборки (анализ точности результатов).

Замечание 1

Важно помнить, что показатели выборки и генеральной совокупности не должны превышать 5%. Если такая пропорция нарушается, то выводы такого социологического исследования не будут соответствовать действительности.

Типы выборок

Выборки делятся на: случайные и целенаправленные.

Случайная выборка является наиболее точной и репрезентативной. Суть данной выборки в том, что благодаря случайному отбору, все единицы генеральной совокупности имеют одинаковые шансы попасть в выборочную совокупность. Такой вид выборки обычно используется перед выборами, референдумами и другими массовыми мероприятиями. Помимо того, что данная выборка даёт нам точность, она имеет сложности в применении. Для того, чтобы провести случайною выборку, социолог должен иметь список элементов генеральной совокупности, что не всегда даётся легко. Случайный отбор требует большого объема выборки для получения точных результатов.

Разновидностями случайной выборки бывают серийная, районированная, механическая и другие.

  • Серийная или гнездовая выборка имеет вид серий. Заключается в отборе отдельных элементов (семья, группа, школа, коллектив и т.д.), которые подвергаются сплошному исследованию.
  • Районированную выборку используют в тех случаях, когда весь массив данных нужно разбить на однородные части. Такими частями могут выступать районы города.
  • Принцип механической выборки заключается в том, что все элементы генеральной совокупности относят в один список и с него через равные интегралы отбирают необходимое количество респондентов. Механическая выборка имеет соотношение генеральной совокупности к выборочной. Например: Если генеральная совокупность 2000 человек, а выборочная 200, то это значит, что с общего списка отбирается каждый десятый.

Целенаправленная выборка – это вид выборки, где отбор осуществляется по критериям доступности, типичности, равенства и т.д. Целенаправленная выборка делится на стихийную, метод снежного кома и квотную.

  • Стихийная выборка – это выборка первого встречного. Минус данной выборки заключается в том, что невозможно заранее установить генеральную совокупность.
  • Метод снежного кома заключается в нарастании информации. Каждый опрашиваемый респондент даёт контакты коллег, друзей, знакомых, которые могут принять участие в исследование и т.д.
  • Квотная выборка. В данной выборке все данные являются квотой. При использовании квотной выборки респондентов подбирают целенаправленно, придерживаясь параметров квот. Характеристики, которые отбирают по квотам – это пол, образование, возраст, уровень квалификации или другие, которые определяются целями и заданиями самого социологического исследования.

Фактически мы начнем не с одного, а с трех вопросов: что такое выборка? когда она является репрезентативной? что она собой представляет?

Совокупность – это любая группа людей, организаций, интересующих нас событий, относительно которых мы хотим сделать выводы, а случай, или объект, – любой элемент такой совокупности 1 .Выборка – любая подгруппа совокупности случаев (объектов), выделенная для анализа. Если мы захотим изучить деятельность законодателей штата по принятию решений, мы могли бы исследовать такую деятельность в законодательных органах штатов Виргиния, Северная Каролина и Южная Каролина, а не во всех пятидесяти штатах и, исходя из этого, распространить полученные данные на генеральную совокупность, из которой были выбраны эти три штата. Если мы хотим исследовать систему предпочтений избирателей Пенсильвании, мы могли бы сделать это, опросив 50 рабочих компании “Ю. С. Стил” в Питсбурге, и распространить результаты опроса на всех избирателей штата. Аналогично, если мы хотим измерить умственные способности студентов колледжей, мы могли быпротестировать всех игроков защиты, зарегистрированных в штате Огайо в данном футбольном сезоне, и затем распространить полученные результаты на генеральную совокупность, частью которой они являются. В каждом примере мы действуем следующим образом: устанавливаем подгруппу внутри генеральной совокупности, довольно подробно изучаем эту подгруппу, или выборку, и распространяем наши результаты на всю совокупность. Это и есть основные этапы формирования выборки.

Однако представляется совершенно очевидным, что каждая из этих выборок имеет существенный недостаток. К примеру, хотя законодательные органы Виргинии, Северной Каролины и Южной Каролины и являются частью совокупности законодательных органов штатов, они в силу исторических, географических и политических причин, скорее всего, будут действовать очень схожим образом и совсем иначе, чем законодательные органы таких отличающихся от них штатов, как Нью-Йорк, Небраска и Аляска. Хотя пятьдесят рабочих-сталелитейщиков в Питсбурге действительно могут быть избирателями штата Пенсильвания, они в силу социально-экономического статуса, образования и жизненного опыта, вполне возможно, будут иметь взгляды, отличные от взглядов многих других людей, точно так же являющихся избирателями. И точно так же, хотя футболисты штата Огайо и являются студентами колледжей, они в силу самых разных причин вполне могут отличаться от других студентов. Иными словами, хотя каждая из этих подгрупп действительно является выборкой, члены каждой из них систематически отличаются от большинства остальных членов совокупности, из которой они выбраны. В качестве отдельной группы ни одна из них не является типичной с точки зрения распределения признаков мнений, мотивов поведения и характеристик в генеральной совокупности, с которой она ассоциируется. Соответственно, политологи сказали бы, что ни одна из этих выборок не является репрезентативной.

Репрезентативная выборка – это такая выборка, в которой все основные признаки генеральной совокупности, из которой извлечена данная выборка, представлены приблизительно в той же пропорции или с той же частотой, с которой данный признак выступает в этой генеральной совокупности. Таким образом, если 50% всех законодательных органов штатов собираются лишь раз в два года, приблизительно половина состава репрезентативной выборки законодательных органов штатов должна быть такого типа. Если 30% избирателей Пенсильвании принадлежат к “синим воротничкам”, около 30% репрезентативной выборки для этих избирателей (а не 100%, как в приведенном выше примере) должны быть из числа “синих воротничков”. И если 2% всех студентов колледжей являются спортсменами, приблизительно та же самая часть репрезентативной выборки студентов колледжей должна приходиться на спортсменов. Инымисловами, репрезентативная выборка представляет собой микрокосм, меньшую по размеру, но точную модель генеральной совокупности, которую она должна отражать. В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно без всяких опасений считать применимыми к исходной совокупности. Это распространение результатов и есть то, что мы называем генерализуемостью.

Возможно, пояснить это поможет графическая иллюстрация. Предположим, мы хотим изучать модели членства в политических группах среди взрослого населения США. На рис.5.1 изображено три круга, разделенных на шесть равных секторов. Рис.5.1а представляет всю рассматриваемую совокупность. Члены совокупности расклассифицированы в соответствии с политическими группами (такими, как партии и группы интересов), к которым они относятся. В этом примере каждый взрослый принадлежит по меньшей мере к одной и не более чем к шести политическим группам; и эти шесть уровней членства в одинаковой степени распространены в совокупности (отсюда равные сектора). Предположим, мы хотим исследовать мотивы вступления людей в группу, выбор группы и модели участия, однако из-за ограниченности ресурсов мы в состоянии обследовать только одного из каждых шести членов совокупности. Кого же отобрать для анализа?

Рис. 5.1. Формирование выборки из генеральной совокупности

Одну из возможных выборок заданного объема иллюстрирует заштрихованная область на рис.5.1б, однако она явно не отражает структуру совокупности. Если бы мы делали обобщения на основе этой выборки, мы пришли бы к выводу: (1) что все взрослые американцы принадлежат к пяти политическим группам и (2) что все групповое поведение американцев совпадает с поведением тех, кто принадлежит именно к пяти группам. Однако мы знаем, что первый вывод не верен, и это может зародить в нас сомнение относительно валидности второго. Таким образом, выборка, изображенная на рис.5.1б, нерепрезентативна, поскольку она не отражает распределение данного свойства совокупности (часто называемогопараметром ) в соответствии с его реальным распространением. Про такую выборку говорят, что она смещена в направлении к членам пяти групп или смещена в направлении от всех остальных моделей членства в группах. Опираясь на такую смещенную выборку, мы обычно приходим к ошибочным выводам относительно генеральной совокупности.

Ярче всего это может быть продемонстрировано на примере катастрофы, постигшей в 30-е годы журнал “Литэрари дайджест”, который организовал опрос общественного мнения относительно результатов выборов. “Литэрари дайджест” представлял собой периодическое издание, в котором перепечатывались редакционные статьи из газет и другие материалы, отражавшие общественноемнение; этот журнал был очень популярен в начале века. Начиная с 1920 г. журнал проводил широкомасштабный общенациональный опрос, в ходе которого более чем миллиону человек по почте рассылались избирательные бюллетени с просьбой отметить, чья кандидатура на предстоящих президентских выборах для них предпочтительнее. В течение ряда лет результаты опроса, проводившиеся журналом, оказывались настолько точными, что опрос, проведенный в сентябре, казалось, делал ноябрьские выборы малосущественными. Да и как притакой большой выборке могла произойти ошибка? Однако в 1936 г. именно это и случилось: с большим перевесом голосов (60:40) победа была предсказана кандидату от республиканской партии Альфу Ландону. На выборах Ландон проиграл инвалиду – Франклину Д. Рузвельту – практически с тем же результатом, с которым должен был победить. Доверие к “Литэрари дайджест” было столь сильно подорвано, что вскоре после этого журнал перестал выходить. Что же произошло? Все очень просто: в голосовании, проведенном “Дайджест”, использовалась смещенная выборка. Почтовые открытки рассылались людям, чьи имена были извлечены из двух источников: телефонных справочников и списков регистрации автомобилей. И хотя прежде этот метод отбора не слишком отличался от других методов, совсем по-другому обстояло дело теперь, во время Великой депрессии 1936 г., когда менее состоятельные избиратели, наиболее вероятная опора Рузвельта, не могли позволить себе иметь телефон, не говоря уж об автомобиле. Таким образом, фактически выборка, использовавшаяся в опросе, организованном “Дайджест”, была смещена в сторону тех, кто, скорее всего, должен был выступать за республиканцев, и при этом еще удивительно, что у Рузвельта был такой хороший результат.

Как же решить эту проблему? Возвращаясь к нашему примеру, сравним выборку на рис.5.1б с выборкой на рис.5.1в. В последнем случае для анализа также отобрана шестая часть совокупности, однако каждый из основных типов совокупности представлен в выборке в той пропорции, в которой он представлен во всей совокупности. Такая выборка демонстрирует, что один из каждых шести взрослых американцев принадлежит к одной политической группе, один из шести – к двум и т.д. Такая выборка позволит также выявить другие различия между ее членами, которые могли бы соотноситься с участием в разном числе групп. Таким образом, выборка, представленная на рис.5.1в, является репрезентативной выборкой для рассматриваемой совокупности.

Конечно, данный пример является упрощенным по крайней мере с двух чрезвычайно важных точек зрения. Во-первых, большинство совокупностей, интересующих политологов, более разнообразно, чем та, что приведена в примере. Люди, документы, правительства, организации, решения и т.п. отличаются друг от друга не по одному, а по гораздо большему числу признаков. Таким образом, репрезентативная выборка должна быть такой, чтобы каждая из основных, отличная от других область была представлена пропорционально ее доле в совокупности. Во-вторых, ситуация, когда реальное распределение переменных, или признаков, которые мы хотим измерить, заранее неизвестно, встречается гораздо чаще, чем противоположная, – возможно, оно не измерялось в предшествующей переписи населения. Таким образом, репрезентативная выборка должна быть построена так, чтобы она могла точно отражать существующее распределение даже тогда, когда мы не в состоянии прямо оценить ее валидность. Процедура формирования выборки должна иметь внутреннюю логику, способную убедить нас, что, будь мы в состоянии сравнить выборку с переписью, она действительно оказалась бы репрезентативной.

Чтобы обеспечить возможность точного отражения сложной организации данной совокупности и определенную степень уверенности в том, что предлагаемые процедуры способны сделать это, исследователи обращаются к методам статистики. При этом они действуют по двум направлениям. Во-первых, используя определенные правила (внутреннюю логику), исследователи решают вопрос о том, какие именно конкретные объектыим изучать, что именно включать в конкретную выборку. Во-вторых, используя совсем другие правила, они решают, сколько объектов выбрать. Мы не будем подробно изучать эти многочисленные правила, рассмотрим лишь их роль в политологическом исследовании. Начнем рассмотрение со стратегий выбора объектов, образующих репрезентативную выборку.

Познакомимся с тремя понятиями, которые необходимо знать любому, кто так или иначе соприкасается с социологическими исследованиями: генеральная совокупность, выборочная совокупность (выборка), репрезентативность.

Генеральная совокупность – это все единицы определенного программой объекта исследования. Если мы говорим о всероссийском опросе общественного мнения, это будет все взрослое население России. Или все московские студенты, если мы возьмемся провести среди них опрос. Или все беспризорные дети Калуги, если мы собираемся предпринять социсследование на эту тему.

Выборочная совокупность (выборка) – это часть генеральной совокупности, которую мы будет непосредственно исследовать, то есть это те люди, к которым мы обратимся с вопросами интервью или с анкетами; те материалы, которые мы будет изучать методом контент-анализа и т. п.

Иногда выборка равна генеральной совокупности (например, в случае, когда мы опрашиваем всех студентов первого курса факультета журналистики МГУ). Но обычно она меньше, иногда в несколько десятков и сотен раз. При этом практика социологических исследований доказала, что в общенациональных исследованиях достаточно выбрать для опросов 1,5–2 тысячи человек. Если выборка хорошо, правильно, репрезентативно сформирована, то она может дать объективную информацию о мнении всех россиян.

Итак, главное – это правильно сформировать выборку. Объем выборки зависит от целей исследования, специфики и степени однородности объекта исследования, дробности групп, которые предстоит изучить, и планируемой степени ее репрезентативности. Что же означает это магическое и самое важное в эмпирической социологии понятие – «репрезентативность»?

Репрезентативность – это соответствие, адекватность выборочной совокупности (выборки) по основным характеристикам генеральной совокупности. Если в структуре населения 55 % женщин и 45 %; мужчин, то и в выборке должно быть такое же соотношение. То же самое можно сказать о возрасте, профессии, типе поселения и т. п. Короче, конфигурация выборки должна совпадать с конфигурацией генеральной совокупности. Это можно изобразить на таком рисунке (рис. 8).

Самое главное в социологическом исследовании – репрезентативность выборки, потому что именно с этим связана точность и объективность полученных результатов.

Выборка может формироваться разными путями. Но основных типов два репрезентативные и нерепрезентативные выборки.

Репрезентативные выборки

Вероятностная, или случайная, выборка строится на том, что любой из объектов генеральной совокупности имеет равную вероятность попасть в выборочную совокупность. Есть несколько подвидов вероятностной выборки.

1. Систематический отбор. Он весьма популярен и часто применяется в социсследованиях. Это значит, что в зависимости от величины выборки отбирается из генеральной совокупности каждый n -ый (6, 20, 45 и т. п.) объект. Например, мы опрашиваем взрослое население одного из избирательных участков. Берем избирательные списки. Предположим, в них будет 10 000 человек. А нам нужна выборка в 500 человек. Делим число 10 000 генеральной совокупности на число 500 выборки, получаем 20. Значит, из списков будем выбирать каждого двадцатого избирателя.

Предположим, что нам нужно опросить по телефону москвичей и выяснить у них, какую в данный момент они смотрят передачу по телевизору. Берем справочную телефонную книгу, считаем, сколько в ней номеров, делим это количество на то число, которое нам надо опросить, и получаем шаг, при котором мы будет вести систематический отбор номеров.

То же самое можно делать с домами на улицах, если мы будем опрашивать наших реципиентов дома. Например, на четной стороне улицы заходим в каждый пятый дом. И так далее.

2. Отбор по принципу лотереи или жребия . Этот способ вам хорошо знаком, когда вы бросаете в шапку, вазу, ящик, например, все улицы Москвы и выбираете 20, на которых будете проводить исследование. Так же могут быть выбраны регионы, населенные пункты, почтовые отделения и т. п.

3. Отбор методом случайных чисел . Для этого составляются специальные математические таблицы случайных чисел по количеству выборочной совокупности и выбирается объект, который промаркирован предварительно этой цифрой.

Квотная выборка формируется в соответствии с квотами (то есть объектами, имеющими определенный признак по полу, возрасту, месту жительства и т. п.), которые в процентном отношении соответствуют генеральной совокупности. Предположим, что мы исследуем население небольшого города и знаем, какое в нем процентное соотношение молодых, людей средних лет и пожилых, мужчин и женщин, работающих и пенсионеров. Мы должны отобрать для опроса людей с этими характеристиками в таком же процентном соотношении. Эта выборка по степени репрезентативности близка к вероятностной.

Стратифицированная выборка отличается от квотной тем, что искусственно, в связи с целями исследования, формируются слои, страты, которые подлежат изучению и, как правило, в количественном отношении они равны. Страты должны быть более однородными, чем вся совокупность. Например, мы изучаем читателей разных изданий: «АиФ», «Известий», «Труда», «Комсомольской правды», «МК» и формируем равные страты читателей разных изданий, предположим, по 200 человек.

Районированная выборка обычно используется при исследовании районов, часто с применением географической карты, схемы населенных пунктов и т. п., из которых выбираются определенные единицы для исследования. Например, выбираются области из разных географических зон России, или округа Москвы. Иногда применяется так называемая методика географического креста, когда выбираются точки на горизонтали и вертикали этого географического креста. Так формировалась выборка в исследованиях общественного мнения в 60-е годы в Институте общественного мнения при «Комсомольской правде».

Серийная, гнездовая, кластерная выборка работает не с единицами, а с гнездами, однородными группами (семья, производственная бригада, студенческая группа, болельщики футбольного матча, телезрители, которые смотрят ТВ в одной комнате, городские районы и т. п.). Обычно в таком случае проводится сплошной опрос.