Достоверность статистической выборки. Реферат: Выборочный метод в статистике. Смотреть что такое "Выборка" в других словарях

Выборочное исследование.

Понятие о выборочном методе.

Выборочное наблюдение – это такое несплошное наблюдение, при котором отбор подлежащих исследованию единиц совокупности осуществляется случайно, отобранная часть подвергается исследованию, после чего результаты распространяются на всю совокупность.

К использованию выборочного метода прибегают в тех случаях,

1 когда само наблюдение связано с порчей или уничтожением наблюдаемых единиц (пряжа на пряность, электрическая лампочка на продукт горения)

2 большой объем совокупности

3 большие затраты (финансовые и трудовые).

Обычно выборочному обследованию подвергается 5-10% всей совокупности, реже 15-25%.

Целью выборочного наблюдения является определение характеристик генеральной средней и генеральной доли (P). Характеристики выборочной совокупности –выборочная средняя и выборочная доля (w) отличаются от генеральных характеристик на величину ошибки выборки (). Потому необходимо вычислять ошибку выборки или ошибку репрезентативности, которая определяется по формулам, разработанным в теории вероятности для каждого вида выборки и способа отбора.

Существуют следующие способы отбора единиц:

1 отбор по схеме возвращенного шара, обычно называемый повторной выборкой .

При повторном отборе вероятность попадания каждой отдельной единицы в выборку остается постоянной, т.к. после отбора какой- то единицы, она снова возвращается в совокупность и снова может быть выбранной.

2 отбор по схеме невозвращенного шара, называемый бесповторной выборкой. В этом случае каждая отобранная единица не возвращается обратно, и вероятность попадания отдельных единиц в выборку все время изменяется (для оставшихся единиц она возрастет) (жеребьевка), таблицы случайных чисел например 75 из 780.

Виды выборок.

1 Собственно – случайная.

Это такая, при которой отбор единиц в выборочную совокупность производится непосредственно из всей массы единиц генеральной совокупности.

При этом количество отобранных единиц обычно определяется исходя из принятой доли выборки.

Для выборки есть отношение числа единиц выборочной совокупности и к численности единиц генеральной совокупности N.

Так при 5% выборке из партии товара в 2000 единиц численность выборки n составляет 100 ед. (
), а при 20% выборке она составит 400 ед.

(
)

Важное условие собственно случайной выборки в том, что каждой единице генеральной совокупности предоставляется равная возможность попасть в выборочную совокупность.

При случайном отборе предельная ошибка выборки для средней равна

- дисперсия выборочной совокупности

n- численность выборки

t- коэффициент доверия, который определяется по таблице значений интегральной функции Лапласа при заданной вероятности P.

При бесповторном отборе предельная ошибка выборки определяется по формуле для средней

где N –численность генеральной совокупности доли

Для определения зольности угля в порядке случайной выборке было обследовано 100 проб угля. В результате обследования установлено, что средняя зольность угля в выборке 16%, = 5%. В 10-ти пробах зольность угля составила >20% с вероятностью 0,954 определить пределы, в которых будет находиться средняя зольность угля в месторождении и доля угля с зольность >20%

Средняя зольность

определяем предельную ошибку выборки


2*0.5=1%

при p=0.954 t=2

доля угля с зольностью >20%

выборочная доля определяется

где m- доля единиц, обладающих признаком

ошибку выборки для доли

С вероятностью 0,954 можно утверждать, что доля угля с зольностью более 20% в месторождении будет находиться в пределах

P= 10%+(-)6% или

Механическая выборка.

Это разновидность собственно – случайной. В этом случае вся генеральная совокупность делится на n равных частей и затем из каждой части отбирается одна единица.

Все единицы генеральной совокупности должны располагаться в определенном порядке. При этом по отношению к изучаемому показателю единицы генеральной совокупности могут быть упорядочены по существенному, второстепенному или нейтральному признаку. При этом из каждой группы должна отбираться та единица, которая находится в середине каждой группы. Это позволяет избежать систематической ошибки выборки.

Применяют: при обследовании покупателей в магазинах, посетителей в поликлиниках, каждый 5,4,3 и т.д

Пример механическая выборка

Для определения среднего срока пользования краткосрочным кредитом в банке будет произведена 5% механическая выборка, в которую попало 100 счетов. В результате обследования установлено, что средний срок пользования краткосрочным кредитом 30 дней при
9дней в 5-ти счетах срок пользования кредитом > 60 дней.

Ошибка выборки

т.е. с вероятность 0,954 можно утверждать, что срок пользования кредитом колеблется

1 в пределах 30дн.+(-)2дня, т.е.

2 доли кредитов со сроком > 60дней.

выборочная доля составит

ошибку доли определим

с вероятностью 0,954 можно утверждать, что доля кредитов в банке со сроком пользования >60дней будет находиться в пределах

Типическая выборка.

Генеральная совокупность разделяется на однородные типические группы. Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность

Например: пр. тр. работников, состоящих из отдельных групп по квалификации.

Важная особенность – дает более точные результаты по сравнению с другими, т.к. в выборке участвует типологическая единица.

Отбор единиц наблюдения в выборочную совокупность производится различными методами. Рассмотрим типическую выборку с пропорциональным отбором внутри типических групп.

Объем выборки из типической группы при отборе пропорциональном численности типических групп, определяется по формуле

где =V выборки из типической группы

= V типической группы.

Предельная ошибка выборочной средней и доли при бесповторном случайном и механическом способе отбора внутри типических групп рассчитывается по формулам


где =дисперсия выборочной совокупности

Пример: типическая выборка

Для определения среднего возраста мужчин, вступающих в брак, в районе была произведена 5% выборка с отбором единиц пропорционально численности типических групп

Внутри групп применялся механический отбор

С вероятностью 0,954 определить пределы в которых будут находиться средний возраст мужчин, вступивших в брак, и долю мужчин, вступивших в брак вторично.

средний возраст вступают в брак мужчины в выборочной совокупности

предельная ошибка выборки

с вероятностью 0,954 можно утверждать, что средний возраст мужчин, вступающих в брак, будет находиться в пределах

для мужчин, вступающих во второй брак находиться в пределах

выборочная доля определяется

выборочная дисперсия альтернативного признака равна

с вероятностью 0,954 можно утверждать, что доля вступающих в брак во второй раз находится в пределах

Серийная выборка.

При серийной выборке совокупность делят на одинаковые по объему группы – серии. Выборочную совокупность отбираются серии. Внутри серий производится сплошное наблюдение единиц, попавших в серию.

При бесповторном отборе иопределяют по формуле

где
- межсерийная дисперсия

где
выборочная средняя серии

выборочная средняя серийной выборки

R- число серий генеральной совокупности

r- число отобранных серий

Пример: в цехе 10 бригад с целью изучения их производительности труда будет осуществлена 20% серийная выборка, в которую попали 2 бригады. В результате обследования установлено, что

с вероятностью 0,997 определить пределы, в которых будет находиться средняя выработка рабочих цеха.

выборочная средняя серийной выборки определяется по формуле

с вероятностью 0,997 можно утверждать, что средняя выработка рабочих цеха находится в пределах

На складе готовой продукции цеха находятся 200 ящиков деталей по 40 штук в каждом ящике. Для проверки качества готовой продукции будет произведена 10% серийная выборка. В результате выборки установлено, что для бракованных деталей составляет 15%. Дисперсия серийной выборки равна 0,0049.

С вероятностью 0,997 определить пределы, в которых находится доля бракованной продукции в партии ящиков

Доля бракованных деталей будет находиться в пределах

определим предельную ошибку выборки для доли по формуле

с вероятностью 0,997 можно утверждать, что доля бракованных деталей

в партии находится в пределах

В практике проектирования выборочного наблюдения возникает потребность нахождении численности выборки, которая необходима для обеспечения определенной точности расчета генеральных характеристик - средней и доли.

Предельная ошибка выборки, вероятность ее появления и вариация признака предварительно известны.

При случайном повторном отборе численность выборки определяется по формуле

при случайном бесповторном и механическом отборе численность выборки

для типической выборки

для серийной выборки

Пример в районе проживает 2000 семей.

Предполагается провести их выборочное обследование методом случайного бесповторного отбора для нахождения среднего размера семьи.

Определить необходимую численность выборки при условии, что с вероятностью 0,954 ошибка выборки не превысит 1 человека при среднем квадратическом отклонении 3 человека.

В городе проживает 10тыс. семей. С помощью механической выборки предлагается определить долю семей с тремя детьми и более. Какова должна быть численность выборки, чтобы с вероятностью Р=0,954 ошибка выборки не превышала 0,02, если на основе предыдущих обследований известно, что дисперсия равна 0,02?

Один из главных компонентов тщательно продуманного исследования – определение выборки и что такое репрезентативная выборка. Это как в примере с тортом. Ведь не обязательно съедать весь десерт, чтобы понять его вкус? Достаточно небольшой части.

Так вот, торт – это генеральная совокупность (то есть все респонденты, которые подходят для опроса). Она может быть выражена территориально, например, лишь жители Московской области. Гендерно – только женщины. Или иметь ограничения по возрасту – россияне старше 65 лет.

Высчитать генеральную совокупность сложно: нужно иметь данные переписи населения или предварительных оценочных опросов. Поэтому обычно генеральную совокупность «прикидывают», а из полученного числа высчитывают выборочную совокупность или выборку .

Что такое репрезентативная выборка?

Выборка – это чётко определенное количество респондентов. Её структура должна максимально совпадать со структурой генеральной совокупности по основным характеристикам отбора.

Например, если потенциальные респонденты – всё население России, где 54% — это женщины, а 46% — мужчины, то выборка должна содержать точно такое же процентное соотношение. Если совпадение параметров происходит, то выборку можно назвать репрезентативной. Это значит, что неточности и ошибки в исследовании сводятся к минимуму.

Объем выборки определяется с учётом требований точности и экономичности. Эти требования обратно пропорциональны друг другу: чем больше объем выборки, тем точнее результат. При этом чем выше точность, тем соответственно больше затрат необходимо на проведение исследования. И наоборот, чем меньше выборка, тем меньше на неё затрат, тем менее точно и более случайно воспроизводятся свойства генеральной совокупности.

Поэтому для вычисления объема выбора социологами была изобретена формула и создан специальный калькулятор :

Доверительная вероятность и доверительная погрешность

Что означают термины «доверительная вероятность » и «доверительная погрешность »? Доверительная вероятность – это показатель точности измерений. А доверительная погрешность – это возможная ошибка результатов исследования. К примеру, при генеральной совокупности более 500 00 человек (допустим, проживающие в Новокузнецке) выборка будет равняться 384 человека при доверительной вероятности 95% и погрешности 5% ИЛИ (при доверительном интервале 95±5%).

Что из этого следует? При проведении 100 исследований с такой выборкой (384 человека) в 95 процентов случаев получаемые ответы по законам статистики будут находиться в пределах ±5% от исходного. И мы получим репрезентативную выборку с минимальной вероятностью статистической ошибки.

После того, как подсчет объема выборки выполнен, можно посмотреть есть ли достаточное число респондентов в демо-версии Панели Анкетолога . А как провести панельный опрос можно подробнее узнать .

В теории выборочного метода разработаны различные способы отбора и виды выборки, обеспечивающие репрезентативность. Под способом отбора понимают порядок отбора единиц из генеральной совокупности. Различают два способа отбора: повторный и бесповторный. При повторном отборе каждая отобранная в случайном порядке единица после ее обследования возвращается в генеральную совокупность и при последующем отборе может снова попасть в выборку. Этот способ отбора построен по схеме «возвращенного шара»: вероятность попасть в выборку для каждой единицы генеральной совокупности не меняется независимо от числа отбираемых единиц. При бесповторном отборе каждая единица, отобранная в случайном порядке, после ее обследования в генеральную совокупность не возвращается. Этот способ отбора построен по схеме «невозвращенного шара»: вероятность попасть в выборку для каждой единицы генеральной совокупности увеличивается по мере производства отбора.

В зависимости от методики формирования выборочной совокупности различают следующие основные виды выборки:

собственно случайную;

механическую;

типическую (стратифицированную, районированную);

серийную (гнездовую);

комбинированную;

многоступенчатую;

многофазную;

взаимопроникающую.

Собственно случайная выгборка формируется в строгом соответствии с научными принципами и правилами случайного отбора. Для получения собственно случайной выборки генеральная совокупность строго подразделяется на единицы отбора, и затем в случайном повторном или бесповторном порядке отбирается достаточное число единиц.

Случайный порядок подобен жеребьевке. На практике он чаще всего применяется при использовании специальных таблиц случайных чисел. Если, например, из совокупности, содержащей 1587 единиц, следует отобрать 40 единиц, то из таблицы отбирают 40 четырехзначных чисел, которые меньше 1587.

В том случае, когда собственно случайная выборка организуется как повторная, расчет стандартной ошибки производится в соответствии с формулой (6.1). При бесповторном способе отбора формула для расчета стандартной ошибки будет:


где 1 – n / N – доля единиц генеральной совокупности, не попавших в выборку. Так как эта доля всегда меньше единицы, то ошибка при бесповторном отборе при прочих равных условиях всегда меньше, чем при повторном. Бесповторный отбор организовать легче, чем повторный, и он применяется намного чаще. Однако величину стандартной ошибки при бесповторном отборе можно определять по более простой формуле (5.1). Такая замена возможна, если доля единиц генеральной совокупности, не попавших в выборку, большая и, следовательно, величина близка к единице.

Формировать выборку в строгом соответствии с правилами случайного отбора практически очень сложно, а иногда невозможно, так как при использовании таблиц случайных чисел необходимо пронумеровать все единицы генеральной совокупности. Довольно часто генеральная совокупность такая большая, что провести подобную предварительную работу чрезвычайно сложно и нецелесообразно, поэтому на практике применяют другие виды выборок, каждая из которых не является строго случайной. Однако организуются они так, чтобы было обеспечено максимальное приближение к условиям случайного отбора.

При чисто механической выборке вся генеральная совокупность единиц должна быть прежде всего представлена в виде списка единиц отбора, составленного в каком-то нейтральном по отношению к изучаемому признаку порядке, например по алфавиту. Затем список единиц отбора разбивается на столько равных частей, сколько необходимо отобрать единиц. Далее по заранее установленному правилу, не связанному с вариацией исследуемого признака, из каждой части списка отбирается одна единица. Этот вид выборки не всегда может обеспечить случайный характер отбора, и полученная выборка может оказаться смещенной. Объясняется это тем, что, во-первых, упорядочение единиц генеральной совокупности может иметь элемент неслучайного характера. Во-вторых, отбор из каждой части генеральной совокупности при неправильном установлении начала отсчета может также привести к ошибке смещения. Однако практически легче организовать механическую выборку, чем собственно случайную, и при проведении выборочных обследований чаще всего пользуются этим видом выборки. Стандартную ошибку при механической выборке определяют по формуле собственно случайной бесповторной выборки (6.2).

Типическая (районированная, стратифицированная) выборка преследует две цели:

обеспечить представительство в выборке соответствующих типических групп генеральной совокупности по интересующим исследователя признакам;

увеличить точность результатов выборочного обследования.

При типической выборке до начала ее формирования генеральная совокупность единиц разбивается на типические группы. При этом очень важным моментом является правильный выбор группировочного признака. Выделенные типические группы могут содержать одинаковое или различное число единиц отбора. В первом случае выборочная совокупность формируется с одинаковой долей отбора из каждой группы, во втором – с долей, пропорциональной ее доле в генеральной совокупности. Если выборка формируется с равной долей отбора, по существу она равносильна ряду собственно случайных выборок из меньших генеральных совокупностей, каждая из которых и есть типическая группа. Отбор из каждой группы осуществляется в случайном (повторном или бесповторном) либо механическом порядке. При типической выборке, как с равной, так и неравной долей отбора, удается устранить влияние межгрупповой вариации изучаемого признака на точность ее результатов, так как обеспечивается обязательное представительство в выборочной совокупности каждой из типических групп. Стандартная ошибка выборки будет зависеть не от величины общей дисперсии?2, а от величины средней из групповых дисперсий?i2 . Поскольку средняя из групповых дисперсий всегда меньше общей дисперсии, постольку при прочих равных условиях стандартная ошибка типической выборки будет меньше стандартной ошибки собственно случайной выборки.

При определении стандартных ошибок типической выборки применяются следующие формулы:

При повторном способе отбора

При бесповторном способе отбора:

– средняя из групповых дисперсий в выборочной совокупности.

Серийная (гнездовая) выборка – это такой вид формирования выборочной совокупности, когда в случайном порядке отбираются не единицы, подлежащие обследованию, а группы единиц (серии, гнезда). Внутри отобранных серий (гнезд) обследованию подвергаются все единицы. Серийную выборку практически организовать и провести легче, чем отбор отдельных единиц. Однако при этом виде выборки, во-первых, не обеспечивается представительство каждой из серий и, во-вторых, не устраняется влияние межсерийной вариации изучаемого признака на результаты обследования. В том случае, когда эта вариация значительна, она приведет к увеличению случайной ошибки репрезентативности. При выборе вида выборки исследователю необходимо учитывать это обстоятельство. Стандартная ошибка серийной выборки определяется по формулам:

При повторном способе отбора -


где?– межсерийная дисперсия выборочной совокупности; r – число отобранных серий;

При бесповторном способе отбора -


где R – число серий в генеральной совокупности.

В практике те или иные способы и виды выборок применяются в зависимости от цели и задач выборочных обследований, а также возможностей их организации и проведения. Чаще всего применяется комбинирование способов отбора и видов выборки. Такие выборки получили название комбинированные. Комбинирование возможно в разных сочетаниях: механической и серийной выборки, типической и механической, серийной и собственно случайной и т. д. К комбинированной выборке прибегают для обеспечения наибольшей репрезентативности с наименьшими трудовыми и денежными затратами на организацию и проведение обследования.

При комбинированной выборке величина стандартной ошибки выборки состоит из ошибок на каждой ее ступени и может быть определена как корень квадратный из суммы квадратов ошибок соответствующих выборок. Так, если при комбинированной выборке в сочетании использовались механическая и типическая выборки, то стандартную ошибку можно определить по формуле


где?1 и?2 – стандартные ошибки соответственно механической и типической выборок.

Особенность многоступенчатой выгборки состоит в том, что выборочная совокупность формируется постепенно, по ступеням отбора. На первой ступени с помощью заранее определенного способа и вида отбора отбираются единицы первой ступени. На второй ступени из каждой единицы первой ступени, попавшей в выборку, отбираются единицы второй ступени и т. д. Число ступеней может быть и больше двух. На последней ступени формируется выборочная совокупность, единицы которой подлежат обследованию. Так, например, для выборочного обследования бюджетов домашних хозяйств на первой ступени отбираются территориальные субъекты страны, на второй – районы в отобранных регионах, на третьей – в каждом муниципальном образовании отбираются предприятия или организации и, наконец, на четвертой ступени – в отобранных предприятиях отбираются семьи.

Таким образом, выборочная совокупность формируется на последней ступени. Многоступенчатая выборка более гибкая, чем другие виды, хотя в общем она дает менее точные результаты, чем выборка того же объема, но сформированная в одну ступень. Однако при этом она имеет одно важное преимущество, которое заключается в том, что основу выборки при многоступенчатом отборе нужно строить на каждой из ступеней только для тех единиц, которые попали в выборку, а это очень важно, так как нередко готовой основы выборки нет.

Стандартную ошибку выборки при многоступенчатом отборе при группах разных объемов определяют по формуле


где?1, ?2, ?3, ... – стандартные ошибки на разных ступенях;

n1, n2 , n3, .. . – численность выборок на соответствующих ступенях отбора.

В том случае, если группы неодинаковы по объему, то теоретически этой формулой пользоваться нельзя. Но если общая доля отбора на всех ступенях постоянна, то практически расчет по этой формуле не приведет к искажению величины ошибки.

Сущность многофазной выгборки состоит в том, что на основе первоначально сформированной выборочной совокупности образуют подвыборку, из этой подвыборки – следующую подвыборку и т. д. Первоначальная выборочная совокупность представляет собой первую фазу, подвыборка из нее – вторую и т. д. Многофазную выборку целесообразно применять в случаях, если:

для изучения различных признаков требуется неодинаковый объем выборки;

колеблемость изучаемых признаков неодинакова и требуемая точность различна;

в отношении всех единиц первоначальной выборочной совокупности (первая фаза) необходимо собрать менее подробные сведения, а в отношении единиц каждой последующей фазы – более подробные.

Одним из несомненных достоинств многофазной выборки является то обстоятельство, что сведениями, полученными на первой фазе, можно пользоваться как дополнительной информацией на последующих фазах, информацией второй фазы – как дополнительной информацией на следующих фазах и т. д. Такое использование сведений повышает точность результатов выборочного обследования.

При организации многофазной выборки можно применять сочетание различных способов и видов отбора (типическую выборку с механической и т. д.). Многофазный отбор можно сочетать с многоступенчатым. На каждой ступени выборка может быть многофазной.

Стандартная ошибка при многофазной выборке рассчитывается на каждой фазе в отдельности в соответствии с формулами того способа отбора и вида выборки, при помощи которых формировалась ее выборочная совокупность.

Взаимопроникающие выгборки – это две или более независимые выборки из одной и той же генеральной совокупности, образованные одним и тем же способом и видом. К взаимопроникающим выборкам целесообразно прибегать, если необходимо за короткий срок получить предварительные итоги выборочных обследований. Взаимопроникающие выборки эффективны для оценки результатов обследования. Если в независимых выборках результаты одинаковы, то это свидетельствует о надежности данных выборочного обследования. Взаимопроникающие выборки иногда можно применять для проверки работы различных исследователей, поручив каждому из них провести обследование разных выборок.

Стандартная ошибка при взаимопроникающих выборках определяется по той же формуле, что и типическая пропорциональная выборка (5.3). Взаимопроникающие выборки по сравнению с другими видами требуют больших трудовых затрат и денежных расходов, поэтому исследователь должен учитывать это обстоятельство при проектировании выборочного обследования.

Предельные ошибки при различных способах отбора и видах выборки определяются по формуле? = t?, где? – соответствующая стандартная ошибка.

Тема: Выборочный метод в статистике

1. Понятие о выборочном наблюдении, его задачи

Статистическое наблюдение можно органи­зовать сплошное и несплошное. Сплошное наблюдение предусмат­ривает обследование всех единиц изучаемой совокупности и свя­зано с большими трудовыми и материальными затратами. Изуче­ние не всех единиц совокупности, а лишь некоторой части, по ко­торой следует судить о свойствах всей совокупности в целом, мож­но осуществить несплошным наблюдением. В статистической прак­тике самым распространенным является выборочное наблюдение.

Выборочное наблюдение - это такой вид несплошного наблюдения, при котором отбор подлежащих обследованию единиц осуществляется в случайном порядке, отобранная часть изучается, а результаты распро­страняются на всю исходную совокупность. Наблюдение организует­ся таким образом, что эта часть отобранных единиц в уменьшенном масштабе репрезентирует (представляет) всю совокупность.

Совокупность, из которой производится отбор, называется ге­неральной, генеральными.

Совокупность отобранных единиц именуют выборочной сово­купностью, и все ее обобщающие показатели - выборочными.

Имеется ряд причин, в силу которых, во многих слу­чаях выборочному наблюдению отдается предпочтение перед сплошным. Наиболее существенны из них следующие:

Экономия времени и средств в результате сокращения объ­ема работы;

Сведение к минимуму порчи или уничтожения исследуемых объектов (определение прочности пряжи при разрыве, ис­пытание электрических лампочек на продолжительность горения, проверка консервов на доброкачественность);

Необходимость детального исследования каждой единицы наблюдения при невозможности охвата всех единиц (при изучении бюджета семей);

Достижение большой точности результатов обследова­ния благодаря сокращению ошибок, происходящих при регистрации.

Преимущество выборочного наблюдения по сравнению со сплошным можно реализовать, если оно организовано и проведено в строгом соответствии с научными принципами теории выбороч­ного метода. Такими принципами являются: обеспечение случайно­сти (равной возможности попадания в выборку) отбора единиц и достаточного их числа. Соблюдение этих принципов позволяет по­лучить объективную гарантию репрезентативности полученной вы­борочной совокупности. Понятие репрезентативности отобранной совокупности не следует понимать как ее представительство по всем признакам изучаемой совокупности, а только в отношении тех признаков, которые изучаются или оказывают существенное влияние на формирование сводных обобщающих характеристик.

Основная задача выборочного наблюдения в экономике со­стоит в том, чтобы на основе характеристик выборочной сово­купности (средней и доли) получить достоверные суждения о показателях средней и доли в генеральной совокупности. При этом следует иметь в виду, что при любых статистических ис­следованиях (сплошных и выборочных) возникают ошибки двух видов: регистрации и репрезентативности.

Ошибки регистрации могут иметь случайный (непреднамеренный) и систематический (тенденциозный) характер. Случайные ошибки обычно уравновешивают друг друга, поскольку не имеют преимущественного направления в сторону преувеличения или преуменьшения значения изучаемого показателя. Систематические ошибки направлены в одну сторону вследствие преднамеренного нарушения правил отбора (предвзятые цели). Их можно избежать при правильной организации и проведении наблюдения.

Ошибки репрезентативности присущи только выборочно­му наблюдению и возникают в силу того, что выборочная сово­купность не полностью воспроизводит генеральную. Они пред­ставляют собой расхождение между значениями показателей, по­лученных по выборке, и значениями показателей этих же вели­чин, которые были бы получены при проведенном с одинаковой степенью точности сплошном наблюдении, т. е. между величи­нами выборных и соответствующих генеральных показателей.

Для каждого конкретного выборочного наблюдения значе­ние ошибки репрезентативности может быть определено по со­ответствующим формулам, которые зависят от вида, метода и способа формирования выборочной совокупности.

По виду различают индивидуальный, групповой и комби­нированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной со­вокупности; при групповом отборе - качественно однородные группы или серии изучаемых единиц; комбинированный отбор предполагает сочетание первого и второго видов.

По методу отбора различают повторную и бесповтор­ную выборки.

При повторной выборке общая численность единиц генеральной совокупности в процессе выборки остается неизменной. Ту или иную единицу, попавшую в выборку, после регистрации снова возвращают в генеральную совокупность, и она сохраняет равную возможность со всеми прочими единицами при повторном отборе единиц вновь попасть в выборку («отбор по схеме возвращенного шара»). Повторная выборка в социально-экономической жизни встречается редко. Обычно выборку организуют по схеме беспо­вторной выборки.

При бесповторной выборке единица совокупности, попавшая в выборку, в генеральную совокупность не возвращается и в дальнейшем в выборке не участвует; т. е. последующую выборку делают из генеральной совокупности уже без отобранных ранее единиц («отбор по схеме невозвращенного шара»). Таким обра­зом, при бесповторной выборке численность единиц генераль­ной совокупности сокращается в процессе исследования.

Способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности.

По степени охвата единиц совокупности различают большие и малые (n <30) выборки.

В практике выборочных исследований наибольшее распро­странение получили следующие виды выборки: собственно-случайная, механическая, типическая, серийная, комбинированная.

Основные характеристики параметров гене­ральной и выборочной совокупностей обозначаются символами:

N-объем генеральной совокупности (число входящих в нее единиц);

п - объем выборки (число обследованных единиц);

- генеральная средняя (среднее значение признака в генеральной совокупности);

Выборочная средняя;

P - генеральная доля (доля единиц, обладающих дан­ным значением признака в общем числе единиц генеральной совокупности);

w - выборочная доля;

- генеральная дисперсия (дисперсия признака в ге­неральной совокупности);

S 2 - выборочная дисперсия того же признака;

- среднее квадратическое отклонение в генеральной совокупности;

S - среднее квадратическое отклонение в выборке.

2. Ошибки выборки

При выборочном наблюдении должна быть обеспечена слу­чайность отбора единиц. Каждая единица должна иметь равную с другими возможность быть отобранной. Именно на этом ос­новывается собственно-случайная выборка.

К собственно-случайной выборке относится отбор единиц из всей генеральной совокупности (без предварительного рас­членения ее на какие-либо группы) посредством жеребьевки (преимущественно) или какого-либо иного подобного спосо­ба, например, с помощью таблицы случайных чисел. Случай­ный отбор - это отбор не беспорядочный. Принцип случай­ности предполагает, что на включение или исключение объ­екта из выборки не может повлиять какой-либо фактор, кро­ме случая. Примером собственно-случайного отбора могут служить тиражи выигрышей: из общего количества выпущен­ных билетов наугад отбирается определенная часть номеров, на которые приходятся выигрыши. Причем всем номерам обеспечивается равная возможность попадания в выборку. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки.

Доля, выборки есть отношение числа единиц выборочной со­вокупности к числу единиц генеральной совокупности:

Так, при 5%-ной выборке из партии деталей в 1000 ед. объ­ем выборки п составляет 50 ед., а при 10%-ной выборке -100 ед. и т.д. При правильной научной организации выборки ошибки репрезентативности можно свести к минимальном значениям, в результате - выборочное наблюдение становится достаточно точным.

Собственно-случайный отбор «в чистом виде» применяет­ся в практике выборочного наблюдения редко, но он является исходным среди всех других видов отбора, в нем заключаются и реализуются основные принципы выборочного наблюдения.

Рассмотрим некоторые вопросы теории выборочного метода и формулы ошибок для простой случайной выборки.

Применяя выборочный метод в статистике, обычно используют два основных вида обобщающих показателей: среднюю величину ко­личественного признака и относительную величину альтернативного признака (долю или удельный вес единиц в статистической сово­купности, которые отличаются от всех других единиц этой сово­купности только наличием изучаемого признака).

Выборочная доля ( w ), или частость, определяется отношением числа единиц, обладающих изучаемым признаком т, к общему числу единиц выборочной совокупности п:

w = т/п.

Например, если из 100 деталей выборки (и = 100), 95 деталей оказались стандартными =95), то выборочная доля

w = 95 / 100 = 0,95 .

Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки.

Ошибка выборки или, иначе говоря, ошибка репрезента­тивности представляет собой разность соответствующих выбо­рочных и генеральных характеристик:

(1)

(2)

Ошибка выборки свойственна только выборочным наблюде­ниям. Чем больше значение этой ошибки, тем в большей степе­ни выборочные показатели отличаются от соответствующих ге­неральных показателей.

Выборочная средняя и выборочная доля по своей сути яв­ляются случайными величинами, которые могут принимать раз­личные значения в зависимости от того, какие единицы сово­купности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возмож­ных ошибок - среднюю ошибку выборки.

От чего зависит средняя ошибка выборки! При соблюдении принципа случайного отбора средняя ошибка выборки определяется, прежде всего объемом выборки: чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки. Охватывая выборочным обследованием все большее количество единиц генеральной совокупности, всё более точно характеризуем всю генеральную совокупность.

Средняя ошибка выборки также зависит от степени варьи­рования изучаемого признака. Степень варьирования, как из­вестно, характеризуется дисперсией или w (1 - w ) - для альтернативного признака. Чем меньше вариация признака, а следовательно, и дисперсия, тем меньше средняя ошибка вы­борки, и наоборот. При нулевой дисперсии (признак не варь­ирует) средняя ошибка выборки равна нулю, т. е. любая еди­ница генеральной совокупности будет совершенно точно ха­рактеризовать всю совокупность по этому признаку.

Зависимость средней ошибки выборки от ее объема и степе­ни варьирования признака отражена в формулах, с помощью которых можно рассчитать среднюю ошибку выборки в услови­ях выборочного наблюдения, когда генеральные характеристики (х,р) неизвестны, и следовательно, не представляется возмож­ным нахождение реальной ошибки выборки непосредственно по формулам (1), (2).

При случайном повторном отборе средние ошибки теоретически рассчитывают по следующим формулам:

для средней количественного признака

(3)

для доли (альтернативного признака)

(4)

Поскольку практически дисперсия признака в генеральной совокупности точно неизвестна, на практике пользуются

значением дисперсии S 2 , рассчитанным для выборочной сово­купности на основании закона больших чисел, согласно кото­рому выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики гене­ральной совокупности.

Таким образом, расчетные формулы средней ошиб­ки выборки при случайном повторном отборе будут следующие:

для средней количественного признака

для доли (альтернативного признака)

(6)

Однако дисперсия выборочной совокупности не равна диспер­сии генеральной совокупности, и следовательно, средние ошибки выборки, рассчитанные по формулам (5) и (6), будут прибли­женными. Но в теории вероятностей доказано, что генеральная дисперсия выражается через выборочную следующим соотношением:

(7)

Так как п / (n -1) при достаточно больших п - величина, близкая к единице, то можно принять, что = S 2 , а следова­тельно, в практических расчетах средних ошибок выборки мож­но использовать формулы (5) и (6). И только в случаях ма­лой выборки (когда объем выборки не превышает 30) необхо­димо учитывать коэффициент п/(п-1) и исчислять среднюю ошибку малой выборки по формуле:

(8)

в приведенные выше формулы расчета средних ошибок выборки необходимо подко­ренное выражение умножить на 1-(п/ N ), поскольку в процес­се бесповторной выборки сокращается численность единиц ге­неральной совокупности. Следовательно, для бесповторной вы­борки расчетные формулы средней ошибки выборки примут такой вид:

для средней количественного признака

(9)

для доли (альтернативного признака)

(10)

Так как п всегда меньше N , то дополнительный множи­тель 1 - (n / N ) всегда будет меньше единицы. Отсюда следу­ет, что средняя ошибка при бесповторном отборе всегда будет меньше, чем при повторном. В то же время при сравнительно небольшом проценте выборки этот множитель близок к еди­нице (например, при 5%-ной выборке он равен 0,95; при 2%-ной - 0,98 и т.д.). Поэтому иногда на практике пользуются для определения средней ошибки выборки формулами (5) и (6) без указанного множителя, хотя выборку и организуют как бесповторную. Это имеет место в тех случаях, когда число единиц генеральной совокупности N неизвестно или безгра­нично, или когда п очень мало по сравнению с N, и по су­ществу, введение дополнительного множителя, близкого по значению к единице, практически не повлияет на значение средней ошибки выборки.

Механическая выборка состоит в том, что отбор единиц в выборочную совокупность из генеральной, разбитой по ней­тральному признаку на равные интервалы (группы), произво­дится таким образом, что из каждой такой группы в выборку отбирается лишь одна единица. Чтобы избежать систематиче­ской ошибки, отбираться должна единица, которая находится в середине каждой группы.

При организации механического отбора единицы совокуп­ности предварительно располагают (обычно в списке) в опре­деленном порядке (например, по алфавиту, местоположению, в порядке возрастания или убывания значений какого-либо по­казателя, не связанного с изучаемым свойством, и т.д.), после чего отбирают заданное число единиц механически, через оп­ределенный итервал. При этом размер интервала в генеральной совокупности равен обратному значению доли выборки. Так, при 2%-ной выборке отбирается и проверяется каждая 50-я единица (1: 0,02), при 5 %-ной выборке - каждая 20-я едини­ца (1: 0,05), например, сходящая со станка деталь.

При достаточно большой совокупности механический отбор по точности результатов близок к собственно-случайному. По­этому для определения средней ошибки механической выборки используют формулы собственно-случайной бесповторной вы­борки (9), (10).

Для отбора единиц из неоднородной совокупности применя­ется, так называемая типическая выборка, которая используется в тех случаях, когда все единицы генеральной совокупности можно разбить на несколько качественно однородных, однотипных групп по признакам, влияющим на изучаемые показатели.

При обследовании предприятий такими группами могут быть, например, отрасль и подотрасль, формы собственности. Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.

Типическая выборка обычно применяется при изучении слож­ных статистических совокупностей. Например, при выборочном обследовании семейных бюджетов рабочих и служащих в отдель­ных отраслях экономики, производительности труда рабочих пред­приятия, представленных отдельными группами по квалификации.

Типическая выборка дает более точные результаты по сравнению с другими способами отбора единиц в выбороч­ную совокупность. Типизация генеральной совокупности обеспечивает репрезентативность такой выборки, представи­тельство в ней каждой типологической группы, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки,

При определении средней ошибки типической выборки в ка­честве показателя вариации выступает средняя из внутригрупповых дисперсий.

Среднюю ошибку выборки находят по формулам:

для средней количественного признака

(повторный отбор); (11)

(бесповторный отбор); ( 12)

для доли (альтернативного признака)

(повторный отбор); (13)

(бесповторный отбор), (14)

где - средняя из внутригрупповых дисперсий по вы­борочной совокупности;

Средняя из внутригрупповых дисперсий доли (альтер­нативного

признака) по выборочной совокупности.

Серийная выборка предполагает случайный отбор из генераль­ной совокупности не отдельных единиц, а их равновеликих групп (гнезд, серий) с тем, чтобы в таких группах подвергать наблюде­нию все без исключения единицы.

Применение серийной выборки обусловлено тем, что многие товары для их транспортировки, хранения и продажи упаковываются в пачки, ящики и т.п. Поэтому при контроле качества упакованного товара рациональнее проверить не­сколько упаковок (серий), чем из всех упаковок отбирать не­обходимое количество товара.

Поскольку внутри групп (серий) обследуются все без исключе­ния единицы, средняя ошибка выборки (при отборе равновеликих серий) зависит только от межгрупповой (межсерийной) дисперсии.

Среднюю ошибку выборки для средней количественного при­знака при серийном отборе находят по формулам:

(повторный отбор); (15 )

(бесповторный отбор), (16 )

где r - число отобранных серий; R - общее число серий.

Межгрупповую дисперсию серийной выборки вычисляют сле­дующим образом:

где - средняя i-й серии; - общая средняя по всей выбо­рочной совокупности.

Средняя ошибка выборки для доли (альтернативного при­знака) при серийном отборе:

(повторный отбор); (17 )

(бесповторный отбор). (18 )

Межгрупповую (межсерийную) дисперсию доли серийной вы­борки определяют по формуле:

(19)

где w i - доля признака в i-и серии; - общая доля признака во всей выборочной совокупности.

В практике статистических обследований помимо рассмот­ренных ранее способов отбора применяется их комбинация (комбинированный отбор).

3. Распространение выборочных результатов на генеральную совокупность

Конечной целью выборочного наблюдения является ха­рактеристика генеральной совокупности на основе выбороч­ных результатов.

Выборочные средние и относительные величины распро­страняют на генеральную совокупность с учетом предела их возможной ошибки.

В каждой конкретной выборке расхождение между выбороч­ной средней и генеральной, т. е. может быть меньше средней ошибки выборки , равно ей или больше ее.

Причем каждое из этих расхождений имеет различную веро­ятность (объективную возможность появления события). По­этому фактические расхождения между выборочной средней и генеральной можно рассматривать как некую предельную ошибку, связанную со средней ошибкой и гарантируемую с оп­ределенной вероятностью Р.

Предельную ошибку выборки для средней () при повторном отборе можно рассчитать по формуле:

(20)

где t - нормированное отклонение - «коэффициент доверия», за­висящий от вероятности, с которой гарантируется предельная ошибка выборки;

Средняя ошибка выборки.

Аналогичным образом может быть записана формула предельной ошибки выборки для доли при повторном отборе:

(21)

При случайном бесповторном отборе в формулах расчета пре­дельных ошибок выборки (20) и (21) необходимо умножить подкоренное выражение на 1 - (n / N ) .

Формула предельной ошибки выборки вытекает из основных положений теории выборочного метода, сформулированных в ряде теорем теории вероятностей, отражающих закон больших чисел.

На основании теоремы П.Л. Чебышева (с уточ­нениями А.М. Ляпунова) с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки и ограниченной генеральной дисперсии выборочные обоб­щающие показатели (средняя, доля) будут сколь угодно мало отли­чаться от соответствующих генеральных показателей.

Применительно к нахождению среднего значения признака эта теорема может быть записана так:

(22)

а для доли признака:

(23 )

где(24)

Таким образом, величина предельной ошибки выборки мо­жет быть установлена с определенной вероятностью.

Значения функции Ф( t ) при различных значениях t как ко­эффициента кратности средней ошибки выборки, определяются на основе специально составленных таблиц. Приведем некото­рые значения, применяемые наиболее часто для выборок дос­таточно большого объема (n 30):

t 1,000 1,960 2,000 2,580 3,000

Ф( t ) 0,683 0,950 0,954 0,990 0,997

Предельная ошибка выборки отвечает на вопрос о точности выборки с определенной вероятностью, значение которой оп­ределяется коэффициентом t (в практических расчетах, как правило, заданная вероятность не должна быть менее 0,95). Так, при t = 1 предельная ошибка составит = . Следова­тельно, с вероятностью 0,683 можно утверждать, что разность между выборочными и генеральными показателями не превы­сит одной средней ошибки выборки. Другими словами, в 68,3% случаев ошибка репрезентативности не выйдет за пределы ±1.

При t = 2 с вероятностью 0,954 она не выйдет за пределы ±2 ,

при t = 3 с вероятностью 0,997 - за пределы ±3 и т.д.

Как видно из приведённых выше значений функции Ф (t ) (см. последнее значение), вероятность появления ошибки, равной или большей утроенной средней ошибки выборки, т. е. 3 крайне мала и равна 0,003, т. е. 1-0,997. Такие маловероятные события считаются практически невозможными, а потому величину = 3можно принять за предел возможной ошибки выборки.

Выборочное наблюдение проводится в целях распростране­ния выводов, полученных по данным выборки, на генеральную совокупность. Одной из основных задач является оценка по данным выборки исследуемых характеристик (параметров) гене­ральной совокупности.

Предельная ошибка выборки позволяет определить предель­ные значения характеристик генеральной совокупности и их дове­рительные интервалы:

для средней (25)

для доли (26)

Это означает, что с заданной вероятностью можно утвер­ждать, что значение генеральной средней следует ожидать в пределах от - до +

Аналогичным образом может быть записан доверительный интервал генеральной доли:

Наряду с абсолютным значением предельной ошибки вы­борки рассчитывается и предельная относительная ошибка выбор­ки, которая определяется как процентное отношение предель­ной ошибки выборки к соответствующей характеристике выбо­рочной совокупности:

для средней, %: (27)

для доли, %: (28)

Рассмотрим нахождение средних и предельных ошибок вы­борки, определение доверительных пределов средней и доли на конкретных примерах.

Задача 1. Для определения скорости расчетов с кредиторами предприятий корпорации в коммерческом банке была проведена случайная выборка 100 платежных документов, по которым сред­ний срок перечисления и получения денег оказался равным 22 дням ( = 22) со стандартным отклонением 6 дней (S= 6).

Необходимо с вероятностью Р = 0,954 определить пре­дельную ошибку выборочной средней и доверительные пределы средней продолжительности расчетов предприятий данной кор­порации.

Решение. Предельную ошибку = t определяем по формуле по­вторного отбора (6.20), так как численность генеральной совокупности N неизвестна. Из представленных значений Ф (t ) (см. с. 98) для вероятности Р = 0,954 находим t = 2.

Следовательно, предельная ошибка выборки, дней:

Генеральная средняя будет равна = ± , а доверительные интервалы (пределы) генеральной средней исчисляем, исходя из двойного неравенства:

Таким образом, с вероятностью 0,954 можно утверждать, что средняя продолжительность расчетов предприятий данной корпо­рации колеблется в пределах от 20,8 до 23,2 дней.

Задача 2. Среди выборочно обследованных 1000 семей региона по уровню душевого дохода (выборка 2%-ная, механическая) мало­обеспеченных оказалось 300 семей.

Требуется с вероятностью 0,997 определить долю мало­обеспеченных семей во всем регионе.

Решение. Выборочная доля (доля малообеспеченных семей сре­ди обследованных семей) равна:

По представленным ранее данным Ф(t ) для вероятности 0,997 находим t = 3 (см. с. 99). Предельную ошибку доли определя­ем по формуле бесповторного отбора (механическая выборка всегда является бесповторной):

Предельная относительная ошибка выборки, %:

Генеральная доляа доверительные пределы генеральной доли исчисляем, исходя из двойного неравенства:

В нашем примере:

Таким образом, почти достоверно, с вероятностью 0,997 можно утверждать, что доля малообеспеченных семей среди всех семей региона колеблется от 28,6 до 31,4%.

Задача 3. Для определения урожайности зерновых культур про­ведено выборочное обследование 100 хозяйств региона различных форм собственности, в результате которого получены сводные дан­ные (табл.6.1). Необходимо с вероятностью 0,954 опреде­лить предельную ошибку выборочной средней и доверительные пределы средней урожайности зерновых культур по всем хозяйст­вам региона.

Таблица 6.1

Распределение урожайности по хозяйствам региона, имеющим различную форму собственности

Решение. Поскольку обследованные хозяйства региона сгруппи­рованы по формам собственности, предельную ошибку средней урожайности определяем по формуле для типической выборки, осуществляемой методом повторного отбора (численность гене­ральной совокупности N неизвестна):

В этой формуле неизвестна средняя из внутригрупповых дис­персий.

Она исчисляется по формуле:

По представленным ранее (см. с. 98) данным Ф (t ) для вероят­ности Р =0,954 находим t = 2.

Тогда предельная ошибка выборки, ц/га:

Генеральная средняя: = ± . Для нахождения ее границ вначале нужно исчислить среднюю урожайность по выборочной со­вокупности , ц/га:

Предельная относительная ошибка выборки, %:

Доверительные пределы генеральной средней исчисляем, исхо­дя из двойного неравенства:

Таким образом, с вероятностью 0,954 можно гарантировать, что средняя урожайность зерновых культур по региону будет не менее чем 20 ц/га, но и не более чем 22 ц/га.

Определение необходимого объема выборки. При проектирова­нии выборочного наблюдения с заранее заданным значением допустимой ошибки выборки очень важно правильно опреде­лить численность (объем) выборочной совокупности, которая с определенной вероятностью обеспечит заданную точность ре­зультатов наблюдения. Формулы для определения необходимой численности выборки п легко получить непосредственно из формул ошибок выборки.

Так, из формул предельной ошибки выборки для повтор­ного отбора нетрудно (предварительно возведя в квадрат обе части равенства) выразить необходимую численность выборки:

для средней количественного признака

для доли (альтернативного признака)

(30 )

Аналогично из формул предельной ошибки выборки для бес­повторного отбора находим, что

(для средней); (31 )

(для доли). (32 )

Эти формулы показывают, что с увеличением предполагае­мой ошибки выборки значительно уменьшается необходимый объем выборки.

Для расчета объема выборки нужно знать дисперсию. Она может быть заимствована из проводимых ранее обследований данной или аналогичной совокупности, а если таковых нет, то­гда для определения дисперсии надо провести специальное вы­борочное обследование небольшого объема.

Задача 4. Для определения среднего возраста 1200 студентов факультета необходимо провести выборочное обследование мето­дом случайного бесповторного отбора. Предварительно установле­но, что среднее квадратическое отклонение возраста студентов рав­но 10 годам.

Сколько студентов нужно обследовать, чтобы с вероятно­стью 0,954 средняя ошибка выборки не превышала 3 года?

Решение. Рассчитаем необходимую численность выборки, чел., по формуле бесповторного отбора (6.31), учитывая, что t = 2 при Р = 0,954:

Таким образом, выборка численностью 47 чел. обеспечивает задан­ную точность при бесповторном отборе.

Выборочный метод широко используется в статистической практике для получения экономической информации.

Большую актуальность приобретает выборочный метод в со­временных условиях перехода к рыночной экономике. Изменения в характере экономических отношений, аренда, собственность от­дельных коллективов и лиц обусловливают изменения функций учета и статистики, сокращение и упрощение отчетности. Вместе с тем, возрастающие требования к менеджменту усиливают потреб­ность в обеспечении надежной информацией, дальнейшего повы­шения ее оперативности. Все это обусловливает более широкое применение выборочного метода в экономике.

В отечественной статистике уже накоплен определенный опыт выборочных обследований.

Исследование обычно начинается с некоторого предположения, требую-щего проверки с привлечением фактов. Это предположение — гипотеза — формулируется в отношении связи явлений или свойств в некоторой сово-купности объектов.

Для проверки подобных предположений на фактах необходимо измерить соответствующие свойства у их носителей. Но невозможно измерить тревож-ность у всех женщин и мужчин, как невозможно измерить агрессивность у всех подростков. Поэтому при проведении исследования ограничиваются лишь относительно небольшой группой представителей соответствующих совокупностей людей.

Генеральная совокупность — это все множество объектов, в отношении ко-торого формулируется исследовательская гипотеза.

Например, все мужчины; или все женщины; или все жители какого-либо города. Генеральные совокупности, в отно-шении которых исследователь собирается сделать выводы по результатам ис-следования, могут быть по численности и более скромными, например, все первоклассники данной школы.

Таким образом, генеральная совокупность — это хотя и не бесконечное по численности, но, как правило, недоступное для сплошного исследования мно-жество потенциальных испытуемых.

Выборка или выборочная совокупность — это ограниченная по численности группа объектов (в психоло-гии — испытуемых, респондентов), специально отбираемая из генеральной совокупности для изучения ее свойств. Соответственно, изучение на выбор-ке свойств генеральной совокупности называется выборочным исследованием. Практически все психологические исследования являются выборочными, а их выводы распространяются на генеральные совокупности.

Таким образом, после того, как сформулирована гипотеза и определены соответствующие генеральные совокупности, перед исследователем возни-кает проблема организации выборки. Выборка должна быть такой, чтобы была обоснована генерализация выводов выборочного исследования — обобщение, распространение их на генеральную совокупность. Основные критерии обо-снованности выводов исследования это репрезентативность выборки и ста-тистическая достоверность (эмпирических) результатов.

Репрезентативность выборки — иными словами, ее представительность — это способность выборки представлять изучаемые явления достаточно пол-но — с точки зрения их изменчивости в генеральной совокупности.

Конечно, полное представление об изучаемом явлении, во всем его диапа-зоне и нюансах изменчивости, может дать только генеральная совокупность. Поэтому репрезентативность всегда ограничена в той мере, в какой ограни-чена выборка. И именно репрезентативность выборки является основным кри-терием при определении границ генерализации выводов исследования. Тем не менее, существуют приемы, позволяющие получить достаточную для ис-следователя репрезентативность выборки (Эти приемы изучаются в курсе «Экспериментальная психология»).


Первый и основной прием — это простой случайный (рандомизированный) отбор. Он предполагает обеспечение таких условий, чтобы каждый член генеральной совокупности имел равные с другими шансы попасть в выборку. Слу-чайный отбор обеспечивает возможность попадания в выборку самых разных представителей генеральной совокупности. При этом принимаются специ-альные меры, исключающие появление какой-либо закономерности при отборе. И это позволяет надеяться на то, что в конечном итоге в выборке изу-чаемое свойство будет представлено если и не во всем, то в максимально воз-можном его многообразии.

Второй способ обеспечения репрезентативности — это стратифицирован-ный случайный отбор, или отбор по свойствам генеральной совокупности. Он предполагает предварительное определение тех качеств, которые могут вли-ять на изменчивость изучаемого свойства (это может быть пол, уровень дохо-да или образования и т. д.). Затем определяется процентное соотношение чис-ленности различающихся по этих качествам групп (страт) в генеральной совокупности и обеспечивается идентичное процентное соотношение соот-ветствующих групп в выборке. Далее в каждую подгруппу выборки испытуе-мые подбираются по принципу простого случайного отбора.

Статистическая достоверность , или статистическая значимость, результа-тов исследования определяется при помощи методов статистического выво-да.

Застрахованы ли мы от принятия ошибок при принятии решений, при тех или иных выводах из результатов исследования? Конечно, нет. Ведь наши решения опираются на результаты исследования выборочной совокупности, а также на уровень наших психологических знаний. Полностью мы не застрахованы от ошибок. В статистике такие ошибки считаются допустимыми, если они имеют место не чаще чем в одном случае из 1000 (вероятность ошибки α=0,001 или сопряженная с этим величина доверительная вероятность правильного вывода р=0,999); в одном случае из 100 (вероятность ошибки α=0,01 или сопряженная с этим величина доверительная вероятность правильного вывода р=0,99) или в пяти случаях из 100 (вероятность ошибки α=0,05 или сопряженная с этим величина доверительная вероятность правильного вывода р=0,95). Именно на двух последних уровнях и принято принимать решения в психологии.

Иногда, говоря о статистической достоверности, используют понятие «уровень значимости» (обозначается как α). Численные значения р и α дополняют друг друга до 1,000 — полный набор событий: либо мы сделали правильный вывод, либо мы ошиблись. Эти уровни не рассчитываются, они заданы. Уровень значимости можно понимать как некую «красную» линию», пересечение которой позволит говорить о данном событии как о неслучайном. В каждом грамотном научном отчете или публикации сделанные выводы должны сопровождаться указанием значений р или α, при которых сделаны выводы.

Методы статистического вывода подробно рассматриваются в курсе «Математической статистики». Сейчас лишь отметим, что они предъявляют определенные требования к численности, или объему выборки.

К сожалению, строгих рекомендаций по предварительному определению требуемого объема выборки не существует. Более того, ответ на вопрос о не-обходимой и достаточной ее численности исследователь обычно получает слишком поздно — только после анализа данных уже обследованной выбор-ки. Тем не менее, можно сформулировать наиболее общие рекомендации:

1. Наибольший объем выборки необходим при разработке диагностичес-кой методики — от 200 до 1000-2500 человек.

2. Если необходимо сравнивать 2 выборки, их общая численность должна быть не менее 50 человек; численность сравниваемых выборок должна быть приблизительно одинаковой.

3. Если изучается взаимосвязь между какими-либо свойствами, то объем выборки должен быть не меньше 30-35 человек.

4. Чем больше изменчивость изучаемого свойства , тем больше должен быть объем выборки. Поэтому изменчивость можно уменьшить, увеличивая однородность выборки, например, по полу, возрасту и т. д. При этом, естественно, уменьшаются возможности генерализации выводов.

Зависимые и независимые выборки. Обычна ситуация исследования, когда интересующее исследователя свойство изучается на двух или более выборках с целью их дальнейшего сравнения. Эти выборки могут находиться в различ-ных соотношениях — в зависимости от процедуры их организации. Независи-мые выборки характеризуются тем, что вероятность отбора любого испытуе-мого одной выборки не зависит от отбора любого из испытуемых другой выборки. Напротив, зависимые выборки характеризуются тем, что каждому испытуемому одной выборки поставлен в соответствие по определенному критерию испытуемый из другой выборки.

В общем случае зависимые выборки предполагают попарный подбор ис-пытуемых в сравниваемые выборки, а независимые выборки — независимый отбор испытуемых.

Следует отметить, что случаи «частично зависимых» (или «частично неза-висимых») выборок недопустимы: это непредсказуемым образом нарушает их репрезентативность.

В заключение отметим, что можно выделить две парадигмы психологи-ческого исследования.

Так называемая R-методология предполагает изучение изменчивости некоторого свойства (психологического) под влиянием неко-торого воздействия, фактора либо другого свойства. Выборкой является мно-жество испытуемых.

Другой подход, Q-методология, предполагает исследо-вание изменчивости субъекта (единичного) под влиянием различных стимулов (условий, ситуаций и т. д.). Ей соответствует ситуация, когда выборкой явля-ется множество стимулов.