Wie viele Menschen verträgt die Erde. Wie viele Menschen passen auf die Erde? Um subjektive Urteile zu vermeiden, sollten wissenschaftliche Methoden zur Zählung von Teilnehmern an Massenveranstaltungen eingesetzt werden.

Stichprobenrepräsentativität

Parametername Bedeutung
Betreff des Artikels: Stichprobenrepräsentativität
Rubrik (thematische Kategorie) Psychologie

Beispielanforderungen

An die Stichprobe werden eine Reihe obligatorischer Anforderungen gestellt, die in erster Linie durch die Ziele und Zielsetzungen der Studie bestimmt werden. Bei der Planung eines Experiments sollten sowohl die Stichprobengröße als auch einige ihrer Merkmale berücksichtigt werden. Daher in der psychologischen Forschung die Anforderung Homogenität Proben. Dies bedeutet, dass ein Psychologe, der beispielsweise Jugendliche untersucht, Erwachsene nicht in dieselbe Stichprobe aufnehmen kann. Im Gegensatz dazu geht eine Studie, die nach der Methode der Alterskürzung durchgeführt wird, grundsätzlich von der Anwesenheit von Probanden unterschiedlichen Alters aus. Gleichzeitig sollte in diesem Fall auf die Homogenität der Stichprobe geachtet werden, jedoch nach anderen Kriterien, vor allem wie Alter und Geschlecht. Grundlage für die Bildung einer homogenen Stichprobe können unterschiedliche Merkmale sein, wie z. B. der Intelligenzgrad und die Nationalität, das Fehlen bestimmter Krankheiten etc., je nach Zielsetzung der Studie.

In der allgemeinen Statistik gibt es ein Konzept wiederholt und nicht wiederholend Auswahlen, oder anders ausgedrückt, Auswahlen mit und ohne Rückkehr. Als Beispiel wird in der Regel die Wahl eines aus einem Behälter entnommenen Balls gegeben. Bei einem Unentschieden mit Retoure wird jede ausgewählte Kugel erneut in den Behälter zurückgelegt und muss daher erneut ausgewählt werden. Bei einer sich nicht wiederholenden Auswahl wird der einmal ausgewählte Ball beiseite gelegt und kann nicht mehr an der Auswahl teilnehmen. In der psychologischen Forschung kann man Analogien zu dieser Art von Methoden zur Organisation selektiver Forschung finden, da ein Psychologe oft dieselben Themen mehrmals mit derselben Methodik testen muss. Gleichzeitig wird in diesem Fall streng genommen der Prüfvorgang wiederholt. Eine Stichprobe von Probanden mit vollständiger Identität der Zusammensetzung bei wiederholten Studien wird aufgrund der allen Menschen innewohnenden Funktions- und Altersvariabilität immer einige Unterschiede aufweisen. Eine solche Auswahl durch die Art des Verfahrens wiederholt sich, obwohl die Bedeutung des Begriffs hier offensichtlich anders ist als im Fall von Kugeln.

Es ist wichtig zu betonen, dass alle Anforderungen an eine Stichprobe darauf hinauslaufen, dass der Psychologe auf ihrer Grundlage möglichst vollständige und unverzerrte Informationen über die Merkmale der allgemeinen Bevölkerung erhalten muss, aus der diese Stichprobe stammt. Mit anderen Worten, die Stichprobe sollte die Merkmale der untersuchten Allgemeinbevölkerung so vollständig wie möglich widerspiegeln.

Die Zusammensetzung der Versuchsstichprobe sollte die Allgemeinbevölkerung repräsentieren (simulieren), da die im Experiment gewonnenen Erkenntnisse zukünftig auf die gesamte Allgemeinbevölkerung übertragen werden sollen. Aus diesem Grund muss die Probe eine besondere Qualität haben - Repräsentativität, wodurch es möglich wird, die daraus gewonnenen Schlussfolgerungen auf die gesamte allgemeine Bevölkerung auszudehnen.

Die Repräsentativität der Stichprobe ist sehr wichtig, jedoch aus objektiven Gründen äußerst schwierig aufrechtzuerhalten. So ist es eine wohlbekannte Tatsache, dass 70 % bis 90 % aller psychologischen Forschungen zum menschlichen Verhalten in den 1960er Jahren in den Vereinigten Staaten mit College-Studenten durchgeführt wurden, die meisten von ihnen Studentenpsychologen. In Laborstudien, die an Tieren durchgeführt werden, sind Ratten das häufigste Untersuchungsobjekt. Aus diesem Grund wurde die Psychologie nicht umsonst als „Wissenschaft der Zweitklässler und weißen Ratten“ bezeichnet. College-Psychologiestudenten machen nur 3 % der gesamten US-Bevölkerung aus. Offensichtlich ist die Schülerstichprobe nicht repräsentativ als Modell, das den Anspruch erhebt, die gesamte Bevölkerung des Landes zu repräsentieren.

Vertreter Probe, oder wie sie sagen, Vertreter eine Stichprobe ist eine solche Stichprobe, in der alle Hauptmerkmale der Allgemeinbevölkerung in etwa dem gleichen Anteil und mit der gleichen Häufigkeit vertreten sind, mit der dieses Merkmal in dieser Allgemeinbevölkerung auftritt. Mit anderen Worten, eine repräsentative Stichprobe ist ein kleineres, aber genaues Modell der Population, die sie repräsentieren soll. Soweit die Stichprobe repräsentativ ist, können die auf der Untersuchung dieser Stichprobe basierenden Schlussfolgerungen mit hoher Sicherheit für die gesamte Bevölkerung gelten. Diese Verbreitung der Ergebnisse wird genannt Generalisierbarkeit.

Idealerweise sollte eine repräsentative Stichprobe so sein, dass jedes der vom Psychologen untersuchten grundlegenden Merkmale, Merkmale, Persönlichkeitsmerkmale usw. darin im Verhältnis zu den gleichen Merkmalen in der Allgemeinbevölkerung vertreten wären. Nach diesen Anforderungen muss das Stichprobenverfahren eine innere Logik haben, die den Forscher davon überzeugen kann, dass es sich im Vergleich zur Allgemeinbevölkerung tatsächlich als repräsentativ, repräsentativ herausstellen wird.

In seiner konkreten Tätigkeit geht der Psychologe folgendermaßen vor: Er bildet eine Untergruppe (Stichprobe) innerhalb der Allgemeinbevölkerung, untersucht diese Stichprobe im Detail (führt experimentelle Arbeiten damit durch) und erweitert dann, wenn es die Ergebnisse der statistischen Analyse zulassen Erkenntnisse für die gesamte Bevölkerung. Dies sind die Hauptphasen der Arbeit eines Psychologen mit einer Probe.

Der angehende Psychologe muss sich eines häufigen Fehlers bewusst sein: Jedes Mal, wenn er irgendwelche Daten mit irgendeiner Methode und aus irgendeiner Quelle sammelt, ist er immer versucht, seine Schlussfolgerungen auf die gesamte Bevölkerung auszudehnen. Um einen solchen Fehler zu vermeiden, ist neben gesundem Menschenverstand vor allem eine gute Beherrschung der Grundbegriffe der mathematischen Statistik erforderlich.

Musterrepräsentativität - Konzept und Typen. Einordnung und Merkmale der Kategorie „Repräsentativität der Stichprobe“ 2017, 2018.

Es gibt grundlegende Unterschiede zwischen einer Zeitreihe und einer Stichprobe. Erstens sind die Elemente einer Zufallsstichprobe statistisch unabhängig, während die Elemente einer Zeitreihe dies nicht sind, weil in den Zeitreihen können Sie den Entwicklungstrend nachvollziehen und Werte für die Zukunft vorhersagen. Zweitens sind die Mitglieder der Zeitreihen nicht gleichmäßig verteilt. Drittens sind für eine Zufallsstichprobe der mathematische Erwartungswert, die Varianz und die Standardabweichung konstant, im Gegensatz zur Zeitreihe, die die Dynamik der Entwicklung eines beliebigen Merkmals im Laufe der Zeit widerspiegelt, und daher können sich auch numerische Merkmale im Laufe der Zeit ändern.

Die Repräsentativität der Stichprobe ist die Übereinstimmung der Merkmale der Stichprobe mit den Merkmalen der Allgemeinbevölkerung. Die Repräsentativität der Stichprobe bestimmt, inwieweit die aus der untersuchten Stichprobe gezogenen Schlussfolgerungen auf die Allgemeinbevölkerung übertragbar sind. Um eine hohe Repräsentativität der Stichprobe zu gewährleisten, ist es notwendig, eine große Stichprobengröße und das Vorhandensein von Elementen aus allen Gruppen der Allgemeinbevölkerung sicherzustellen. Um eine hohe Repräsentativität der Zeitreihen zu erreichen, ist es notwendig, eine ausreichend lange Datenmenge zu analysieren, die sich im Laufe der Zeit verändert, da Beispielsweise erlaubt die Verfügbarkeit von Daten zum stündlichen Gasverbrauch für den 1. Januar für mehrere Jahre keine Prognose des Gasverbrauchsvolumens für andere Daten. Diese. Um die Repräsentativität der Zeitreihen zu gewährleisten, muss sichergestellt werden, dass eine Reihe von Beobachtungen in unterschiedlichen Zeiträumen verfügbar sind.

Die Repräsentativität der Stichprobe wird in erster Linie durch ihre Größe bestimmt. Darüber hinaus sollte die Auswahl der Indikatoren aus homogenen Gruppen erfolgen, und die Wahrscheinlichkeit, dass ein Element der Allgemeinbevölkerung in die Stichprobe gelangt, sollte für alle Elemente gleich sein. Die Stichprobenmethode beeinflusst wiederum die Stichprobengröße. Die Stichprobengröße wird durch eine Reihe von Faktoren bestimmt: Populationsgröße, Student's t-Test, Stichprobenvarianz, marginaler Stichprobenfehler usw. Bei einer Zeitreihe wird die Repräsentativität durch die Verfügbarkeit von Informationen für unterschiedliche Zeiträume erreicht.

Meiner Meinung nach bietet es sich bei der Betrachtung der gesamten Zeitreihe als Ganzes an, eine typische Selektion vorzunehmen, indem man die Allgemeinbevölkerung in Gruppen einteilt, die einem Tag entsprechen. Und dann wählen wir für jeden Tag nach Datum zufällig einen der stündlichen Verbräuche aus. Anhand der gewonnenen Reihen lassen sich die täglichen Schwankungen des Gasverbrauchs nicht abschätzen, wohl aber der allgemeine Trend.

In unserem Fall sind bei der Untersuchung eines relativ stabilen Bereichs des Gasverbrauchs im Gegensatz dazu tägliche Schwankungen von größerem Interesse, daher werden wir aus Untergruppen auswählen, die einem Zeitpunkt des Verbrauchs entsprechen.

Daher wählen wir als Basisstichprobe 25 % der Allgemeinbevölkerung, d. h. Wählen wir aus jeder Gruppe von Stundenwerten 0,25*52=13 Werte zufällig aus. Lassen Sie uns alle Daten nummerieren (52 Stk.). Und mit der Funktion RANDBETWEEN(1;52) ermitteln wir 13 Werte jeder Stundengruppe.

Abbildung 18 – Bestimmung der Anzahl der in der Stichprobe enthaltenen Elemente

Da Die Funktion RANDBETWEEN() berechnet die Werte nach jeder Operation neu, wir speichern die gefundenen Werte im Format von Zahlen ohne Formel.

Abbildung 19 – Bildung einer 25 %-Stichprobe

Verschieben Sie die generierte Auswahl auf ein separates Blatt.

Abbildung 20 – Gebildete Basisprobe

Die Hauptmerkmale einer typischen Stichprobe sind der Stichprobenumfang, der Stichprobenmittelwert, die Stichprobenvarianz, der Mittelwert der Varianzen innerhalb der Gruppe sowie die mittleren und marginalen Stichprobenfehler. Angesichts der Tatsache, dass alle Gruppen in der Anzahl der Beobachtungen gleich sind, berechnen wir den Durchschnitt der gruppeninternen Varianzen als einfachen arithmetischen Mittelwert. Wir finden gruppeninterne und Stichprobenvarianzen mit der Funktion VARS().

Bei einem typischen Resampling beträgt der durchschnittliche Fehler:

Für eine typische Neuauswahl beträgt der Grenzfehler:

Der Wert des Student's t-Test wird in speziellen Tabellen gefunden. Mit einer Wahrscheinlichkeit von 99,7 % t=3.

Tabelle 6 – Eigenschaften der Basisprobe

Lassen Sie uns die Basisstichprobe in zwei Unterstichproben aufteilen: Die erste deckt Werte von 0:00 bis einschließlich 11:00 Uhr ab, die zweite von 12:00 bis einschließlich 23:00 Uhr. Wir werden Histogramme gemäß dem in der letzten Lektion besprochenen Algorithmus erstellen. Um Histogramme zu erstellen, bestimmen wir die Anzahl und Breite der Intervalle für die Basisstichprobe, und für Teilstichproben werden die Häufigkeiten durch die Grenzen der Basisstichprobenintervalle bestimmt, um das Histogrammbild klarer zu machen.

Tabelle 7 – Daten zum Erstellen von Histogrammen

Intervall

Endeffekt

obere Grenze

Basisprobe

Teilprobe 1

Teilprobe 2

Wenn wir uns bereits die Tabelle ansehen, können wir sagen, dass die Verteilungsgesetze der Basisstichprobe und der Teilstichproben unterschiedlich sein werden. Dies bestätigt die in den Absätzen 1 und 2 aufgestellten Annahmen über die Unterschiede zwischen der Stichprobe und den Zeitreihen und die Repräsentativität der Zeitreihendaten.

Abbildung 21 – Histogramm für die Basisstichprobe und Unterstichproben

Das Aussehen der Diagramme für die Grundstichprobe und für die Teilstichproben 1 und 2 ist unterschiedlich. In den ersten Intervallen liegt die Häufigkeit für die Basisstichprobe näher an den Häufigkeiten von Unterstichprobe 1, in der letzten - Unterstichprobe 2. Dies liegt daran, dass vor 11:00 Uhr das Volumen des stündlichen Gasverbrauchs geringer ist als nach 11:00 Uhr: 00. Dieses Histogramm veranschaulicht perfekt den Unterschied zwischen einer Stichprobe und einer Zeitreihe und die statistische Abhängigkeit der Elemente der Zeitreihe. Die Verteilungsgesetze aller drei betrachteten Elemente sind unterschiedlich.

Finden Sie die Eigenschaften von zwei Teilstichproben.

Tabelle 8 – Merkmale von Unterproben

Subsampling-Eigenschaften

Teilprobe 1 bis 11:00 Uhr

Teilprobe 2 ab 12:00 Uhr

Bedeutung

Bedeutung

Wertänderung relativ zu den Eigenschaften der Basisprobe

Stichprobenmittelwert

Stichprobenabweichung

Durchschnitt der Varianzen innerhalb der Gruppe

Stichprobengröße

Stichprobenfehler

ultimative

Der Stichprobenmittelwert in der ersten und zweiten Teilstichprobe unterscheidet sich vom Mittelwert der Basisstichprobe um -4,23 % bzw. +4,23 %. Diese Tatsache bestätigt die Möglichkeit, dass sich Merkmale in Zeitreihen im Laufe der Zeit ändern.

Die Stichprobenvarianz in der zweiten Teilstichprobe ist um 55,56 % geringer als die Varianz der Basisstichprobe. Dieser Unterschied ist sehr signifikant.

Die Reduzierung des Stichprobenumfangs ist auf die Teilung der Grundstichprobe in zwei gleiche Teile zurückzuführen.

Die Stichprobenfehler in den beiden Unterstichproben sind viel größer als die Basisstichprobenfehler.

Lassen Sie uns die Konfidenzintervalle für die mathematischen Erwartungen der Basisstichprobe und zweier Teilstichproben mithilfe der Funktion VERTRAUEN bestimmen.

Tabelle 9 – Bestimmung der Grenzen der Konfidenzintervalle für die mathematische Erwartung

Stellen wir schematisch die Konfidenzwahrscheinlichkeiten für die mathematischen Erwartungen der drei betrachteten Stichproben dar.

Abbildung 22 – Schematische Darstellung der Konfidenzintervalle der mathematischen Erwartungen der Basisstichprobe und Teilstichproben

Konfidenzintervalle überschneiden sich nicht, daher ist die Wahrscheinlichkeit der Gleichheit der mathematischen Erwartungen der Basisstichprobe und einer der Teilstichproben 0. Berechnen Sie das Konfidenzintervall für die mathematische Erwartung jeder Teilstichprobe unter Verwendung der Standardabweichung der Basisstichprobe .

Tabelle 10 – Berechnung neuer Konfidenzintervalle

Für die erste Teilstichprobe hat sich das Konfidenzintervall seitdem leicht geändert die Standardabweichung der ersten Teilstichprobe liegt nahe bei der Standardabweichung der Basisstichprobe. Für die zweite Teilstichprobe verdoppelte sich das Konfidenzintervall aufgrund einer ähnlichen Erhöhung der angegebenen Standardabweichung fast. Die Erweiterung des Konfidenzintervalls ist mit einer Zunahme der Standardabweichung verbunden, die die Streuung einer Zufallsvariablen relativ zum Mittelwert charakterisiert. Die Standardabweichung nimmt zu, daher nimmt die Streuung zu, was zu einer Erweiterung der Grenzen des Konfidenzintervalls führt. Indirekt lässt sich die Erweiterung des Konfidenzintervalls auch mit der Drei-Sigma-Regel begründen, die besagt: Die Wahrscheinlichkeit, dass eine Zufallsvariable um mehr als das Dreifache der Standardabweichung von ihrer mathematischen Erwartung abweicht, ist praktisch Null. Je größer der Wert der Standardabweichung ist, desto breiter ist das Schwankungsintervall der Zufallsvariablen und desto größer ist daher das Konfidenzintervall für die mathematische Erwartung. Eine signifikante Zunahme von Stichprobenfehlern und das Fehlen von Schnittpunkten in den Konfidenzintervallen der Basisstichprobe und der Teilstichproben machen die Daten der Teilstichprobe aus Sicht der Untersuchung der gesamten Zeitreihe der stündlichen Gasverbrauchsdynamik nicht repräsentativ. Subsampling-Daten können verwendet werden, um den Gasverbrauch zu verschiedenen Tageszeiten von 0:00 bis 11:00 Uhr und von 12:00 bis 23:00 Uhr zu analysieren und zu prognostizieren. Nach dem gleichen Prinzip war es möglich, Teilstichproben zu bilden und den stündlichen Gasverbrauch in einem stabilen Zeitraum bei Tag und Nacht vorherzusagen. In diesem Kapitel wurde die Möglichkeit untersucht, einen Teil einer Zeitreihe anstelle der gesamten Zeitreihe für Analysen und Prognosen zu verwenden. Eine signifikante Zunahme von Stichprobenfehlern und das Fehlen von Schnittpunkten in den Konfidenzintervallen der Basisstichprobe und der Teilstichproben machen die Daten der Teilstichprobe aus Sicht der Untersuchung der gesamten Zeitreihe der stündlichen Gasverbrauchsdynamik nicht repräsentativ. Subsampling-Daten können verwendet werden, um den Gasverbrauch zu verschiedenen Tageszeiten von 0:00 bis 11:00 Uhr und von 12:00 bis 23:00 Uhr zu analysieren und zu prognostizieren. Nach dem gleichen Prinzip war es möglich, Teilstichproben zu bilden und den stündlichen Gasverbrauch in einem stabilen Zeitraum bei Tag und Nacht vorherzusagen.

Der Begriff der Repräsentativität in der soziologischen Forschung

Mit anderen Worten, Repräsentativität ist die Qualität der Stichprobe. Die Stichprobe kann repräsentativ oder nicht repräsentativ sein. Wenn in einer soziologischen Studie eine große Gruppe von Personen verwendet wurde, ist die Stichprobe repräsentativ.

Bestimmung 2

Eine Stichprobe ist eine ausgewählte Anzahl von Elementen der Allgemeinbevölkerung. Eine repräsentative Stichprobe zeichnet sich dadurch aus, dass alle Elemente der Allgemeinbevölkerung im gleichen Verhältnis vertreten sind.

Die Repräsentativität einer Stichprobe einer soziologischen Studie wird durch zwei Zufallskomponenten bestimmt: Fehler, die bei der Registrierung gemacht wurden, und zufällige Fehler.

Beispiel 1

Beispiel: Wenn der Gegenstand der soziologischen Forschung komplex ist und mehrere Elemente hat, werden mehr Interviewer benötigt. Nicht alle Interviewer sind immer gut qualifiziert, was zu Registrierungsfehlern führen kann. Im Gegensatz dazu führt die Durchführung einer Stichprobenerhebung durch besser vorbereitete und instruierte Interviewer zu einer Verringerung der Fehlerquote, also der Zufallsfehler.

Die Probenahme läuft auf drei Hauptprobleme hinaus:

  • Bestimmen Sie die Stichprobengröße (d. h. bauen Sie ein bestimmtes Verfahren auf, damit die Stichprobe repräsentativ ist);
  • Bestimmen Sie die Stichprobengröße (die zu befragende Anzahl);
  • Beurteilung der Qualität der Probe (Analyse der Genauigkeit der Ergebnisse).

Bemerkung 1

Es ist wichtig, daran zu denken, dass die Stichproben- und Populationsraten 5 % nicht überschreiten sollten. Wenn ein solches Verhältnis verletzt wird, entsprechen die Schlussfolgerungen einer solchen soziologischen Studie nicht der Realität.

Beispieltypen

Proben sind unterteilt in: zufällig und zielgerichtet.

Stichproben sind am genauesten und repräsentativsten. Der Kern dieser Stichprobe besteht darin, dass aufgrund der Zufallsauswahl alle Einheiten der Allgemeinbevölkerung die gleiche Chance haben, in die Stichprobe aufgenommen zu werden. Diese Art der Probenahme wird normalerweise vor Wahlen, Referenden und anderen öffentlichen Veranstaltungen verwendet. Zusätzlich zu der Tatsache, dass dieses Muster uns Genauigkeit gibt, hat es Schwierigkeiten bei der Anwendung. Um eine Zufallsstichprobe durchführen zu können, muss ein Soziologe eine Liste der Elemente der Allgemeinbevölkerung haben, was nicht immer einfach ist. Die zufällige Auswahl erfordert eine große Stichprobengröße, um genaue Ergebnisse zu erhalten.

Varianten der Zufallsstichprobe sind seriell, regionalisiert, mechanisch und andere.

  • Serielle oder verschachtelte Probenahmen haben die Form von Serien. Sie besteht in der Auswahl einzelner Elemente (Familie, Gruppe, Schule, Team etc.), die einer kontinuierlichen Forschung unterzogen werden.
  • Zoned Sampling wird verwendet, wenn das gesamte Datenarray in homogene Teile aufgeteilt werden muss. Solche Teile können Stadtteile sein.
  • Das Prinzip der mechanischen Stichprobenziehung besteht darin, dass alle Elemente der Allgemeinbevölkerung einer Liste zugeordnet werden und daraus durch gleiche Integrale die erforderliche Anzahl von Befragten ausgewählt wird. Die mechanische Probenahme hat das Verhältnis der allgemeinen Bevölkerung zur Stichprobe. Beispiel: Wenn die allgemeine Bevölkerung 2000 Personen und die Stichprobe 200 Personen umfasst, bedeutet dies, dass jede zehnte Person aus der allgemeinen Liste ausgewählt wird.

Die gezielte Bemusterung ist eine Art der Bemusterung, bei der die Auswahl nach den Kriterien Zugänglichkeit, Typizität, Gleichheit etc. Die gezielte Probenahme wird in Spontan-, Schneeball- und Quotenprobenahme unterteilt.

  • Eine spontane Probe ist eine Probe des ersten Ankömmlings. Der Nachteil dieser Stichprobe besteht darin, dass die Grundgesamtheit nicht vorherbestimmt werden kann.
  • Die Schneeballmethode besteht darin, Informationen aufzubauen. Jeder Befragte nennt Kontakte von Kollegen, Freunden, Bekannten, die an der Studie teilnehmen können etc.
  • Angebotsprobenahme. In diesem Beispiel sind alle Daten ein Kontingent. Bei der Quotenstichprobe werden die Befragten gezielt unter Einhaltung der Quotenvorgaben ausgewählt. Merkmale, die nach Quoten ausgewählt werden, sind Geschlecht, Bildung, Alter, Qualifikationsniveau oder andere, die durch die Ziele und Zielsetzungen der soziologischen Forschung selbst bestimmt werden.

Tatsächlich beginnen wir nicht mit einer, sondern mit drei Fragen: Was ist eine Stichprobe? Wann ist es repräsentativ? was stellt sie dar?

Aggregat - dies ist jede für uns interessante Gruppe von Personen, Organisationen, Ereignissen, über die wir Rückschlüsse ziehen möchten, und Ereignis, oder Objekt, - jedes Element einer solchen Sammlung 1 .Probe – eine beliebige Untergruppe der für die Analyse ausgewählten Menge von Fällen (Objekten). Wenn wir die Entscheidungstätigkeit der Gesetzgeber der Bundesstaaten untersuchen wollen, könnten wir eine solche Tätigkeit in den Gesetzgebern der Bundesstaaten Virginia, North Carolina und South Carolina untersuchen und nicht in allen fünfzig Bundesstaaten, und auf dieser Grundlage verteilen erhielten Daten über die Bevölkerung, aus der diese drei Staaten ausgewählt wurden. Wenn wir das Wählerpräferenzsystem von Pennsylvania untersuchen wollen, könnten wir dies tun, indem wir 50 US-Arbeiter befragen. S. Steele in Pittsburgh und verteilen die Ergebnisse der Umfrage an alle Wähler im Bundesstaat. Wenn wir die Intelligenz von College-Studenten messen wollten, könnten wir alle in einer bestimmten Fußballsaison im Bundesstaat Ohio registrierten Abwehrspieler testen und die Ergebnisse dann auf die Bevölkerung ausdehnen, zu der sie gehören. In jedem Beispiel gehen wir wie folgt vor: Wir bilden eine Untergruppe innerhalb der Allgemeinbevölkerung, ziemlich Wir untersuchen diese Untergruppe oder Stichprobe im Detail und dehnen unsere Ergebnisse auf die gesamte Population aus. Dies sind die Hauptphasen der Probenahme.

Es scheint jedoch ziemlich offensichtlich zu sein, dass jede dieser Proben einen signifikanten Nachteil hat. Obwohl beispielsweise die gesetzgebenden Körperschaften von Virginia, North Carolina und South Carolina Teil der Konstellation der einzelstaatlichen gesetzgebenden Körperschaften sind, werden sie aus historischen, geografischen und politischen Gründen wahrscheinlich auf sehr ähnliche Weise und sehr unterschiedlich von solchen unterschiedlichen gesetzgebenden Körperschaften arbeiten Staaten wie New York, Nebraska und Alaska. Obwohl die fünfzig Stahlarbeiter in Pittsburgh tatsächlich Wähler in Pennsylvania sind, können sie aufgrund ihres sozioökonomischen Status, ihrer Bildung und ihrer Lebenserfahrung durchaus andere Ansichten haben als viele andere Menschen, die ebenfalls Wähler sind. Auch wenn Fußballer aus dem US-Bundesstaat Ohio College-Studenten sind, können sie sich aus verschiedenen Gründen durchaus von anderen Studenten unterscheiden. Mit anderen Worten, obwohl jede dieser Untergruppen tatsächlich eine Stichprobe ist, unterscheiden sich die Mitglieder jeder von ihnen systematisch von den meisten anderen Mitgliedern der Population, aus der sie ausgewählt wurden. Als eigenständige Gruppe ist keine von ihnen typisch hinsichtlich der Verteilung von Meinungsmerkmalen, Verhaltensmotiven und Merkmalen in der ihnen zugeordneten Allgemeinbevölkerung. Dementsprechend würden Politikwissenschaftler sagen, dass keine dieser Stichproben repräsentativ ist.

Repräsentative Stichprobe - dies eine solche Stichprobe ist, in der alle Hauptmerkmale der Allgemeinbevölkerung, aus der diese Stichprobe stammt, in etwa dem gleichen Anteil oder mit der gleichen Häufigkeit vertreten sind, mit der dieses Merkmal in dieser Allgemeinbevölkerung auftritt. Wenn also 50 % aller bundesstaatlichen gesetzgebenden Körperschaften nur alle zwei Jahre zusammentreten, sollte etwa die Hälfte einer repräsentativen Stichprobe von bundesstaatlichen gesetzgebenden Körperschaften von dieser Art sein. Wenn 30 % der Wähler in Pennsylvania Arbeiter sind, sind es ungefähr 30 % eines Abgeordneten die Stichproben für diese Wähler (statt 100 % wie im obigen Beispiel) müssen Arbeiter sein. Und wenn 2 % aller College-Studenten Sportler sind, sollte ungefähr der gleiche Anteil einer repräsentativen Stichprobe von College-Studenten Sportler sein. Mit anderen Worten, eine repräsentative Stichprobe ist ein Mikrokosmos, ein kleineres, aber genaues Modell der Bevölkerung, die sie repräsentieren soll. Soweit die Stichprobe repräsentativ ist, können die auf der Untersuchung dieser Stichprobe basierenden Schlussfolgerungen sicher als auf die ursprüngliche Population anwendbar betrachtet werden. Diese Ergebnisverteilung nennen wir Generalisierbarkeit.

Vielleicht hilft eine grafische Darstellung, dies zu verdeutlichen. Angenommen, wir wollen Muster der politischen Gruppenzugehörigkeit unter US-Erwachsenen untersuchen. Abbildung 5.1 zeigt drei Kreise, die in sechs gleiche Sektoren unterteilt sind. Abbildung 5.1a repräsentiert die gesamte betrachtete Population. Die Mitglieder der Bevölkerung werden nach den politischen Gruppierungen (zB Parteien und Interessengruppen) eingeteilt, denen sie angehören. In diesem Beispiel gehört jeder Erwachsene mindestens einer und höchstens sechs Fraktionen an; und diese sechs Mitgliedschaftsebenen sind insgesamt gleich häufig (daher die gleichen Sektoren). Angenommen, wir wollen die Motive der Menschen, einer Gruppe beizutreten, die Gruppenwahl und die Beteiligungsmuster untersuchen, aber aufgrund von Ressourcenbeschränkungen können wir nur eines von sechs Mitgliedern der Bevölkerung untersuchen. Wer sollte für die Analyse ausgewählt werden?

Reis. 5.1. Bildung einer Stichprobe aus der Allgemeinbevölkerung

Eine der möglichen Stichproben einer gegebenen Größe ist durch die schraffierte Fläche in Abb. 5.1b dargestellt, spiegelt aber eindeutig nicht die Struktur der Grundgesamtheit wider. Wenn wir aus dieser Stichprobe verallgemeinern würden, würden wir schließen: (1) dass alle erwachsenen Amerikaner den fünf politischen Gruppen angehören und (2) dass das gesamte amerikanische Gruppenverhalten mit dem Verhalten derjenigen übereinstimmt, die genau zu den fünf Gruppen gehören. Wir wissen jedoch, dass die erste Schlussfolgerung nicht wahr ist, und dies kann dazu führen, dass wir an der Gültigkeit der zweiten zweifeln. Auf diese Weise, Die in Abbildung 5.1b gezeigte Stichprobe ist nicht repräsentativ, da sie nicht die Verteilung einer gegebenen Populationseigenschaft widerspiegelt (oft als Parameter ) entsprechend seiner tatsächlichen Verteilung. Eine solche Probe soll es sein hin verschoben Mitglieder der fünf Gruppen bzw weg verschoben von alle anderen Gruppenmitgliedschaftsmodelle. Basierend auf einer solchen voreingenommenen Stichprobe kommen wir normalerweise zu falschen Schlussfolgerungen über die Bevölkerung.

Am deutlichsten wird dies am Beispiel der Katastrophe der Zeitschrift Literary Digest in den 1930er Jahren, die eine Meinungsumfrage zu den Wahlergebnissen durchführte. Der Literary Digest war eine Zeitschrift, die Zeitungsleitartikel und anderes Material der öffentlichen Meinung nachdruckte; diese zeitschrift war zu beginn des jahrhunderts sehr beliebt. Ab 1920 führte das Magazin eine weitreichende landesweite Umfrage durch, bei der Stimmzettel an mehr als eine Million Menschen verschickt wurden, in denen sie gebeten wurden, ihren bevorzugten Kandidaten für die bevorstehenden Präsidentschaftswahlen zu benennen. Einige Jahre lang waren die Umfrageergebnisse des Magazins so genau, dass die September-Umfrage den Wahlen im November scheinbar wenig Bedeutung beizumessen schien. Und wie konnte bei einer so großen Stichprobe ein Fehler auftreten? Doch 1936 geschah genau das: Mit großer Stimmenmehrheit (60:40) prognostizierte der republikanische Kandidat Alf Landon den Sieg. Bei den Wahlen verlor Landon gegen eine behinderte Person - Franklin D. Roosevelt - mit fast dem gleichen Ergebnis, mit dem er hätte gewinnen sollen. Die Glaubwürdigkeit des Literary Digest wurde so stark untergraben, dass die Zeitschrift bald darauf vergriffen war. Was ist passiert? Es ist ganz einfach: Die Digest-Umfrage verwendete eine voreingenommene Stichprobe. Postkarten wurden an Personen verschickt, deren Namen aus zwei Quellen entnommen wurden: Telefonverzeichnissen und Kfz-Zulassungslisten. Obwohl sich diese Auswahlmethode vorher nicht sehr von anderen Methoden unterschieden hatte, war sie jetzt, während der Weltwirtschaftskrise von 1936, ganz anders, als sich die weniger wohlhabenden Wähler, Roosevelts wahrscheinlichste Stütze, kein Telefon leisten konnten, geschweige denn ein Auto. Daher war die in der Digest-Umfrage verwendete Stichprobe tatsächlich auf diejenigen ausgerichtet, die am ehesten für die Republikaner kandidieren würden, und es ist immer noch überraschend, dass Roosevelt ein so gutes Ergebnis erzielte.

Wie kann man dieses Problem lösen? Um zu unserem Beispiel zurückzukehren, vergleichen wir das Beispiel in Abb. 5.1b mit dem Beispiel in Abb. 5.1c. Im letzteren Fall wurde ebenfalls ein Sechstel der Bevölkerung für die Analyse ausgewählt, aber jeder der Haupttypen der Bevölkerung ist in der Stichprobe in dem Anteil vertreten, in dem er in der Gesamtbevölkerung vertreten ist. Eine solche Stichprobe zeigt, dass jeder sechste amerikanische Erwachsene einer politischen Gruppe angehört, einer von sechs bis zwei und so weiter. Eine solche Stichprobe würde auch andere Unterschiede zwischen ihren Mitgliedern aufdecken, die mit der Teilnahme an einer unterschiedlichen Anzahl von Gruppen zusammenhängen könnten. Somit ist die in Abbildung 5.1c dargestellte Stichprobe eine repräsentative Stichprobe für die betrachtete Grundgesamtheit.

Natürlich ist dieses Beispiel in mindestens zweierlei Hinsicht eine Vereinfachung. Erstens sind die meisten für Politikwissenschaftler interessanten Populationen vielfältiger als die im Beispiel. Personen, Dokumente, Regierungen, Organisationen, Entscheidungen usw. unterscheiden sich nicht in einem, sondern in einer viel größeren Anzahl von Merkmalen. Daher sollte eine repräsentative Stichprobe so sein jeder vom Haupt-, anderen Bereich war im Verhältnis zu seinem Anteil am Aggregat dargestellt. Zweitens ist die Situation, in der die tatsächliche Verteilung der Variablen oder Elemente, die wir messen möchten, nicht im Voraus bekannt ist, viel häufiger als das Gegenteil – vielleicht wurde sie bei der vorherigen Volkszählung nicht gemessen. Daher muss eine repräsentative Stichprobe so gestaltet werden, dass sie die bestehende Verteilung genau widerspiegelt, auch wenn wir ihre Gültigkeit nicht direkt beurteilen können. Das Stichprobenverfahren muss eine interne Logik haben, die uns davon überzeugen kann, dass die Stichprobe tatsächlich repräsentativ wäre, wenn wir sie mit der Volkszählung vergleichen könnten.

Um die komplexe Organisation einer bestimmten Population genau abbilden zu können und ein gewisses Maß an Vertrauen zu haben, dass die vorgeschlagenen Verfahren dazu in der Lage sind, wenden sich die Forscher statistischen Methoden zu. Dabei agieren sie in zwei Richtungen. Erstens entscheiden die Forscher anhand bestimmter Regeln (interne Logik), welche spezifischen Objekte untersucht werden sollen, was genau in eine bestimmte Probe aufgenommen werden soll. Zweitens entscheiden sie nach sehr unterschiedlichen Regeln, wie viele Objekte sie auswählen. Wir werden diese zahlreichen Regeln nicht im Detail untersuchen, sondern nur ihre Rolle in der politikwissenschaftlichen Forschung betrachten. Beginnen wir mit den Strategien zur Auswahl von Objekten, die eine repräsentative Stichprobe bilden.

Machen wir uns mit drei Konzepten vertraut, die jeder kennen muss, der auf die eine oder andere Weise mit soziologischer Forschung in Berührung kommt: die Allgemeinbevölkerung, die Stichprobenpopulation (Stichprobe), Repräsentativität.

Durchschnittsbevölkerung - dies sind alles Einheiten des durch den Studiengang definierten Studiengegenstandes. Wenn wir über eine gesamtrussische öffentliche Meinungsumfrage sprechen, wird es die gesamte erwachsene Bevölkerung Russlands sein. Oder alle Moskauer Studenten, wenn wir uns verpflichten, eine Umfrage unter ihnen durchzuführen. Oder all die obdachlosen Kinder von Kaluga, wenn wir eine soziologische Studie zu diesem Thema durchführen wollen.

Stichprobenpopulation (Stichprobe) - dies ist der Teil der Allgemeinbevölkerung, den wir direkt untersuchen werden, d. h. die Personen, an die wir uns mit Interviewfragen oder Fragebögen wenden; jene Materialien, die wir mit der Methode der Inhaltsanalyse usw.

Manchmal entspricht die Stichprobe der allgemeinen Bevölkerung (z. B. wenn wir alle Erstsemester der Fakultät für Journalistik der Staatlichen Universität Moskau befragen). Aber normalerweise ist es weniger, manchmal um mehrere zehn- und hundertmal. Gleichzeitig hat die Praxis der soziologischen Forschung bewiesen, dass es bei landesweiten Umfragen ausreicht, 1,5 bis 2 Tausend Personen für Umfragen auszuwählen. Wenn die Stichprobe gut, korrekt und repräsentativ gebildet ist, kann sie objektive Informationen über die Meinung aller Russen geben.

Die Hauptsache ist also, die richtige Stichprobe zu bilden. Die Stichprobengröße hängt von der Zielsetzung der Studie, den Besonderheiten und dem Grad der Homogenität des Untersuchungsgegenstandes, der Fragmentierung der zu untersuchenden Gruppen und dem angestrebten Grad seiner Repräsentativität ab. Was bedeutet dieser magische und wichtigste Begriff in der empirischen Soziologie – „Repräsentativität“?

Repräsentativität- Dies ist die Übereinstimmung, Angemessenheit der Stichprobenpopulation (Stichprobe) gemäß den Hauptmerkmalen der Allgemeinbevölkerung. Wenn in der Struktur der Bevölkerung 55% Frauen und 45%; Männer, dann sollte die Probe das gleiche Verhältnis haben. Dasselbe gilt für Alter, Beruf, Siedlungstyp usw. Kurz gesagt, die Stichprobenkonfiguration muss mit der Konfiguration der Grundgesamtheit übereinstimmen. Dies kann in einer solchen Abbildung dargestellt werden (Abb. 8).

Das Wichtigste bei einer soziologischen Studie ist die Repräsentativität der Stichprobe, denn gerade damit sind Genauigkeit und Objektivität der gewonnenen Ergebnisse verbunden.

Die Probe kann auf unterschiedliche Weise gebildet werden. Aber die Haupttypen sind zwei repräsentative und nicht repräsentative Stichproben.

Repräsentative Proben

Wahrscheinlichkeits- oder Zufallsstichprobe Es basiert auf der Tatsache, dass alle Objekte in der Allgemeinbevölkerung die gleiche Wahrscheinlichkeit haben, in die Stichprobe aufgenommen zu werden. Es gibt verschiedene Arten von Wahrscheinlichkeitsstichproben.

1.systematische Auswahl. Es ist sehr beliebt und wird oft in der Sozialforschung verwendet. Das bedeutet, dass je nach Größe der Stichprobe jedes Individuum aus der Allgemeinbevölkerung ausgewählt wird. n-tes (6, 20, 45 usw.) Objekt. Zum Beispiel befragen wir die erwachsene Bevölkerung eines der Wahllokale. Wir nehmen Wahllisten. Sagen wir, sie haben 10.000 Leute. Und wir brauchen eine Stichprobe von 500 Personen. Wir teilen die Zahl 10.000 der Allgemeinbevölkerung durch die Zahl 500 der Stichprobe, wir erhalten 20. Das bedeutet, dass wir jeden zwanzigsten Wähler aus den Listen auswählen.

Angenommen, wir müssen Moskowiter telefonisch befragen und von ihnen herausfinden, welches Programm sie gerade im Fernsehen sehen. Wir nehmen ein Referenztelefonbuch, zählen, wie viele Nummern darin enthalten sind, dividieren diese Nummer durch die Nummer, die wir abfragen müssen, und wir erhalten einen Schritt, bei dem wir eine systematische Auswahl von Nummern durchführen.

Das gleiche kann mit Häusern auf der Straße gemacht werden, wenn wir unsere Empfänger zu Hause interviewen. Auf der geraden Straßenseite gehen wir zum Beispiel in jedes fünfte Haus. Usw.

2.Auswahl per Los oder Ziehung. Diese Methode ist Ihnen vertraut, wenn Sie beispielsweise einen Hut, eine Vase oder eine Schachtel in alle Straßen Moskaus werfen und 20 auswählen, auf denen Sie Nachforschungen anstellen. Auch Regionen, Siedlungen, Postämter etc. können ausgewählt werden.

3. Auswahl per Zufallszahlenverfahren. Dazu werden spezielle mathematische Zufallszahlentabellen nach der Anzahl der Proben erstellt und ein Objekt ausgewählt, das zuvor mit dieser Nummer markiert wurde.

Quotenstrichprobenerhebung wird nach Quoten gebildet (d. h. Objekte, die ein bestimmtes Attribut nach Geschlecht, Alter, Wohnort usw. haben), die prozentual der Allgemeinbevölkerung entsprechen. Angenommen, wir untersuchen die Bevölkerung einer Kleinstadt und wissen, wie viel Prozent davon junge Menschen, Menschen mittleren Alters und alte Menschen, Männer und Frauen, Erwerbstätige und Rentner sind. Wir müssen für die Umfrage Personen mit diesen Merkmalen im gleichen Prozentsatz auswählen. Diese Stichprobe ist in Bezug auf den Grad der Repräsentativität nahezu probabilistisch.

Geschichtete Stichprobe unterscheidet sich von der Quote dadurch, dass künstlich im Zusammenhang mit den Untersuchungszielen Schichten, Schichten gebildet werden, die untersucht werden und in der Regel quantitativ gleich sind. Die Schichten sollten homogener sein als die Gesamtbevölkerung. Zum Beispiel untersuchen wir die Leser verschiedener Publikationen: AiF, Izvestia, Truda, Komsomolskaya Pravda, MK und bilden gleiche Schichten von Lesern verschiedener Publikationen, sagen wir jeweils 200 Personen.

Zonenweise Probenahme Wird normalerweise bei der Untersuchung von Gebieten verwendet, häufig unter Verwendung einer geografischen Karte, eines Siedlungsschemas usw., aus der bestimmte Einheiten für die Untersuchung ausgewählt werden. Beispielsweise werden Regionen aus verschiedenen geografischen Zonen Russlands oder Moskauer Bezirken ausgewählt. Manchmal wird die sogenannte geografische Kreuztechnik verwendet, bei der Punkte auf der Horizontalen und Vertikalen dieses geografischen Kreuzes ausgewählt werden. So wurde die Stichprobe in den 60er Jahren in Meinungsstudien am Institut für öffentliche Meinung in der Komsomolskaja Prawda gebildet.

Seriell, verschachtelt, geclustert Sampling funktioniert nicht mit Einheiten, sondern mit Nestern, homogenen Gruppen (Familie, Produktionsteam, Studentengruppe, Fußballfans, TV-Zuschauer, die im selben Raum fernsehen, Stadtgebiete etc.). Üblicherweise wird in diesem Fall eine kontinuierliche Befragung durchgeführt.