Konfidenzintervall für einen normalen Bevölkerungsmittelwert. Konfidenzintervalle für mathematische Erwartung, Varianz, Wahrscheinlichkeit. Problemlösungen. Konfidenzintervall für mathematische Erwartung

Lassen Sie uns in MS EXCEL ein Konfidenzintervall erstellen, um den Mittelwert der Verteilung im Fall eines bekannten Streuungswerts abzuschätzen.

Natürlich die Wahl Maß an Vertrauen hängt ganz vom zu lösenden Problem ab. Daher sollte das Vertrauen eines Fluggastes in die Zuverlässigkeit eines Flugzeugs zweifellos höher sein als das Vertrauen eines Käufers in die Zuverlässigkeit einer Glühbirne.

Problem Formulierung

Nehmen wir das an Bevölkerung genommen worden Probe Größe n. Es wird angenommen dass Standardabweichung diese Verteilung ist bekannt. Auf dieser Grundlage ist es notwendig Proben das Unbekannte bewerten Verteilungsmittel(μ, ) und konstruieren Sie das entsprechende beidseitig Konfidenzintervall.

Punktschätzung

Wie aus bekannt ist Statistiken(Lassen Sie es uns bezeichnen X durchschn) Ist unvoreingenommene Schätzung des Mittelwerts Das Bevölkerung und hat eine Verteilung N(μ;σ 2 /n).

Notiz: Was tun, wenn Sie bauen müssen? Konfidenzintervall im Falle einer Verteilung das ist nicht normal? In diesem Fall kommt zur Rettung, was besagt, dass die Größe ausreichend groß ist Proben n aus dem Vertrieb nicht sein normal, Stichprobenverteilung der Statistiken X durchschn Wille etwa entsprechen Normalverteilung mit Parametern N(μ;σ 2 /n).

Also, Punktschätzung Durchschnitt Verteilungswerte wir haben - das Stichprobenmittelwert, d.h. X durchschn. Jetzt fangen wir an Konfidenzintervall.

Erstellen eines Konfidenzintervalls

Wenn wir die Verteilung und ihre Parameter kennen, können wir normalerweise die Wahrscheinlichkeit berechnen, dass die Zufallsvariable einen Wert aus dem von uns angegebenen Intervall annimmt. Machen wir nun das Gegenteil: Finden Sie das Intervall, in das die Zufallsvariable mit einer bestimmten Wahrscheinlichkeit fällt. Zum Beispiel aus den Eigenschaften Normalverteilung Es ist bekannt, dass eine Zufallsvariable mit einer Wahrscheinlichkeit von 95 % verteilt ist normales Gesetz, liegt im Bereich von etwa +/- 2 von Durchschnittswert(siehe Artikel über). Dieses Intervall wird uns als Prototyp dienen Konfidenzintervall.

Nun wollen wir sehen, ob wir die Verteilung kennen , um dieses Intervall zu berechnen? Um die Frage zu beantworten, müssen wir die Form der Verteilung und ihre Parameter angeben.

Wir kennen die Vertriebsform – das ist Normalverteilung(Denken Sie daran, worüber wir reden Stichprobenverteilung Statistiken X durchschn).

Der Parameter μ ist uns unbekannt (er muss nur geschätzt werden mit Konfidenzintervall), aber wir haben eine Schätzung davon X Durchschnitt, berechnet basierend auf Proben, die genutzt werden können.

Zweiter Parameter - Standardabweichung des Stichprobenmittelwerts wir werden es als bekannt betrachten, es ist gleich σ/√n.

Weil Wir kennen μ nicht, dann bilden wir das Intervall +/- 2 Standardabweichungen nicht von Durchschnittswert und aus seiner bekannten Schätzung X durchschn. Diese. beim Rechnen Konfidenzintervall Das werden wir NICHT annehmen X durchschn liegt im Bereich +/- 2 Standardabweichungen von μ mit einer Wahrscheinlichkeit von 95 %, und wir gehen davon aus, dass das Intervall +/- 2 beträgt Standardabweichungen aus X durchschn mit einer Wahrscheinlichkeit von 95 % wird es μ abdecken – Durchschnitt der Gesamtbevölkerung, von dem es genommen wird Probe. Diese beiden Aussagen sind äquivalent, aber die zweite Aussage ermöglicht uns die Konstruktion Konfidenzintervall.

Lassen Sie uns außerdem das Intervall klären: eine verteilte Zufallsvariable normales Gesetz, fällt mit einer Wahrscheinlichkeit von 95 % in den Bereich +/- 1,960 Standardabweichungen, nicht +/- 2 Standardabweichungen. Dies kann mit der Formel berechnet werden =NORM.ST.REV((1+0,95)/2), cm. Beispieldatei Sheet Interval.

Jetzt können wir eine probabilistische Aussage formulieren, die uns zur Bildung dient Konfidenzintervall:
„Die Wahrscheinlichkeit, dass Bevölkerungsdurchschnitt gelegen von Stichprobendurchschnitt innerhalb von 1.960 " Standardabweichungen des Stichprobenmittelwerts“, gleich 95 %".

Der in der Aussage genannte Wahrscheinlichkeitswert hat einen besonderen Namen , was damit verbunden ist Signifikanzniveau α (Alpha) durch einen einfachen Ausdruck Vertrauens Stufe =1 . In unserem Fall Signifikanzniveau α =1-0,95=0,05 .

Basierend auf dieser Wahrscheinlichkeitsaussage schreiben wir nun einen Ausdruck zur Berechnung Konfidenzintervall:

wobei Z α/2 Standard Normalverteilung(dieser Wert der Zufallsvariablen z, Was P(z>=Z α/2 )=α/2).

Notiz: Oberes α/2-Quantil definiert die Breite Konfidenzintervall V Standardabweichungen Stichprobenmittelwert. Oberes α/2-Quantil Standard Normalverteilung immer größer als 0, was sehr praktisch ist.

In unserem Fall mit α=0,05, oberes α/2-Quantil entspricht 1,960. Für andere Signifikanzniveaus α (10 %; 1 %) oberes α/2-Quantil Z α/2 kann mit der Formel =NORM.ST.REV(1-α/2) oder, falls bekannt, berechnet werden Vertrauens Stufe, =NORM.ST.OBR((1+Vertrauensstufe)/2).

Normalerweise beim Bauen Konfidenzintervalle zur Schätzung des Mittelwerts nur benutzen oberes α/2-Quantil und nicht verwenden niedrigeres α/2-Quantil. Dies ist möglich, weil Standard Normalverteilung symmetrisch um die x-Achse ( seine Verteilungsdichte symmetrisch etwa durchschnittlich, d.h. 0). Eine Berechnung ist daher nicht erforderlich unteres α/2-Quantil(es heißt einfach α /2-Quantil), Weil es ist gleich oberes α/2-Quantil mit einem Minuszeichen.

Erinnern wir uns daran, dass trotz der Form der Verteilung der Wert x die entsprechende Zufallsvariable ist X durchschn verteilt etwa Bußgeld N(μ;σ 2 /n) (siehe Artikel über). Daher gilt im Allgemeinen der obige Ausdruck für Konfidenzintervall ist nur eine Näherung. Wenn der Wert x verteilt ist normales Gesetz N(μ;σ 2 /n), dann ist der Ausdruck für Konfidenzintervall ist exakt.

Berechnung des Konfidenzintervalls in MS EXCEL

Lassen Sie uns das Problem lösen.
Die Reaktionszeit einer elektronischen Komponente auf ein Eingangssignal ist ein wichtiges Merkmal des Geräts. Ein Ingenieur möchte ein Konfidenzintervall für die durchschnittliche Antwortzeit mit einem Konfidenzniveau von 95 % erstellen. Aus früheren Erfahrungen weiß der Ingenieur, dass die Standardabweichung der Reaktionszeit 8 ms beträgt. Es ist bekannt, dass der Ingenieur zur Bewertung der Reaktionszeit 25 Messungen durchgeführt hat, der Durchschnittswert lag bei 78 ms.

Lösung: Ein Ingenieur möchte die Reaktionszeit eines elektronischen Geräts wissen, versteht aber, dass die Reaktionszeit kein fester Wert, sondern eine Zufallsvariable mit eigener Verteilung ist. Das Beste, worauf er hoffen kann, ist, die Parameter und die Form dieser Verteilung zu bestimmen.

Leider kennen wir aus den Problembedingungen nicht die Form der Antwortzeitverteilung (das muss auch nicht der Fall sein). normal). Auch diese Verteilung ist unbekannt. Nur er ist bekannt Standardabweichungσ=8. Daher können wir die Wahrscheinlichkeiten zwar nicht berechnen und konstruieren Konfidenzintervall.

Allerdings kennen wir die Verteilung nicht Zeit separate Antwort, das wissen wir gem CPT, Stichprobenverteilung durchschnittliche Reaktionszeit ist circa normal(Wir gehen davon aus, dass die Bedingungen CPT durchgeführt werden, weil Größe Proben ziemlich groß (n=25)) .

Außerdem, Durchschnitt diese Verteilung ist gleich Durchschnittswert Verteilung einer einzelnen Antwort, d.h. μ. A Standardabweichung dieser Verteilung (σ/√n) kann mit der Formel =8/ROOT(25) berechnet werden.

Es ist auch bekannt, dass der Ingenieur erhalten hat Punktschätzung Parameter μ gleich 78 ms (X avg). Deshalb können wir jetzt Wahrscheinlichkeiten berechnen, weil Wir kennen die Form der Verteilung ( normal) und seine Parameter (X avg und σ/√n).

Ingenieur will es wissen erwarteter Wertμ-Reaktionszeitverteilungen. Wie oben erwähnt, ist dieses μ gleich mathematische Erwartung der Stichprobenverteilung der durchschnittlichen Antwortzeit. Wenn wir verwenden Normalverteilung N(X avg; σ/√n), dann liegt der gewünschte μ mit einer Wahrscheinlichkeit von etwa 95 % im Bereich +/-2*σ/√n.

Signifikanzniveau entspricht 1-0,95=0,05.

Lassen Sie uns zum Schluss den linken und rechten Rand finden Konfidenzintervall.
Linker Rand: =78-NORM.ST.REV(1-0,05/2)*8/ROOT(25) = 74,864
Rechter Rand: =78+NORM.ST.INV(1-0,05/2)*8/ROOT(25)=81,136

Linker Rand: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Rechter Rand: =NORM.REV(1-0,05/2; 78; 8/ROOT(25))

Antwort: Konfidenzintervall bei 95 % Konfidenzniveau und σ=8ms gleicht 78+/-3,136 ms.

IN Beispieldatei auf dem Sigma-Blatt bekannt, ein Formular zur Berechnung und Konstruktion erstellt beidseitig Konfidenzintervall für willkürlich Proben mit gegebenem σ und Signifikanzniveau.

Funktion CONFIDENCE.NORM()

Wenn die Werte Proben liegen im Bereich B20:B79 , A Signifikanzniveau gleich 0,05; dann die MS-EXCEL-Formel:
=AVERAGE(B20:B79)-CONFIDENCE.NORM(0.05;σ; COUNT(B20:B79))
gibt den linken Rand zurück Konfidenzintervall.

Der gleiche Grenzwert kann mit der Formel berechnet werden:
=AVERAGE(B20:B79)-NORM.ST.REV(1-0.05/2)*σ/ROOT(COUNT(B20:B79))

Notiz: Die Funktion CONFIDENCE.NORM() erschien in MS EXCEL 2010. In früheren Versionen von MS EXCEL wurde die Funktion TRUST() verwendet.

In der Statistik gibt es zwei Arten von Schätzungen: Punkt- und Intervallschätzungen. Punktschätzung ist eine Einzelstichprobenstatistik, die zur Schätzung eines Populationsparameters verwendet wird. Zum Beispiel der Stichprobenmittelwert ist eine Punktschätzung der mathematischen Erwartung der Grundgesamtheit und der Stichprobenvarianz S 2- Punktschätzung der Populationsvarianz σ 2. Es hat sich gezeigt, dass der Stichprobenmittelwert eine unvoreingenommene Schätzung der mathematischen Erwartungen der Bevölkerung ist. Ein Stichprobenmittelwert wird als erwartungstreu bezeichnet, weil der Durchschnitt aller Stichprobenmittelwerte (mit derselben Stichprobengröße) N) entspricht der mathematischen Erwartung der Allgemeinbevölkerung.

Um die Stichprobenvarianz zu ermitteln S 2 wurde zu einer unvoreingenommenen Schätzung der Populationsvarianz σ 2, sollte der Nenner der Stichprobenvarianz gleich gesetzt werden N – 1 , und nicht N. Mit anderen Worten: Die Populationsvarianz ist der Durchschnitt aller möglichen Stichprobenvarianzen.

Bei der Schätzung von Bevölkerungsparametern sollte berücksichtigt werden, dass Stichprobenstatistiken wie z , hängen von bestimmten Proben ab. Um diese Tatsache zu berücksichtigen, zu erhalten Intervallschätzung Mathematische Erwartungen der Allgemeinbevölkerung, analysieren Sie die Verteilung der Stichprobenmittelwerte (weitere Einzelheiten finden Sie unter). Das konstruierte Intervall zeichnet sich durch ein bestimmtes Konfidenzniveau aus, das die Wahrscheinlichkeit darstellt, dass der wahre Populationsparameter korrekt geschätzt wird. Ähnliche Konfidenzintervalle können verwendet werden, um den Anteil eines Merkmals abzuschätzen R und die verteilte Hauptmasse der Bevölkerung.

Laden Sie die Notiz im oder Format herunter, Beispiele im Format

Erstellen eines Konfidenzintervalls für die mathematische Erwartung der Grundgesamtheit mit einer bekannten Standardabweichung

Erstellen eines Konfidenzintervalls für den Anteil eines Merkmals in der Grundgesamtheit

In diesem Abschnitt wird das Konzept des Konfidenzintervalls auf kategoriale Daten erweitert. Dadurch können wir den Anteil des Merkmals in der Grundgesamtheit abschätzen R Beispielfreigabe verwenden RS= X/N. Wie angegeben, wenn die Mengen NR Und N(1 – p) Wenn die Zahl 5 übersteigt, kann die Binomialverteilung als normal angesehen werden. Daher geht es darum, den Anteil eines Merkmals in der Grundgesamtheit abzuschätzen R Es ist möglich, ein Intervall zu konstruieren, dessen Konfidenzniveau gleich ist (1 – α)х100 %.


Wo PS- Stichprobenanteil des Merkmals gleich X/N, d.h. Anzahl der Erfolge dividiert durch die Stichprobengröße, R- der Anteil des Merkmals an der Gesamtbevölkerung, Z- kritischer Wert der standardisierten Normalverteilung, N- Stichprobengröße.

Beispiel 3. Nehmen wir an, dass eine Stichprobe von 100 im letzten Monat ausgefüllten Rechnungen aus dem Informationssystem extrahiert wird. Nehmen wir an, dass 10 dieser Rechnungen fehlerhaft erstellt wurden. Auf diese Weise, R= 10/100 = 0,1. Das 95 %-Konfidenzniveau entspricht dem kritischen Wert Z = 1,96.

Somit liegt die Wahrscheinlichkeit, dass zwischen 4,12 % und 15,88 % der Rechnungen Fehler enthalten, bei 95 %.

Für eine gegebene Stichprobengröße erscheint das Konfidenzintervall, das den Anteil des Merkmals in der Grundgesamtheit enthält, breiter als für eine kontinuierliche Zufallsvariable. Dies liegt daran, dass Messungen einer kontinuierlichen Zufallsvariablen mehr Informationen enthalten als Messungen kategorialer Daten. Mit anderen Worten, kategoriale Daten, die nur zwei Werte annehmen, enthalten nicht genügend Informationen, um die Parameter ihrer Verteilung abzuschätzen.

INBerechnen von Schätzungen, die aus einer endlichen Grundgesamtheit extrahiert wurden

Schätzung der mathematischen Erwartung. Korrekturfaktor für die endgültige Grundgesamtheit ( fpc) wurde verwendet, um den Standardfehler um einen Faktor zu reduzieren. Bei der Berechnung von Konfidenzintervallen für Grundgesamtheitsparameterschätzungen wird ein Korrekturfaktor in Situationen angewendet, in denen Stichproben gezogen werden, ohne zurückgegeben zu werden. Somit gibt es ein Konfidenzintervall für die mathematische Erwartung mit einem Konfidenzniveau von (1 – α)х100 %, wird nach der Formel berechnet:

Beispiel 4. Um die Verwendung des Korrekturfaktors für eine endliche Grundgesamtheit zu veranschaulichen, kehren wir zum oben in Beispiel 3 erläuterten Problem der Berechnung des Konfidenzintervalls für den durchschnittlichen Rechnungsbetrag zurück. Angenommen, ein Unternehmen stellt 5.000 Rechnungen pro Monat aus und X=110,27 Dollar, S= 28,95 $, N = 5000, N = 100, α = 0,05, t 99 = 1,9842. Mit Formel (6) erhalten wir:

Schätzung des Anteils eines Features. Bei der Auswahl ohne Rückgabe ist das Konfidenzintervall für den Anteil des Attributs mit einem Konfidenzniveau gleich (1 – α)х100 %, wird nach der Formel berechnet:

Konfidenzintervalle und ethische Fragen

Bei der Stichprobenerhebung in einer Bevölkerung und beim Ziehen statistischer Schlussfolgerungen treten häufig ethische Fragen auf. Das wichtigste Problem besteht darin, wie Konfidenzintervalle und Punktschätzungen der Stichprobenstatistiken übereinstimmen. Die Veröffentlichung von Punktschätzungen ohne Angabe der zugehörigen Konfidenzintervalle (in der Regel auf dem 95 %-Konfidenzniveau) und der Stichprobengröße, aus der sie abgeleitet werden, kann zu Verwirrung führen. Dies kann beim Benutzer den Eindruck erwecken, dass die Punktschätzung genau das ist, was er benötigt, um die Eigenschaften der gesamten Population vorherzusagen. Daher ist es notwendig zu verstehen, dass der Schwerpunkt bei jeder Forschung nicht auf Punktschätzungen, sondern auf Intervallschätzungen liegen sollte. Darüber hinaus sollte besonderes Augenmerk auf die richtige Auswahl der Stichprobengrößen gelegt werden.

Gegenstand statistischer Manipulationen sind meist die Ergebnisse soziologischer Bevölkerungsumfragen zu bestimmten politischen Themen. Gleichzeitig werden die Umfrageergebnisse auf den Titelseiten der Zeitungen veröffentlicht, und der Stichprobenfehler und die statistische Analysemethodik werden irgendwo in der Mitte veröffentlicht. Um die Gültigkeit der erhaltenen Punktschätzungen nachzuweisen, müssen die Stichprobengröße, auf deren Grundlage sie ermittelt wurden, die Grenzen des Konfidenzintervalls und sein Signifikanzniveau angegeben werden.

Nächster Hinweis

Es werden Materialien aus dem Buch Levin et al. „Statistics for Managers“ verwendet. – M.: Williams, 2004. – S. 448–462

Zentraler Grenzwertsatz besagt, dass bei einer ausreichend großen Stichprobengröße die Stichprobenverteilung der Mittelwerte durch eine Normalverteilung angenähert werden kann. Diese Eigenschaft hängt nicht von der Art der Bevölkerungsverteilung ab.

Eine Zufallsvariable sei nach einem Normalgesetz verteilt, für das die Varianz D unbekannt ist. Es wird eine Stichprobe der Größe n hergestellt. Daraus wird die korrigierte Stichprobenvarianz s 2 ermittelt. Zufälliger Wert

verteilt nach dem Gesetz 2 mit n -1 Freiheitsgraden. Angesichts der Zuverlässigkeit können Sie beliebig viele Grenzen von 1 2 und 2 2 Intervallen finden, so dass

Finden wir 1 2 und 2 2 aus den folgenden Bedingungen:

P(2 1 2) = (1 -)/ 2(**)

P(2 2 2) = (1 -)/ 2(***)

Wenn die letzten beiden Bedingungen erfüllt sind, ist die Gleichheit (*) offensichtlich wahr.

In Tabellen für Zufallsvariable 2 wird üblicherweise die Lösung der Gleichung angegeben

Aus einer solchen Tabelle können Sie unter Verwendung eines gegebenen Werts von q und der Anzahl der Freiheitsgrade n - 1 den Wert von q 2 bestimmen. Somit wird der Wert 2 2 in der Formel (***) sofort gefunden.

Um 1 2 zu bestimmen, transformieren wir (**):

P(2 1 2) = 1 - (1 -)/ 2 = (1 +)/ 2

Die resultierende Gleichheit ermöglicht es uns, den Wert 1 2 aus der Tabelle zu ermitteln.

Nachdem wir nun die Werte 1 2 und 2 2 gefunden haben, stellen wir die Gleichheit (*) in der Form dar

Schreiben wir die letzte Gleichung so um, dass die Grenzen des Konfidenzintervalls für den unbekannten Wert D bestimmt werden:

Von hier aus lässt sich leicht die Formel zur Ermittlung des Konfidenzintervalls für die Standardabweichung ermitteln:

Aufgabe. Wir gehen davon aus, dass der Lärm in den Cockpits von Hubschraubern des gleichen Typs mit Motoren, die in einem bestimmten Modus arbeiten, eine nach einem Normalgesetz verteilte Zufallsvariable ist. 20 Hubschrauber wurden nach dem Zufallsprinzip ausgewählt und in jedem von ihnen der Lärmpegel (in Dezibel) gemessen. Die korrigierte Stichprobenvarianz der Messungen betrug 22,5. Finden Sie das Konfidenzintervall, das die unbekannte Standardabweichung des Lärmpegels in den Cockpits von Hubschraubern dieses Typs mit einer Zuverlässigkeit von 98 % abdeckt.

Lösung. Basierend auf der Anzahl der Freiheitsgrade gleich 19 und der Wahrscheinlichkeit (1 – 0,98)/2 = 0,01 finden wir aus Verteilungstabelle 2 den Wert 2 2 = 36,2. Ebenso erhalten wir mit der Wahrscheinlichkeit (1 + 0,98)/2 = 0,99 1 2 = 7,63. Mit der Formel (****) erhalten wir das erforderliche Konfidenzintervall: (3,44; 7,49).

Konfidenzintervall– die Grenzwerte einer statistischen Größe, die mit einer gegebenen Konfidenzwahrscheinlichkeit γ bei der Probenahme eines größeren Volumens in diesem Intervall liegen wird. Bezeichnet als P(θ - ε. In der Praxis wird die Konfidenzwahrscheinlichkeit γ aus Werten ausgewählt, die ziemlich nahe bei Eins liegen: γ = 0,9, γ = 0,95, γ = 0,99.

Zweck des Dienstes. Mit diesem Dienst können Sie Folgendes ermitteln:

  • Konfidenzintervall für den allgemeinen Mittelwert, Konfidenzintervall für die Varianz;
  • Konfidenzintervall für die Standardabweichung, Konfidenzintervall für den allgemeinen Anteil;
Die resultierende Lösung wird in einer Word-Datei gespeichert (siehe Beispiel). Nachfolgend finden Sie eine Videoanleitung zum Ausfüllen der Ausgangsdaten.

Beispiel Nr. 1. Auf einer Kollektivfarm wurden von einer Gesamtherde von 1000 Schafen 100 Schafe einer selektiven Kontrollscherung unterzogen. Als Ergebnis wurde ein durchschnittlicher Wollschnitt von 4,2 kg pro Schaf ermittelt. Bestimmen Sie mit einer Wahrscheinlichkeit von 0,99 den mittleren quadratischen Fehler der Stichprobe bei der Bestimmung der durchschnittlichen Wollscherung pro Schaf und die Grenzen, innerhalb derer der Scherwert liegt, wenn die Varianz 2,5 beträgt. Die Probe ist nicht repetitiv.
Beispiel Nr. 2. Aus einer Charge importierter Produkte am Posten des Moskauer Nordzollamts wurden 20 Proben des Produkts „A“ durch zufällige Wiederholungsstichproben entnommen. Als Ergebnis des Tests wurde der durchschnittliche Feuchtigkeitsgehalt des Produkts „A“ in der Probe ermittelt, der 6 % bei einer Standardabweichung von 1 % betrug.
Bestimmen Sie mit einer Wahrscheinlichkeit von 0,683 die Grenzen des durchschnittlichen Feuchtigkeitsgehalts des Produkts in der gesamten Charge importierter Produkte.
Beispiel Nr. 3. Eine Umfrage unter 36 Studenten ergab, dass die durchschnittliche Anzahl der von ihnen während des akademischen Jahres gelesenen Lehrbücher 6 betrug. Unter der Annahme, dass die Anzahl der von einem Studenten pro Semester gelesenen Lehrbücher einem Normalverteilungsgesetz mit einer Standardabweichung von 6 unterliegt, finden Sie heraus : A) mit einer Zuverlässigkeit von 0,99 Intervallschätzung für den mathematischen Erwartungswert dieser Zufallsvariablen; B) Mit welcher Wahrscheinlichkeit können wir sagen, dass die aus dieser Stichprobe berechnete durchschnittliche Anzahl der von einem Studierenden pro Semester gelesenen Lehrbücher in absoluten Werten um nicht mehr als 2 von der mathematischen Erwartung abweicht?

Klassifizierung von Konfidenzintervallen

Nach Art des zu bewertenden Parameters:

Nach Probentyp:

  1. Konfidenzintervall für eine unendliche Stichprobe;
  2. Konfidenzintervall für die endgültige Stichprobe;
Die Stichprobe wird Resampling genannt, wenn das ausgewählte Objekt an die Population zurückgegeben wird, bevor das nächste ausgewählt wird. Die Probe wird als Non-Repeat bezeichnet, wenn das ausgewählte Objekt nicht an die Population zurückgegeben wird. In der Praxis haben wir es meist mit sich nicht wiederholenden Proben zu tun.

Berechnung des durchschnittlichen Stichprobenfehlers bei Zufallsstichproben

Als Diskrepanz zwischen den Werten der aus der Stichprobe gewonnenen Indikatoren und den entsprechenden Parametern der Allgemeinbevölkerung wird bezeichnet Repräsentativitätsfehler.
Bezeichnungen der Hauptparameter der Gesamt- und Stichprobenpopulation.
Formeln für durchschnittliche Stichprobenfehler
NeuauswahlAuswahl wiederholen
für durchschnittlichzum Teilenfür durchschnittlichzum Teilen
Die Beziehung zwischen der Stichprobenfehlergrenze (Δ) ist mit einiger Wahrscheinlichkeit garantiert Р(t), und der durchschnittliche Stichprobenfehler hat die Form: oder Δ = t·μ, wobei T– Konfidenzkoeffizient, bestimmt in Abhängigkeit vom Wahrscheinlichkeitsniveau P(t) gemäß der Tabelle der Laplace-Integralfunktion.

Formeln zur Berechnung der Stichprobengröße mithilfe einer rein zufälligen Stichprobenmethode