Erklärung für den Standardfehler der mittleren quadratischen Stichprobe. Durchschnittlicher Stichprobenfehler

Bevölkerung- eine Reihe von Einheiten, die Massencharakter, Typizität, qualitative Einheitlichkeit und das Vorhandensein von Variationen aufweisen.

Die statistische Grundgesamtheit besteht aus materiell existierenden Objekten (Beschäftigte, Unternehmen, Länder, Regionen), ist ein Objekt.

Bevölkerungseinheit- jede spezifische Einheit der statistischen Grundgesamtheit.

Ein und dieselbe Grundgesamtheit kann in einem Merkmal homogen und in einem anderen heterogen sein.

Qualitative Einheitlichkeit- die Ähnlichkeit aller Bevölkerungseinheiten für jedes Merkmal und die Unähnlichkeit für den Rest.

In einer statistischen Grundgesamtheit sind die Unterschiede zwischen einer Einheit der Grundgesamtheit und einer anderen häufiger quantitativer Natur. Quantitative Änderungen der Werte des Attributs verschiedener Bevölkerungseinheiten werden als Variation bezeichnet.

Feature-Variation- quantitative Änderung eines Zeichens (für ein quantitatives Zeichen) während des Übergangs von einer Einheit der Bevölkerung zu einer anderen.

Schild ist eine Eigenschaft Besonderheit oder andere Merkmale von Einheiten, Objekten und Phänomenen, die beobachtet oder gemessen werden können. Zeichen werden in quantitative und qualitative unterteilt. Die Vielfalt und Variabilität des Wertes eines Merkmals in einzelnen Einheiten der Population wird als bezeichnet Variation.

Attributive (qualitative) Merkmale sind nicht quantifizierbar (Zusammensetzung der Bevölkerung nach Geschlecht). Quantitative Merkmale haben einen numerischen Ausdruck (Zusammensetzung der Bevölkerung nach Alter).

Index- Dies ist ein verallgemeinerndes quantitatives und qualitatives Merkmal jeder Eigenschaft von Einheiten oder Aggregaten für den Zweck unter bestimmten Bedingungen von Zeit und Ort.

Scorekarte ist eine Reihe von Indikatoren, die das untersuchte Phänomen umfassend widerspiegeln.

Denken Sie zum Beispiel an das Gehalt:
  • Zeichen - Löhne
  • Grundgesamtheit - alle Arbeitnehmer
  • Die Einheit der Bevölkerung ist jeder Arbeiter
  • Qualitative Homogenität - aufgelaufenes Gehalt
  • Feature-Variation - eine Reihe von Zahlen

Allgemeine Bevölkerung und Stichprobe daraus

Grundlage ist ein Datensatz, der durch die Messung eines oder mehrerer Merkmale gewonnen wird. Wirklich beobachtete Menge von Objekten, statistisch repräsentiert durch eine Reihe von Beobachtungen zufällige Variable, ist Probenahme, und das hypothetisch Vorhandene (Erdachte) - Durchschnittsbevölkerung. Die Grundgesamtheit kann endlich sein (Anzahl der Beobachtungen N = konst) oder unendlich ( N = ∞) und die Probe aus Population ist immer das Ergebnis einer begrenzten Reihe von Beobachtungen. Die Anzahl der Beobachtungen, aus denen eine Stichprobe besteht, wird aufgerufen Stichprobengröße. Wenn die Stichprobengröße groß genug ist n→∞) wird die Probe betrachtet groß, andernfalls wird es als Probe bezeichnet begrenztes Volumen. Die Probe wird betrachtet klein, wenn bei der Messung einer eindimensionalen Zufallsvariablen der Stichprobenumfang 30 ( n<= 30 ) und bei gleichzeitiger Messung mehrerer ( k) Merkmale in einer mehrdimensionalen Raumbeziehung n zu k weniger als 10 (k< 10) . Die Musterformulare Variationsreihe wenn seine Mitglieder sind Bestellstatistik, also Stichprobenwerte der Zufallsvariablen X aufsteigend sortiert (ranked) werden die Werte des Attributs aufgerufen Optionen.

Beispiel. Nahezu derselbe zufällig ausgewählte Satz von Objekten - Geschäftsbanken eines Verwaltungsbezirks von Moskau - kann als Stichprobe aus der Gesamtbevölkerung aller Geschäftsbanken in diesem Bezirk und als Stichprobe aus der Gesamtbevölkerung aller Geschäftsbanken in Moskau betrachtet werden , sowie eine Stichprobe von Geschäftsbanken im Land und etc.

Grundlegende Stichprobenverfahren

Die Zuverlässigkeit statistischer Schlussfolgerungen und eine sinnvolle Interpretation der Ergebnisse hängt davon ab Repräsentativität Proben, d.h. Vollständigkeit und Angemessenheit der Darstellung der Eigenschaften der Allgemeinbevölkerung, in Bezug auf die diese Stichprobe als repräsentativ angesehen werden kann. Die Untersuchung der statistischen Eigenschaften der Bevölkerung kann auf zwei Arten organisiert werden: Verwendung kontinuierlich und diskontinuierlich. Kontinuierliche Beobachtung beinhaltet die Prüfung aller Einheiten studiert Aggregate, a nicht kontinuierliche (selektive) Beobachtung- nur Teile davon.

Es gibt fünf Möglichkeiten, die Probenahme zu organisieren:

1. einfache Zufallsauswahl, bei dem Objekte zufällig aus der allgemeinen Population von Objekten ausgewählt werden (z. B. unter Verwendung einer Tabelle oder eines Zufallszahlengenerators), und jede der möglichen Stichproben eine gleiche Wahrscheinlichkeit hat. Solche Proben werden aufgerufen eigentlich zufällig;

2. einfache Auswahl durch ein regelmäßiges Verfahren erfolgt anhand einer mechanischen Komponente (z. B. Datum, Wochentag, Wohnungsnummer, Buchstabe des Alphabets usw.) und die so gewonnenen Proben werden aufgerufen mechanisch;

3. geschichtet Die Selektion besteht darin, dass die allgemeine Volumenpopulation in Teilmengen oder Schichten (Strata) des Volumens unterteilt wird, so dass . Schichten sind hinsichtlich statistischer Merkmale homogene Objekte (z. B. wird die Bevölkerung in Schichten nach Altersgruppen oder sozialen Schichten eingeteilt; Unternehmen nach Branchen). In diesem Fall werden die Proben aufgerufen geschichtet(Andernfalls, geschichtet, typisch, zoniert);

4. Methoden seriell Auswahl werden verwendet, um zu bilden seriell oder verschachtelte Proben. Sie sind praktisch, wenn es notwendig ist, einen "Block" oder eine Reihe von Objekten gleichzeitig zu untersuchen (z. B. eine Warensendung, Produkte einer bestimmten Serie oder eine Bevölkerung in der territorial-administrativen Aufteilung des Landes). Die Auswahl der Serien kann zufällig oder mechanisch erfolgen. Gleichzeitig wird eine kontinuierliche Erhebung einer bestimmten Warencharge oder einer ganzen Gebietseinheit (ein Wohngebäude oder ein Quartier) durchgeführt;

5. kombiniert(gestufte) Auswahl kann mehrere Auswahlverfahren gleichzeitig kombinieren (z. B. stratifiziert und zufällig oder zufällig und mechanisch); ein solches Beispiel wird aufgerufen kombiniert.

Auswahltypen

Durch Geist es gibt Einzel-, Gruppen- und kombinierte Auswahl. Bei individuelle Auswahl einzelne Einheiten der Allgemeinbevölkerung werden in der Stichprobe mit ausgewählt Gruppenauswahl sind qualitativ homogene Gruppen (Reihen) von Einheiten, und kombinierte Auswahl beinhaltet eine Kombination des ersten und zweiten Typs.

Durch Methode Auswahl unterscheiden wiederholt und nicht wiederholt Probe.

Unwiederholbar sogenannte Selektion, bei der die in die Stichprobe gefallene Einheit nicht zur ursprünglichen Grundgesamtheit zurückkehrt und nicht an der weiteren Selektion teilnimmt; während die Anzahl der Einheiten der allgemeinen Bevölkerung N im Auswahlverfahren reduziert. Bei wiederholt Auswahl erwischt in der Stichprobe wird die Einheit nach Registrierung an die allgemeine Bevölkerung zurückgegeben und behält damit eine gleichberechtigte Verwendung mit anderen Einheiten für das weitere Auswahlverfahren; während die Anzahl der Einheiten der allgemeinen Bevölkerung N bleibt unverändert (die Methode wird selten in sozioökonomischen Studien verwendet). Allerdings mit einem großen N (N → ∞) Formeln für unwiederholt Auswahl sind nah an denen für wiederholt Auswahl und letztere werden fast häufiger verwendet ( N = konst).

Die Hauptmerkmale der Parameter der allgemeinen und Stichprobenpopulation

Grundlage der statistischen Schlussfolgerungen der Studie ist die Verteilung einer Zufallsvariablen, während die beobachteten Werte (x 1, x 2, ..., x n) heißen Realisierungen der Zufallsvariablen X(n ist die Stichprobengröße). Die Verteilung einer Zufallsvariablen in der allgemeinen Bevölkerung ist theoretisch, idealer Natur, und ihr Beispielanalog ist es empirisch Verteilung. Einige theoretische Verteilungen sind analytisch gegeben, d.h. Sie Optionen Bestimmen Sie den Wert der Verteilungsfunktion an jedem Punkt im Raum möglicher Werte der Zufallsvariablen. Für eine Stichprobe ist es daher schwierig und manchmal unmöglich, die Verteilungsfunktion zu bestimmen Optionen werden aus empirischen Daten geschätzt und dann in einen analytischen Ausdruck eingesetzt, der die theoretische Verteilung beschreibt. In diesem Fall ist die Annahme (bzw Hypothese) über die Art der Verteilung können sowohl statistisch richtig als auch falsch sein. Aber in jedem Fall charakterisiert die aus der Stichprobe rekonstruierte empirische Verteilung nur grob die wahre. Die wichtigsten Verteilungsparameter sind erwarteter Wert und Streuung.

Distributionen sind von Natur aus kontinuierlich und diskret. Die bekannteste stetige Verteilung ist normal. Selektive Analoga von Parametern und dafür sind: Mittelwert und empirische Varianz. Unter den diskreten in sozioökonomischen Studien, die am häufigsten verwendeten alternativ (dichotom) Verteilung. Der Erwartungsparameter dieser Verteilung drückt den relativen Wert (bzw Teilen) Einheiten der Grundgesamtheit, die das untersuchte Merkmal aufweisen (es ist durch den Buchstaben gekennzeichnet); der Anteil der Bevölkerung, der dieses Merkmal nicht aufweist, wird durch den Buchstaben gekennzeichnet q (q = 1 - p). Auch die Varianz der Alternativverteilung hat ein empirisches Analogon.

Je nach Art der Verteilung und je nach Auswahlverfahren der Bevölkerungseinheiten werden die Ausprägungen der Verteilungsparameter unterschiedlich berechnet. Die wichtigsten für die theoretischen und empirischen Verteilungen sind in der Tabelle angegeben. 9.1.

Stichprobenanteil k n ist das Verhältnis der Anzahl der Einheiten der Stichprobenpopulation zur Anzahl der Einheiten der Allgemeinbevölkerung:

kn = n/N.

Probenanteil m ist das Verhältnis der Einheiten, die das untersuchte Merkmal aufweisen x zur Stichprobengröße n:

w = n n / n.

Beispiel. Bei einer Warenpartie von 1000 Stück mit 5% Stichprobe Probenfraktion k n im absoluten Wert beträgt 50 Einheiten. (n = N*0,05); wenn in dieser Probe 2 fehlerhafte Produkte gefunden werden, dann Probenfraktion w 0,04 (w = 2/50 = 0,04 oder 4 %).

Da sich die Stichprobenpopulation von der allgemeinen Bevölkerung unterscheidet, gibt es Stichprobenfehler.

Tabelle 9.1 Hauptparameter der Grund- und Stichprobenpopulationen

Stichprobenfehler

Bei allen (festen und selektiven) Fehlern können zwei Arten auftreten: Registrierung und Repräsentativität. Fehler Anmeldung haben kann zufällig und systematisch Charakter. Zufällig Fehler setzen sich aus vielen verschiedenen unkontrollierbaren Ursachen zusammen, sind unbeabsichtigter Natur und gleichen sich in der Regel gegenseitig aus (z. B. Änderungen der Instrumentenanzeige aufgrund von Temperaturschwankungen im Raum).

Systematisch Fehler sind verzerrt, da sie gegen die Regeln zur Auswahl von Objekten in der Stichprobe verstoßen (z. B. Messabweichungen bei Änderung der Einstellungen des Messgeräts).

Beispiel. Um den sozialen Status der Bevölkerung in der Stadt zu beurteilen, ist geplant, 25 % der Familien zu untersuchen. Wenn jedoch jede vierte Wohnung nach ihrer Nummer ausgewählt wird, besteht die Gefahr, dass alle Wohnungen nur eines Typs (z. B. Einzimmerwohnungen) ausgewählt werden, was zu einem systematischen Fehler führt und die Ergebnisse verfälscht; Die Wahl der Wohnungsnummer per Los ist vorzuziehen, da der Fehler zufällig ist.

Repräsentativitätsfehler Sie sind nur der punktuellen Beobachtung inhärent, lassen sich nicht vermeiden und entstehen dadurch, dass die Stichprobe die allgemeine nicht vollständig wiedergibt. Die Werte der aus der Stichprobe erhaltenen Indikatoren unterscheiden sich von den Indikatoren mit denselben Werten in der Allgemeinbevölkerung (oder erhalten während der kontinuierlichen Beobachtung).

Stichprobenfehler ist die Differenz zwischen dem Wert des Parameters in der Allgemeinbevölkerung und seinem Stichprobenwert. Für den Durchschnittswert eines quantitativen Attributs ist es gleich: , und für den Anteil (alternatives Attribut) - .

Stichprobenfehler sind nur Stichprobenbeobachtungen inhärent. Je größer diese Fehler sind, desto mehr weicht die empirische Verteilung von der theoretischen ab. Die Parameter der empirischen Verteilung und sind Zufallsvariablen, daher sind Stichprobenfehler auch Zufallsvariablen, sie können für verschiedene Stichproben unterschiedliche Werte annehmen und sind daher üblich zu berechnen durchschnittlicher Fehler.

Durchschnittlicher Stichprobenfehler ist ein Wert, der die Standardabweichung des Stichprobenmittelwerts von der mathematischen Erwartung ausdrückt. Dieser Wert hängt nach dem Zufallsprinzip in erster Linie von der Stichprobengröße und dem Variationsgrad des Merkmals ab: Je größer und je geringer die Variation des Merkmals (daher der Wert von ), desto kleiner der Wert von der durchschnittliche Stichprobenfehler . Das Verhältnis zwischen den Varianzen der Grundgesamtheit und der Stichprobenpopulation wird durch die Formel ausgedrückt:

diese. für ausreichend groß können wir davon ausgehen, dass . Der durchschnittliche Stichprobenfehler zeigt die möglichen Abweichungen des Parameters der Stichprobengesamtheit vom Parameter der Allgemeinbevölkerung. Im Tisch. 9.2 zeigt Ausdrücke zur Berechnung des durchschnittlichen Stichprobenfehlers für verschiedene Methoden zur Organisation der Beobachtung.

Tabelle 9.2 Mittlerer Fehler (m) des Stichprobenmittelwerts und -anteils für verschiedene Stichprobentypen

Wo ist der Durchschnitt der gruppeninternen Stichprobenvarianzen für ein kontinuierliches Merkmal;

Der Durchschnitt der gruppeninternen Streuungen der Aktie;

— Anzahl der ausgewählten Serien, — Gesamtzahl der Serien;

,

wo ist der Durchschnitt der th Reihe;

- der allgemeine Durchschnitt über die gesamte Stichprobe für ein kontinuierliches Merkmal;

,

wo ist der Anteil des Merkmals in der th-Serie;

— der Gesamtanteil des Merkmals an der gesamten Stichprobe.

Allerdings kann die Größe des mittleren Fehlers nur mit einer gewissen Wahrscheinlichkeit Р (Р ≤ 1) beurteilt werden. Ljapunow A.M. bewiesen, dass die Verteilung von Stichprobenmittelwerten und damit ihre Abweichungen vom allgemeinen Mittelwert bei einer ausreichend großen Anzahl ungefähr dem Normalverteilungsgesetz gehorchen, vorausgesetzt, die allgemeine Bevölkerung hat einen endlichen Durchschnitt und eine begrenzte Varianz.

Mathematisch wird diese Aussage für den Mittelwert ausgedrückt als:

und für den Bruch nimmt der Ausdruck (1) die Form an:

wo - Es gibt marginaler Stichprobenfehler, was ein Vielfaches des durchschnittlichen Stichprobenfehlers ist , und der Multiplizitätsfaktor ist das Student-Kriterium ("Vertrauensfaktor"), vorgeschlagen von W.S. Gosset (Pseudonym „Student“); Werte für unterschiedliche Stichprobenumfänge werden in einer speziellen Tabelle gespeichert.

Die Werte der Funktion Ф(t) für einige Werte von t sind:

Daher kann Ausdruck (3) wie folgt gelesen werden: mit Wahrscheinlichkeit P = 0,683 (68,3 %) Es kann argumentiert werden, dass die Differenz zwischen der Stichprobe und dem allgemeinen Mittelwert einen Wert des mittleren Fehlers nicht überschreitet m(t=1), mit Wahrscheinlichkeit P = 0,954 (95,4 %)— dass er den Wert von zwei mittleren Fehlern nicht überschreitet m (t = 2) , mit Wahrscheinlichkeit P = 0,997 (99,7 %)- wird drei Werte nicht überschreiten m (t = 3) . Somit bestimmt die Wahrscheinlichkeit, dass diese Differenz den dreifachen Wert des mittleren Fehlers überschreitet Fehlerstufe und ist nicht mehr als 0,3% .

Im Tisch. 9.3 Formeln zur Berechnung des marginalen Stichprobenfehlers sind angegeben.

Tabelle 9.3 Grenzstichprobenfehler (D) für Mittelwert und Anteil (p) für verschiedene Stichprobenarten

Ausweitung der Probenergebnisse auf die Grundgesamtheit

Das ultimative Ziel der Stichprobenbeobachtung ist die Charakterisierung der Allgemeinbevölkerung. Bei kleinen Stichprobenumfängen können empirische Schätzungen der Parameter ( und ) erheblich von ihren wahren Werten ( und ) abweichen. Daher wird es notwendig, die Grenzen festzulegen, innerhalb derer die wahren Werte ( und ) für die Beispielwerte der Parameter ( und ) liegen.

Konfidenzintervall eines Parameters θ der Allgemeinbevölkerung wird als zufälliger Wertebereich dieses Parameters bezeichnet, der mit einer Wahrscheinlichkeit nahe 1 ( Verlässlichkeit) enthält den wahren Wert dieses Parameters.

marginaler Fehler Proben Δ ermöglicht es Ihnen, die Grenzwerte der Merkmale der Allgemeinbevölkerung und deren zu bestimmen Vertrauensintervalle, die gleich sind:

Endeffekt Konfidenzintervall durch Subtrahieren erhalten marginaler Fehler aus dem Stichprobenmittelwert (Anteil) und dem obersten durch Addition.

Konfidenzintervall für den Mittelwert verwendet es den marginalen Stichprobenfehler und wird für ein bestimmtes Konfidenzniveau durch die Formel bestimmt:

Dies bedeutet, dass mit einer bestimmten Wahrscheinlichkeit R, das Konfidenzniveau genannt wird und eindeutig durch den Wert bestimmt wird t, kann argumentiert werden, dass der wahre Wert des Mittelwerts im Bereich von liegt , und der wahre Wert der Aktie liegt im Bereich von

Bei der Berechnung des Konfidenzintervalls für die drei Standard-Konfidenzniveaus P = 95 %, P = 99 % und P = 99,9 % Wert wird durch ausgewählt. Anwendungen abhängig von der Anzahl der Freiheitsgrade. Wenn der Stichprobenumfang groß genug ist, dann entsprechen die Werte diesen Wahrscheinlichkeiten t sind gleich: 1,96, 2,58 und 3,29 . Der marginale Stichprobenfehler ermöglicht es uns also, die Randwerte der Merkmale der Allgemeinbevölkerung und ihre Konfidenzintervalle zu bestimmen:

Die Verteilung der Ergebnisse der selektiven Beobachtung an die allgemeine Bevölkerung in sozioökonomischen Studien hat ihre eigenen Merkmale, da sie die Vollständigkeit der Repräsentativität aller ihrer Typen und Gruppen erfordert. Grundlage für die Möglichkeit einer solchen Verteilung ist die Berechnung relativer Fehler:

wo Δ % - relativer marginaler Stichprobenfehler; , .

Es gibt zwei Hauptmethoden, um eine Stichprobenbeobachtung auf die Grundgesamtheit auszudehnen: direkte Umrechnung und Methode der Koeffizienten.

Wesen direkte Konvertierung ist, den Stichprobenmittelwert!!\overline(x) mit der Größe der Grundgesamtheit zu multiplizieren.

Beispiel. Lassen Sie die durchschnittliche Anzahl von Kleinkindern in der Stadt durch ein Stichprobenverfahren schätzen und auf eine Person belaufen. Bei 1000 jungen Familien in der Stadt ergibt sich die benötigte Anzahl an Plätzen in der städtischen Kita aus der Multiplikation dieses Durchschnitts mit der Gesamtbevölkerungszahl N = 1000, d.h. wird 1200 Sitzplätze sein.

Methode der Koeffizienten Es ist ratsam, es zu verwenden, wenn eine selektive Beobachtung durchgeführt wird, um die Daten einer kontinuierlichen Beobachtung zu klären.

Dabei wird die Formel verwendet:

wobei alle Variablen die Größe der Bevölkerung sind:

Erforderliche Stichprobengröße

Tabelle 9.4 Erforderlicher Stichprobenumfang (n) für verschiedene Arten von Stichprobenorganisationen

Bei der Planung einer Stichprobenerhebung mit einem vorgegebenen Wert des zulässigen Stichprobenfehlers ist es erforderlich, den erforderlichen richtig einzuschätzen Stichprobengröße. Dieser Betrag kann auf der Grundlage des zulässigen Fehlers während der selektiven Beobachtung auf der Grundlage einer bestimmten Wahrscheinlichkeit bestimmt werden, die ein akzeptables Fehlerniveau garantiert (unter Berücksichtigung der Art und Weise, wie die Beobachtung organisiert ist). Formeln zur Bestimmung des erforderlichen Stichprobenumfangs n lassen sich leicht direkt aus den Formeln für den marginalen Stichprobenfehler ableiten. Also aus dem Ausdruck für den Grenzfehler:

die Stichprobengröße wird direkt bestimmt n:

Diese Formel zeigt dies mit abnehmendem marginalen Stichprobenfehler Δ erhöht die erforderliche Stichprobengröße erheblich, was proportional zur Varianz und zum Quadrat des Student-t-Tests ist.

Für eine bestimmte Art der Organisation der Beobachtung wird die erforderliche Stichprobengröße gemäß den in der Tabelle angegebenen Formeln berechnet. 9.4.

Praktische Berechnungsbeispiele

Beispiel 1. Berechnung von Mittelwert und Konfidenzintervall für ein kontinuierliches quantitatives Merkmal.

Zur Beurteilung der Abwicklungsgeschwindigkeit gegenüber den Gläubigern der Bank wurde eine Stichprobe von 10 Zahlungsbelegen durchgeführt. Ihre Werte erwiesen sich als gleich (in Tagen): 10; 3; fünfzehn; fünfzehn; 22; 7; acht; eines; 19; zwanzig.

Mit Wahrscheinlichkeit erforderlich P = 0,954 Grenzfehler bestimmen Δ Stichprobenmittelwert und Vertrauensgrenzen der durchschnittlichen Berechnungszeit.

Lösung. Der Durchschnittswert wird nach der Formel aus Tabelle berechnet. 9.1 für die Stichprobenpopulation

Die Dispersion wird nach der Formel aus Tabelle berechnet. 9.1.

Der mittlere quadratische Fehler des Tages.

Der Fehler des Mittelwerts wird nach folgender Formel berechnet:

diese. Mittelwert ist x ± m = 12,0 ± 2,3 Tage.

Die Zuverlässigkeit des Mittelwerts war

Der Grenzfehler wird nach der Formel aus Tabelle berechnet. 9.3 für eine Neuauswahl, da die Größe der Grundgesamtheit unbekannt ist, und z P = 0,954 Vertrauensstufe.

Somit ist der Mittelwert `x ± D = `x ± 2m = 12,0 ± 4,6, d.h. ihr wahrer Wert liegt im Bereich von 7,4 bis 16,6 Tagen.

Nutzung des Schülertisches. Die Anwendung lässt den Schluss zu, dass für n = 10 – 1 = 9 Freiheitsgrade der erhaltene Wert zuverlässig ist mit einem Signifikanzniveau a £ 0,001, d.h. der resultierende Mittelwert unterscheidet sich signifikant von 0.

Beispiel 2. Schätzung der Wahrscheinlichkeit (allgemeiner Anteil) r.

Mit einem maschinellen Stichprobenverfahren zur Erhebung des sozialen Status von 1000 Familien wurde aufgedeckt, dass der Anteil einkommensschwacher Familien war w = 0,3 (30 %)(Die Probe war 2% , d.h. n/N = 0,02). Erforderlich mit Konfidenzniveau p = 0,997 einen Indikator definieren R einkommensschwache Familien in der gesamten Region.

Lösung. Gemäß den vorgestellten Funktionswerten Ф(t) für ein gegebenes Konfidenzniveau finden P = 0,997 Bedeutung t=3(siehe Formel 3). Fehler bei geringfügigem Anteil w mit der Formel aus Tabelle bestimmen. 9.3 bei einmaliger Probenahme (mechanische Probenahme ist immer einmalig):

Begrenzung des relativen Abtastfehlers in % wird sein:

Die Wahrscheinlichkeit (allgemeiner Anteil) von Familien mit niedrigem Einkommen in der Region wird sein p=w±Δw, und die Vertrauensgrenzen p werden aufgrund der doppelten Ungleichung berechnet:

w — Δw ≤ p ≤ w — Δw, d.h. der wahre Wert von p liegt innerhalb:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Somit kann mit einer Wahrscheinlichkeit von 0,997 argumentiert werden, dass der Anteil der Familien mit niedrigem Einkommen an allen Familien in der Region zwischen 28,6 % und 31,4 % liegt.

Beispiel 3 Berechnung von Mittelwert und Konfidenzintervall für ein durch eine Intervallreihe vorgegebenes diskretes Merkmal.

Im Tisch. 9.5. die Verteilung von Anträgen auf Erstellung von Aufträgen nach dem Zeitpunkt ihrer Umsetzung durch das Unternehmen wird festgelegt.

Tabelle 9.5 Verteilung der Beobachtungen nach Zeitpunkt des Auftretens

Lösung. Die durchschnittliche Auftragsfertigstellungszeit wird nach folgender Formel berechnet:

Die durchschnittliche Zeit wird sein:

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23,1 Monate

Die gleiche Antwort erhalten wir, wenn wir die Daten zu p i aus der vorletzten Spalte der Tabelle verwenden. 9.5 mit der Formel:

Beachten Sie, dass die Mitte des Intervalls für die letzte Abstufung gefunden wird, indem sie künstlich mit der Breite des Intervalls der vorherigen Abstufung von 60 - 36 = 24 Monaten ergänzt wird.

Die Streuung wird nach der Formel berechnet

wo x ich- die Mitte der Intervallreihe.

Daher!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) und der Standardfehler ist .

Der Fehler des Mittelwerts wird nach der Formel für Monate berechnet, d.h. der Mittelwert ist !!\overline(x) ± m = 23,1 ± 13,4.

Der Grenzfehler wird nach der Formel aus Tabelle berechnet. 9,3 für die Neuauswahl, da die Populationsgröße unbekannt ist, für ein Konfidenzniveau von 0,954:

Der Mittelwert ist also:

diese. sein wahrer Wert liegt im Bereich von 0 bis 50 Monaten.

Beispiel 4 Um die Geschwindigkeit der Abwicklung mit Gläubigern von N = 500 Unternehmen der Gesellschaft in einer Geschäftsbank zu bestimmen, ist es notwendig, eine selektive Studie mit der Methode der zufälligen, nicht wiederholten Auswahl durchzuführen. Bestimmen Sie den erforderlichen Stichprobenumfang n so, dass mit einer Wahrscheinlichkeit P = 0,954 der Fehler des Stichprobenmittelwerts 3 Tage nicht überschreitet, wenn die Versuchsschätzungen ergaben, dass die Standardabweichung s 10 Tage betrug.

Lösung. Um die Anzahl der notwendigen Studien n zu bestimmen, verwenden wir die Formel für nicht-repetitive Auswahl aus Tabelle. 9.4:

Darin wird der Wert von t für das Konfidenzniveau P = 0,954 bestimmt. Es ist gleich 2. Der mittlere quadratische Wert s = 10, die Populationsgröße N = 500 und der marginale Fehler des Mittelwerts Δ x = 3. Setzen wir diese Werte in die Formel ein, erhalten wir:

diese. Es reicht aus, eine Stichprobe von 41 Unternehmen zu erstellen, um den erforderlichen Parameter abzuschätzen - die Geschwindigkeit der Abwicklung mit den Gläubigern.

Auf der Grundlage der gemäß dem statistischen Beobachtungsprogramm registrierten Werte der Merkmale der Stichprobeneinheiten werden verallgemeinernde Stichprobenmerkmale berechnet: Stichprobenmittelwert() und Probe teilen Einheiten, die für Forscher interessante Merkmale aufweisen, in ihrer Gesamtzahl ( w).

Die Differenz zwischen den Indikatoren der Stichprobe und der Allgemeinbevölkerung wird genannt Stichprobenfehler.

Stichprobenfehler werden wie Fehler jeder anderen Art von statistischen Beobachtungen in Registrierungsfehler und Repräsentativitätsfehler unterteilt. Die Hauptaufgabe des Stichprobenverfahrens besteht darin, zufällige Fehler der Repräsentativität zu untersuchen und zu messen.

Stichprobenmittelwert und Stichprobenanteil sind Zufallsvariablen, die unterschiedliche Werte annehmen können, je nachdem, welche Einheiten der Grundgesamtheit in der Stichprobe enthalten sind. Daher sind auch Stichprobenfehler sind Zufallsvariablen und kann unterschiedliche Werte annehmen. Daher wird der Durchschnitt der möglichen Fehler bestimmt.

Durchschnittlicher Stichprobenfehler (µ -mu) ist gleich:

für Mitte ; zum Teilen ,

wo R- der Anteil eines bestimmten Merkmals an der Allgemeinbevölkerung.

In diesen Formeln σ x 2 und R(1-R) sind Merkmale der Allgemeinbevölkerung, die bei der Stichprobenbeobachtung unbekannt sind. In der Praxis werden sie durch ähnliche Merkmale der Stichprobenpopulation auf der Grundlage des Gesetzes der großen Zahl ersetzt, wonach die Stichprobenpopulation bei ausreichend großem Volumen die Merkmale der Allgemeinbevölkerung genau wiedergibt. Methoden zur Berechnung der durchschnittlichen Stichprobenfehler für den Durchschnitt und für den Anteil an wiederholten und nicht wiederholten Auswahlen sind in Tabelle angegeben. 6.1.

Tabelle 6.1.

Formeln zur Berechnung des mittleren Stichprobenfehlers für den Mittelwert und für den Anteil

Der Wert ist immer kleiner als eins, sodass der Wert des durchschnittlichen Stichprobenfehlers bei nicht wiederholter Auswahl kleiner ist als bei wiederholter Auswahl. In Fällen, in denen der Stichprobenanteil unbedeutend ist und der Faktor nahe bei Eins liegt, kann die Korrektur vernachlässigt werden.

Es kann davon ausgegangen werden, dass der allgemeine Durchschnitt des Indikatorwerts oder der allgemeine Anteil die Grenzen des durchschnittlichen Stichprobenfehlers nur mit einer gewissen Wahrscheinlichkeit überschreiten wird. Um den Stichprobenfehler zu charakterisieren, berechnen wir daher zusätzlich zum durchschnittlichen Fehler marginaler Stichprobenfehler(Δ), das sich auf das Wahrscheinlichkeitsniveau bezieht, das dies garantiert.

Wahrscheinlichkeitsniveau ( R) bestimmt den Wert der normalisierten Abweichung ( t), umgekehrt. Werte t sind in normalen Wahrscangegeben. Die am häufigsten verwendeten Kombinationen t und R sind in der Tabelle angegeben. 6.2.


Tabelle 6.2

Standardabweichungswerte t mit den entsprechenden Werten der Wahrscheinlichkeitsstufen R

t 1,0 1,5 2,0 2,5 3,0 3,5
R 0,683 0,866 0,954 0,988 0,997 0,999

t ist ein Konfidenzfaktor, der von der Wahrscheinlichkeit abhängt, mit der garantiert werden kann, dass der Grenzfehler nicht überschritten wird t mal den mittleren Fehler. Sie zeigt an, wie viele durchschnittliche Fehler im Grenzfehler enthalten sind.. Also wenn t= 1, dann kann mit einer Wahrscheinlichkeit von 0,683 argumentiert werden, dass die Differenz zwischen Stichproben- und allgemeinen Indikatoren einen mittleren Fehler nicht überschreiten wird.

Formeln zur Berechnung der marginalen Stichprobenfehler sind in der Tabelle angegeben. 6.3.

Tabelle 6.3.

Formeln zur Berechnung des marginalen Stichprobenfehlers für den Mittelwert und für den Anteil

Nach Berechnung der Randfehler der Stichprobe findet man Konfidenzintervalle für allgemeine Indikatoren. Die Wahrscheinlichkeit, die bei der Berechnung des Fehlers eines Stichprobenmerkmals berücksichtigt wird, wird als Konfidenzniveau bezeichnet. Ein Konfidenzniveau der Wahrscheinlichkeit von 0,95 bedeutet, dass der Fehler nur in 5 von 100 Fällen die festgelegten Grenzen überschreiten kann; Wahrscheinlichkeiten von 0,954 - in 46 Fällen von 1000 und bei 0,999 - in 1 Fall von 1000.

Für den allgemeinen Durchschnitt sehen die wahrscheinlichsten Grenzen, in denen er liegen wird, unter Berücksichtigung des Grenzfehlers der Repräsentativität wie folgt aus:

.

Die wahrscheinlichsten Grenzen, in denen sich der allgemeine Anteil befinden wird, sehen folgendermaßen aus:

.

Von hier, allgemeiner Durchschnitt , allgemeiner Anteil .

In der Tabelle angegeben. 6.3. Formeln werden zur Bestimmung von Stichprobenfehlern verwendet, die durch tatsächliche zufällige und mechanische Methoden durchgeführt werden.

Bei der stratifizierten Auswahl fallen zwangsläufig Vertreter aller Gruppen in die Stichprobe, und zwar in der Regel in den gleichen Anteilen wie in der Allgemeinbevölkerung. Daher hängt der Stichprobenfehler in diesem Fall hauptsächlich vom Durchschnitt der gruppeninternen Varianzen ab. Basierend auf der Regel zum Addieren von Varianzen können wir schlussfolgern, dass der Stichprobenfehler bei einer geschichteten Auswahl immer geringer sein wird als bei einer richtigen Zufallsauswahl.

Bei serieller (verschachtelter) Selektion ist die Streuung zwischen den Gruppen ein Maß für die Fluktuation.

Warum diese Präsentation? Erstens ist „mittlerer quadratischer Stichprobenfehler / Standardfehler“ ein langer und komplizierter Name, der bei Problemen oft auf „mittlerer“ oder „Standardfehler“ verkürzt wird. Dass das dasselbe ist, war damals eine echte Entdeckung für mich. Dieser notorische Fehler kann unterschiedlich sein und wird immer unterschiedlich geschrieben, was sehr verwirrend ist. Es stellt sich heraus, dass dieses Ding an vielen Orten vorkommt, aber es ändert ständig sein Aussehen. Aus diesem Grund packen wir eine ganze Reihe von Formeln, wenn Sie mit einer oder zwei auskommen können.

Wie wird es bezeichnet? Sobald sie die Unglücklichen nicht schikanieren! Dies sind Optionen, um den Standardfehler für den Mittelwert in Vorlesungen und Lehrbüchern zu schreiben. Sie verspotteten den Anteilsfehler auf die gleiche Weise oder vergaßen sogar dessen Existenz und schrieben ihn gleich mit einer Formel auf, was die unglücklichen Studenten sehr verwirrte. Hier werde ich ihn mit „ε“ bezeichnen, denn, Gott sei Dank, dies ist ein seltener Buchstabe, und er kann weder mit dem Moment noch mit dem selektiven COEX verwechselt werden.

Eigentlich ist die Formel (die Wurzel der Varianz durch die Anzahl der Elemente in der Stichprobe oder RMS geteilt durch die Wurzel der Stichprobengröße) Dies ist die Hauptformel, die Grundlage, die Grundlage der Grundlagen. Es reicht aus, nur es zu lernen und dann einfach mit dem Kopf zu arbeiten! Wie? Weiter lesen!

Sorten und Herkunft 1. Für eine Aktie. Die Varianz der Aktie gilt als ungewöhnlich. Wenn wir den Anteil des untersuchten Merkmals als p und den Anteil „alles anderen“ als q nehmen, dann ist die Varianz gleich p*q oder p*(1 p). Daraus entstand die Formel:

Sorten und Herkunft (2) 2. Wo bekomme ich den allgemeinen RMS? σ ist in der Tat die allgemeine Standardabweichung, die Sie in der Feigenaufgabe erhalten. Es gibt einen Ausweg – die Stichprobenvarianz S 2 , die bekanntlich verzerrt ist. Daher bewerten wir den allgemeinen wie folgt: (damit er nicht einmal an eine Verschiebung denkt) und ersetzen ihn. Und das kann man sofort mögen: Aber so einen Chip gibt es doch. Wenn n>30 ist, ist der Unterschied zwischen S und σ extrem klein ©, sodass Sie schummeln und einfacher schreiben können:

Sorten und ihre Herkunft (3) „Woher kommen einige andere Klammern und Enki? ? ? » Es gibt 2 Sampling-Methoden, erinnerst du dich? - wiederholt und nicht wiederholt. Alle bisherigen Formeln eignen sich also zum Resampling oder wenn die Stichprobe n im Verhältnis zur Grundgesamtheit N so klein ist, dass das Verhältnis n/N vernachlässigt werden kann. Wenn es direkt wichtig ist, dass die Stichprobe nicht wiederholt wird, oder wenn das Problem im Klartext angibt, wie viele Einheiten in der Allgemeinbevölkerung vorhanden sind, muss es unbedingt verwendet werden.

Theorie der Statistik: Vorlesungsunterlagen Burkhanova Inessa Viktorovna

3. Stichprobenfehler

3. Stichprobenfehler

Jede Einheit in einer Stichprobenbeobachtung sollte die gleiche Chance haben, mit den anderen ausgewählt zu werden – dies ist die Grundlage einer Zufallsstichprobe.

Selbststichprobe - dies ist die Auswahl von Einheiten aus der gesamten allgemeinen Bevölkerung durch Lotterie oder auf andere ähnliche Weise.

Das Zufallsprinzip besagt, dass die Aufnahme oder der Ausschluss eines Objekts aus der Stichprobe durch keinen anderen Faktor als den Zufall beeinflusst werden kann.

Probe teilen ist das Verhältnis der Anzahl der Einheiten in der Stichprobe zur Anzahl der Einheiten in der Allgemeinbevölkerung:

Die Selbst-Random-Selektion in ihrer reinen Form ist die erste unter allen anderen Selektionsarten, sie enthält und verwirklicht die Grundprinzipien der selektiven statistischen Beobachtung.

Die zwei Haupttypen von verallgemeinernden Indikatoren, die bei der Stichprobenmethode verwendet werden, sind der Durchschnittswert eines quantitativen Attributs und der relative Wert eines alternativen Attributs.

Der Stichprobenanteil (w) oder die Besonderheit wird durch das Verhältnis der Anzahl der Einheiten bestimmt, die das untersuchte Merkmal aufweisen m, auf die Gesamtzahl der Probenahmeeinheiten (n):

Um die Zuverlässigkeit von Stichprobenindikatoren zu charakterisieren, werden die durchschnittlichen und marginalen Fehler der Stichprobe unterschieden.

Der Stichprobenfehler, auch Repräsentativitätsfehler genannt, ist die Differenz zwischen der entsprechenden Stichprobe und allgemeinen Merkmalen:

?x = | x - x |;

?w =|х – p|.

Nur Stichprobenbeobachtungen weisen einen Stichprobenfehler auf

Stichprobenmittelwert und Stichprobenanteil- Dies sind Zufallsvariablen, die je nach den Einheiten der untersuchten statistischen Grundgesamtheit, die in die Stichprobe aufgenommen wurden, unterschiedliche Werte annehmen. Dementsprechend sind auch Stichprobenfehler Zufallsvariablen und können auch unterschiedliche Werte annehmen. Daher wird der Durchschnitt der möglichen Fehler bestimmt - der durchschnittliche Stichprobenfehler.

Der durchschnittliche Stichprobenfehler wird durch den Stichprobenumfang bestimmt: Je größer die Grundgesamtheit ist, desto kleiner ist der durchschnittliche Stichprobenfehler. Indem wir eine Stichprobenerhebung mit einer zunehmenden Anzahl von Einheiten der Allgemeinbevölkerung abdecken, charakterisieren wir die Gesamtbevölkerung immer genauer.

Der durchschnittliche Stichprobenfehler hängt vom Variationsgrad des untersuchten Merkmals ab, der Variationsgrad wiederum ist durch Varianz gekennzeichnet? 2 oder w(l - w)- für ein alternatives Zeichen. Je kleiner die Merkmalsvarianz und -varianz ist, desto kleiner ist der mittlere Stichprobenfehler und umgekehrt.

Für zufälliges Resampling werden mittlere Fehler theoretisch mit den folgenden Formeln berechnet:

1) für das durchschnittliche quantitative Merkmal:

wo? 2 - der Durchschnittswert der Streuung eines quantitativen Merkmals.

2) für eine Aktie (Alternativzeichen):

Wie ist also die Varianz des Merkmals in der Population? 2 nicht genau bekannt ist, verwendet man in der Praxis den für die Stichprobengesamtheit berechneten Wert der Varianz S 2 nach dem Gesetz der großen Zahl, wonach die Stichprobengesamtheit bei ausreichend großem Stichprobenumfang die Merkmale der Allgemeinbevölkerung genau wiedergibt .

Die Formeln für den mittleren Stichprobenfehler für zufälliges Resampling lauten wie folgt. Für den Durchschnittswert eines quantitativen Merkmals: Die allgemeine Varianz wird durch das Wahlfach durch das folgende Verhältnis ausgedrückt:

wobei S 2 der Dispersionswert ist.

Mechanische Probenahme- dies ist die Auswahl von Einheiten in einer Stichprobe aus dem Allgemeinen, die nach einem neutralen Kriterium in gleiche Gruppen eingeteilt wird; wird so durchgeführt, dass nur eine Einheit aus jeder solchen Gruppe in der Stichprobe ausgewählt wird.

Bei der mechanischen Auswahl werden die Einheiten der untersuchten statistischen Grundgesamtheit vorläufig in einer bestimmten Reihenfolge angeordnet, wonach eine bestimmte Anzahl von Einheiten in einem bestimmten Intervall mechanisch ausgewählt wird. In diesem Fall ist die Größe des Intervalls in der Allgemeinbevölkerung gleich dem Kehrwert des Stichprobenanteils.

Da die mechanische Auswahl bei ausreichend großer Grundgesamtheit hinsichtlich der Genauigkeit der Ergebnisse nahe an der Zufallsauswahl liegt, werden zur Bestimmung des mittleren Fehlers der mechanischen Stichprobe die Formeln der zufälligen, nicht wiederholten Stichprobe verwendet.

Um Einheiten aus einer heterogenen Bevölkerung auszuwählen, wird die sogenannte typische Stichprobe verwendet. Sie wird verwendet, wenn alle Einheiten der Allgemeinbevölkerung gemäß den Merkmalen, von denen die untersuchten Indikatoren abhängen, in mehrere qualitativ homogene, ähnliche Gruppen unterteilt werden können.

Dann wird aus jeder typischen Gruppe eine individuelle Auswahl von Einheiten in die Stichprobe durch eine Zufalls- oder mechanische Stichprobe getroffen.

Bei der Untersuchung komplexer statistischer Grundgesamtheiten wird normalerweise eine typische Stichprobenziehung verwendet.

Eine typische Probenahme liefert genauere Ergebnisse. Die Typisierung der Allgemeinbevölkerung gewährleistet die Repräsentativität einer solchen Stichprobe, die Repräsentation jeder typologischen Gruppe darin, wodurch der Einfluss der Intergruppenvarianz auf den durchschnittlichen Stichprobenfehler ausgeschlossen werden kann. Bei der Bestimmung des durchschnittlichen Fehlers einer typischen Stichprobe dient daher der Durchschnitt der gruppeninternen Varianzen als Streuungsindikator.

Bei der seriellen Probenahme handelt es sich um eine zufällige Auswahl aus einer Grundgesamtheit gleichgroßer Gruppen, um in solchen Gruppen ausnahmslos alle Einheiten einer Beobachtung zu unterziehen.

Da alle Einheiten ausnahmslos innerhalb von Gruppen (Serien) untersucht werden, hängt der durchschnittliche Stichprobenfehler (bei Auswahl gleicher Serien) nur von der Varianz zwischen den Gruppen (Interserien) ab.

Aus dem Buch Persönliches Budget. Geld im Griff Autor Makarov Sergej Wladimirowitsch

Fehler eines Bewohners Sie können auf verschiedene Weise mit Fehlern umgehen: Sie können Angst haben, sie zu machen und sich über jeden einzelnen Sorgen machen, Sie können sich über Ihre Fehler und Krisen als Wegweiser auf dem Weg zum Erfolg und persönlichen Sieg freuen. Nur eines ist bei Fehlern unveränderlich – man muss dafür bezahlen.

Aus dem Buch Handbuch Interne Revision. Risiken und Geschäftsprozesse der Autor Kryshkin Oleg

Stichprobenziehung Das Stichprobenverfahren ist ein wesentlicher Schritt in einem internen Revisionsprojekt. Es wird in verschiedenen Quellen zum Thema Wirtschaftsprüfung ausführlich beschrieben. Solche Beschreibungen sind jedoch weitgehend akademischer Natur. Ich schlage vor, mich auf diese zu konzentrieren

Aus dem Buch Psychologie der Geldanlage [Wie man aufhört, dumme Sachen mit seinem Geld zu machen] Autor Richard Carl

Anlagefehler sind Anlegerfehler Heute bin ich mehr denn je davon überzeugt, dass alle Anlagefehler tatsächlich Anlegerfehler sind. Im Gegensatz zu Anlegern ist Investieren eine Entscheidung. Es geht darum

Autor Schtscherbina Lidia Wladimirowna

29. Bestimmung des erforderlichen Stichprobenumfangs Einer der wissenschaftlichen Grundsätze in der Theorie des Stichprobenverfahrens stellt die Sicherstellung einer ausreichenden Anzahl ausgewählter Einheiten dar. Eine Verringerung des Standardfehlers der Stichprobe ist immer mit einer Erhöhung des Stichprobenumfangs verbunden. Berechnung

Aus dem Buch Allgemeine Theorie der Statistik Autor Schtscherbina Lidia Wladimirowna

30. Auswahlverfahren und Arten der Probenahme. Richtige Stichprobenziehung In der Theorie des Stichprobenverfahrens wurden verschiedene Auswahlverfahren und Arten der Stichprobenziehung entwickelt, um die Repräsentativität zu gewährleisten. Unter dem Auswahlverfahren versteht man das Verfahren zur Auswahl von Einheiten aus der Allgemeinbevölkerung.

Aus dem Buch Allgemeine Theorie der Statistik Autor Schtscherbina Lidia Wladimirowna

31. Mechanische und typische Probenahme Bei einer rein mechanischen Probenahme muss die gesamte Grundgesamtheit von Einheiten zunächst in Form einer Liste von Auswahleinheiten präsentiert werden, die in einer neutralen Reihenfolge in Bezug auf das untersuchte Merkmal zusammengestellt wurde. Dann die Liste

Aus dem Buch Allgemeine Theorie der Statistik Autor Schtscherbina Lidia Wladimirowna

32. Serien- und Verbundbeprobung Die serielle (verschachtelte) Beprobung ist eine Form der Stichprobenbildung, bei der nicht die zu erhebenden Einheiten, sondern Gruppen von Einheiten (Serien, Nester) zufällig ausgewählt werden. Innerhalb ausgewählter Serien (Nester)

Aus dem Buch Allgemeine Theorie der Statistik Autor Schtscherbina Lidia Wladimirowna

33. Mehrstufige, mehrphasige und sich gegenseitig durchdringende Probenahme. Ein Merkmal einer mehrstufigen Probe besteht darin, dass die Probe gemäß den Auswahlschritten allmählich gebildet wird. In der ersten Phase unter Verwendung einer vorgegebenen Methode und Art der Auswahl

Autor Konik Nina Wladimirowna

3. Bestimmung des erforderlichen Stichprobenumfangs Einer der wissenschaftlichen Grundsätze der Stichprobentheorie besteht darin, sicherzustellen, dass eine ausreichende Anzahl von Einheiten ausgewählt wird. Theoretisch zeigt sich die Notwendigkeit, dieses Prinzip zu beachten, in den Beweisen der Grenzwertsätze

Aus dem Buch Allgemeine Theorie der Statistik: Vorlesungsskript Autor Konik Nina Wladimirowna

4. Auswahlverfahren und Stichprobenarten In der Theorie des Stichprobenverfahrens wurden verschiedene Auswahlverfahren und Stichprobenarten entwickelt, um die Repräsentativität zu gewährleisten. Unter dem Auswahlverfahren versteht man das Verfahren zur Auswahl von Einheiten aus der Allgemeinbevölkerung. Es gibt zwei Auswahlmethoden: wiederholt

Aus dem Buch Theorie der Statistik Autor Burchanowa Inessa Wiktorowna

36. Stichprobenfehler Selbststichprobe ist die Auswahl von Einheiten aus der Gesamtpopulation durch Los oder auf ähnliche Weise. Das Zufallsprinzip besagt, dass der Einschluss oder Ausschluss eines Objekts aus der Stichprobe durch keinen Faktor beeinflusst werden kann,

Aus dem Buch Geschäftskorrespondenz: Studienführer Autor Kirsanowa Maria Wladimirowna

Lexikalische Fehler 1. Falsche Verwendung von Wörtern und Begriffen Die meisten Fehler in Geschäftsbriefen sind lexikalischer Natur. Mangelnde Alphabetisierung führt nicht nur zu kuriosem Unsinn, sondern auch zu Absurditäten: Separate Begriffe und Fachjargon

Aus dem Buch New Era – Old Anxieties: Political Economy Autor Yasin Evgeny Grigorievich

5 Unsere Fehler Wir bestehen darauf, dass der eingeschlagene Kurs der Marktreformen richtig war. Und sie sind überhaupt nicht gescheitert, sie sind nur wieder gestolpert. Aber es gab Fehler und Auslassungen. Das sind sowohl unsere Fehler als auch die Fehler der Führung des Landes, die wir nicht verhindert haben. Fehler - in vielerlei Hinsicht

Autor Curtis Face

Die Bedeutung der Stichprobengröße Wie ich bereits sagte, neigen Menschen dazu, sich zu sehr auf seltene Vorkommnisse eines Phänomens zu konzentrieren, obwohl es statistisch nicht möglich ist, viele Informationen aus wenigen Vorkommnissen zu extrahieren. Dies ist der Hauptgrund

Aus dem Buch Weg der Schildkröten. Von Amateuren bis zu legendären Händlern Autor Curtis Face

Repräsentative Stichproben Die Repräsentativität unserer Tests zur Vorhersage der Zukunft wird durch zwei Faktoren bestimmt: – Anzahl der Märkte: Tests, die in verschiedenen Märkten durchgeführt werden, umfassen höchstwahrscheinlich Märkte mit unterschiedlichem Grad an Volatilität

Aus dem Buch Weg der Schildkröten. Von Amateuren bis zu legendären Händlern Autor Curtis Face

Stichprobengröße Das Konzept der Stichprobengröße ist einfach: Um statistisch gültige Schlussfolgerungen ziehen zu können, benötigen Sie eine ausreichend große Stichprobe. Je kleiner die Stichprobe, desto grober die Schlussfolgerungen, die gezogen werden können; Je größer die Stichprobe, desto besser die Schlussfolgerungen. Es gibt kein

Es stellt eine solche Diskrepanz zwischen den Durchschnittswerten der Stichprobe und der Allgemeinbevölkerung dar, die ± b (Delta) nicht überschreitet.

Basierend Die Sätze von P. L. Chebyshev mittlerer Fehlerwert im Falle einer zufälligen Neuauswahl wird sie nach folgender Formel berechnet (für ein durchschnittliches quantitatives Merkmal):

wobei der Zähler die Varianz des Merkmals x in der Stichprobe ist;
n ist die Größe der Stichprobe.

Als alternatives Merkmal die Formel für den mittleren Stichprobenfehler für den Anteil nach dem Satz von J. Bernoulli berechnet nach der Formel:

wobei p(1 - p) die Varianz des Anteils des Attributs an der Allgemeinbevölkerung ist;
n - Stichprobengröße.

Da die Varianz des Merkmals in der Allgemeinbevölkerung nicht genau bekannt ist, wird in der Praxis der Varianzwert verwendet, der für die Grundgesamtheit berechnet wird Gesetz der großen Zahlen. Gemäß diesem Gesetz reproduziert die Stichprobe bei einem großen Stichprobenumfang genau die Merkmale der Allgemeinbevölkerung.

Daher die Berechnungsformeln mittlerer Fehler beim zufälligen Resampling wird so aussehen:

1. Für ein durchschnittliches quantitatives Merkmal:

wobei S^2 die Varianz des Merkmals x in der Stichprobe ist;
n - Stichprobengröße.

wobei w (1 - w) die Varianz des Anteils des untersuchten Merkmals in der Stichprobenpopulation ist.

In der Wahrscheinlichkeitstheorie wurde gezeigt, dass sie sich durch die Stichprobe nach der Formel ausdrückt:

In Fällen kleine Probe, wenn sein Volumen weniger als 30 beträgt, muss der Koeffizient n/(n-1) berücksichtigt werden. Dann wird der durchschnittliche Fehler einer kleinen Stichprobe nach folgender Formel berechnet:

Da die Anzahl der Einheiten der Allgemeinbevölkerung bei der nicht wiederholten Stichprobenziehung reduziert wird, muss in den obigen Formeln zur Berechnung der durchschnittlichen Stichprobenfehler der Wurzelausdruck mit 1- (n / N) multipliziert werden.

Die Berechnungsformeln für diese Art von Probe sehen wie folgt aus:

1. Für das durchschnittliche quantitative Merkmal:

wobei N das Volumen der allgemeinen Bevölkerung ist; n - Stichprobengröße.

2. Für eine Aktie (Alternativfunktion):

wobei 1- (n/N) der Anteil der Einheiten in der Allgemeinbevölkerung ist, die nicht in die Stichprobe aufgenommen wurden.

Da n immer kleiner als N ist, wird der zusätzliche Faktor 1 – (n/N) immer kleiner als eins sein. Das bedeutet, dass der durchschnittliche Fehler bei nicht wiederholter Auswahl immer geringer ist als bei wiederholter Auswahl. Wenn der Anteil der Einheiten der Allgemeinbevölkerung, die nicht in die Stichprobe aufgenommen wurden, signifikant ist, liegt der Wert von 1 - (n / N) nahe bei eins, und dann wird der durchschnittliche Fehler gemäß der allgemeinen Formel berechnet.

Der durchschnittliche Fehler hängt von folgenden Faktoren ab:

1. Bei Erfüllung des Zufallsprinzips wird der durchschnittliche Stichprobenfehler zum einen durch den Stichprobenumfang bestimmt: Je größer die Zahl, desto kleiner die Werte mittlerer Stichprobenfehler. Die Allgemeinbevölkerung wird genauer charakterisiert, wenn mehr Einheiten dieser Bevölkerung die Stichprobenbeobachtung abdecken

2. Der durchschnittliche Fehler hängt auch vom Grad der Merkmalsvariation ab. Der Variationsgrad ist gekennzeichnet durch . Je kleiner die Merkmalsvariation (Streuung) ist, desto kleiner ist der durchschnittliche Stichprobenfehler. Bei einer Varianz von null (das Attribut variiert nicht) ist der durchschnittliche Stichprobenfehler null, sodass jede Einheit der Allgemeinbevölkerung die gesamte Bevölkerung gemäß diesem Attribut charakterisiert.



Error: Inhalt ist geschützt!!