Varianz berechnen. Berechnung der Gruppen-, Intergruppen- und Gesamtvarianz (nach der Regel der Addition von Varianzen)

Auf dieser Seite wird ein Standardbeispiel zum Ermitteln der Varianz beschrieben. Sie können sich auch andere Probleme zum Ermitteln der Varianz ansehen

Beispiel 1. Bestimmung von Gruppe, Gruppendurchschnitt, Intergruppen- und Gesamtvarianz

Beispiel 2. Ermitteln der Varianz und des Variationskoeffizienten in einer Gruppierungstabelle

Beispiel 3. Ermitteln der Varianz in diskrete Reihe

Beispiel 4. Die folgenden Daten liegen für eine Gruppe von 20 Fernstudenten vor. Es ist notwendig, eine Intervallreihe der Verteilung des Merkmals zu erstellen, den Durchschnittswert des Merkmals zu berechnen und seine Streuung zu untersuchen

Lassen Sie uns eine Intervallgruppierung erstellen. Bestimmen wir den Bereich des Intervalls anhand der Formel:

wobei X max der Maximalwert des Gruppierungsmerkmals ist;
X min – Mindestwert des Gruppierungsmerkmals;
n – Anzahl der Intervalle:

Wir akzeptieren n=5. Der Schritt ist: h = (192 - 159)/ 5 = 6,6

Lassen Sie uns eine Intervallgruppierung erstellen

Für weitere Berechnungen erstellen wir eine Hilfstabelle:

X"i – die Mitte des Intervalls. (zum Beispiel die Mitte des Intervalls 159 – 165,6 = 162,3)

Wir ermitteln die durchschnittliche Körpergröße der Schüler anhand der gewichteten arithmetischen Durchschnittsformel:

Bestimmen wir die Varianz mit der Formel:

Die Formel lässt sich wie folgt umwandeln:

Aus dieser Formel folgt das Varianz ist gleich die Differenz zwischen dem Durchschnitt der Quadrate der Optionen und dem Quadrat und dem Durchschnitt.

Varianz in Variationsreihe Mit in gleichen Abständen nach der Momentenmethode kann unter Verwendung der zweiten Eigenschaft der Streuung (Dividieren aller Optionen durch den Wert des Intervalls) wie folgt berechnet werden. Varianz bestimmen, berechnet nach der Momentenmethode, ist die Verwendung der folgenden Formel weniger arbeitsintensiv:

wobei i der Wert des Intervalls ist;
A ist eine konventionelle Nullstelle, für die es zweckmäßig ist, die Mitte des Intervalls mit der höchsten Frequenz zu verwenden;
m1 ist das Quadrat des Moments erster Ordnung;
m2 - Moment zweiter Ordnung

Alternative Merkmalsvarianz (Ändert sich in einer statistischen Grundgesamtheit ein Merkmal so, dass es nur zwei sich gegenseitig ausschließende Optionen gibt, dann nennt man diese Variabilität Alternative) lässt sich nach folgender Formel berechnen:

Wenn wir q = 1- p in diese Dispersionsformel einsetzen, erhalten wir:

Arten der Varianz

Gesamtvarianz misst die Variation eines Merkmals in der gesamten Population unter dem Einfluss aller Faktoren, die diese Variation verursachen. Sie entspricht dem mittleren Quadrat der Abweichungen einzelner Werte eines Merkmals x vom Gesamtmittelwert von x und kann als einfache Varianz oder gewichtete Varianz definiert werden.

Varianz innerhalb der Gruppe charakterisiert zufällige Variation, d.h. Teil der Variation, der auf den Einfluss nicht berücksichtigter Faktoren zurückzuführen ist und nicht von dem Faktorattribut abhängt, das die Grundlage der Gruppe bildet. Eine solche Streuung entspricht dem mittleren Quadrat der Abweichungen einzelner Werte des Attributs innerhalb der Gruppe X vom arithmetischen Mittel der Gruppe und kann als einfache Streuung oder als gewichtete Streuung berechnet werden.



Daher, Varianzmaße innerhalb der Gruppe Variation eines Merkmals innerhalb einer Gruppe und wird durch die Formel bestimmt:

wobei xi der Gruppendurchschnitt ist;
ni ist die Anzahl der Einheiten in der Gruppe.

Zum Beispiel, Varianzen innerhalb der Gruppe, die bei der Untersuchung des Einflusses der Qualifikationen der Arbeitnehmer auf das Niveau der Arbeitsproduktivität in der Werkstatt ermittelt werden müssen, zeigen in jeder Gruppe Schwankungen im Output, die durch alle möglichen Faktoren verursacht werden ( technischer Zustand Ausrüstung, Verfügbarkeit von Werkzeugen und Materialien, Alter der Arbeiter, Arbeitsintensität usw.), mit Ausnahme von Unterschieden in der Qualifikationskategorie (innerhalb einer Gruppe haben alle Arbeiter die gleichen Qualifikationen).

Streuung in der Statistik ergibt sich als Einzelwerte des Merkmals im Quadrat aus . Abhängig von den Ausgangsdaten wird sie anhand der einfachen und gewichteten Varianzformeln ermittelt:

1. (für nicht gruppierte Daten) wird nach folgender Formel berechnet:

2. Gewichtete Varianz (für Variationsreihen):

wobei n die Häufigkeit ist (Wiederholbarkeit des Faktors X)

Ein Beispiel für die Ermittlung von Varianz

Auf dieser Seite wird ein Standardbeispiel zum Ermitteln der Varianz beschrieben. Sie können sich auch andere Probleme zum Ermitteln der Varianz ansehen

Beispiel 1. Die folgenden Daten liegen für eine Gruppe von 20 Fernstudenten vor. Es ist notwendig, eine Intervallreihe der Verteilung des Merkmals zu erstellen, den Durchschnittswert des Merkmals zu berechnen und seine Streuung zu untersuchen

Lassen Sie uns eine Intervallgruppierung erstellen. Bestimmen wir den Bereich des Intervalls anhand der Formel:

wobei X max der Maximalwert des Gruppierungsmerkmals ist;
X min – Mindestwert des Gruppierungsmerkmals;
n – Anzahl der Intervalle:

Wir akzeptieren n=5. Der Schritt ist: h = (192 - 159)/ 5 = 6,6

Lassen Sie uns eine Intervallgruppierung erstellen

Für weitere Berechnungen erstellen wir eine Hilfstabelle:

X'i ist die Mitte des Intervalls. (zum Beispiel die Mitte des Intervalls 159 – 165,6 = 162,3)

Wir ermitteln die durchschnittliche Körpergröße der Schüler anhand der gewichteten arithmetischen Durchschnittsformel:

Bestimmen wir die Varianz mit der Formel:

Die Dispersionsformel lässt sich wie folgt umwandeln:

Aus dieser Formel folgt das Varianz ist gleich die Differenz zwischen dem Durchschnitt der Quadrate der Optionen und dem Quadrat und dem Durchschnitt.

Streuung in Variationsreihen mit gleichen Intervallen unter Verwendung der Momentenmethode kann auf folgende Weise unter Verwendung der zweiten Eigenschaft der Dispersion (Dividieren aller Optionen durch den Wert des Intervalls) berechnet werden. Varianz bestimmen, berechnet nach der Momentenmethode, ist die Verwendung der folgenden Formel weniger arbeitsintensiv:

wobei i der Wert des Intervalls ist;
A ist eine konventionelle Nullstelle, für die es zweckmäßig ist, die Mitte des Intervalls mit der höchsten Frequenz zu verwenden;
m1 ist das Quadrat des Moments erster Ordnung;
m2 - Moment zweiter Ordnung

(Ändert sich in einer statistischen Grundgesamtheit ein Merkmal so, dass es nur zwei sich gegenseitig ausschließende Optionen gibt, dann nennt man diese Variabilität Alternative) lässt sich nach folgender Formel berechnen:

Wenn wir q = 1- p in diese Dispersionsformel einsetzen, erhalten wir:

Arten von Varianz

Gesamtvarianz misst die Variation eines Merkmals in der gesamten Population unter dem Einfluss aller Faktoren, die diese Variation verursachen. Sie entspricht dem mittleren Quadrat der Abweichungen einzelner Werte eines Merkmals x vom Gesamtmittelwert von x und kann als einfache Varianz oder gewichtete Varianz definiert werden.

charakterisiert zufällige Variation, d.h. Teil der Variation, der auf den Einfluss nicht berücksichtigter Faktoren zurückzuführen ist und nicht von dem Faktorattribut abhängt, das die Grundlage der Gruppe bildet. Eine solche Streuung entspricht dem mittleren Quadrat der Abweichungen einzelner Werte des Attributs innerhalb der Gruppe X vom arithmetischen Mittel der Gruppe und kann als einfache Streuung oder als gewichtete Streuung berechnet werden.

Daher, Varianzmaße innerhalb der Gruppe Variation eines Merkmals innerhalb einer Gruppe und wird durch die Formel bestimmt:

wobei xi der Gruppendurchschnitt ist;
ni ist die Anzahl der Einheiten in der Gruppe.

Beispielsweise zeigen gruppeninterne Varianzen, die bei der Untersuchung des Einflusses der Qualifikationen der Arbeitnehmer auf das Niveau der Arbeitsproduktivität in einer Werkstatt ermittelt werden müssen, Schwankungen im Output in jeder Gruppe, die durch alle möglichen Faktoren (technischer Zustand der Ausrüstung, Verfügbarkeit von …) verursacht werden Werkzeuge und Materialien, Alter der Arbeiter, Arbeitsintensität usw.), mit Ausnahme von Unterschieden in der Qualifikationskategorie (innerhalb einer Gruppe haben alle Arbeiter die gleichen Qualifikationen).

Der Durchschnitt der Varianzen innerhalb der Gruppe spiegelt den Zufall wider, d. h. den Teil der Varianz, der unter dem Einfluss aller anderen Faktoren mit Ausnahme des Gruppierungsfaktors auftrat. Die Berechnung erfolgt nach folgender Formel:

Charakterisiert die systematische Variation des resultierenden Merkmals, die auf den Einfluss des Faktorzeichens zurückzuführen ist, das der Gruppe zugrunde liegt. Er entspricht dem mittleren Quadrat der Abweichungen der Gruppenmittelwerte vom Gesamtmittelwert. Die Intergruppenvarianz wird nach folgender Formel berechnet:

Die Regel zum Hinzufügen von Varianz in Statistiken

Entsprechend Regel der Addition von Varianzen Gesamtvarianz gleich der Summe des Durchschnitts der gruppeninternen und gruppenübergreifenden Varianzen:

Die Bedeutung dieser Regel ist, dass die Gesamtvarianz, die unter dem Einfluss aller Faktoren entsteht, gleich der Summe der Varianzen ist, die unter dem Einfluss aller anderen Faktoren entstehen, und der Varianz, die aufgrund des Gruppierungsfaktors entsteht.

Mit der Formel zur Addition von Varianzen können Sie aus zwei bekannten Varianzen die dritte unbekannte Varianz ermitteln und zudem die Stärke des Einflusses des Gruppierungsmerkmals beurteilen.

Dispersionseigenschaften

1. Wenn alle Werte eines Merkmals um den gleichen konstanten Betrag verringert (erhöht) werden, ändert sich die Streuung nicht.
2. Wenn alle Werte eines Merkmals um das gleiche n-fache reduziert (erhöht) werden, dann nimmt die Varianz entsprechend um das n^2-fache ab (erhöht).

Unter Streuung versteht man in der Statistik die Standardabweichung einzelner Werte eines Merkmals im Quadrat vom arithmetischen Mittel. Eine gängige Methode zur Berechnung der quadrierten Abweichungen von Optionen vom Durchschnitt und deren anschließender Mittelung.

In der wirtschaftsstatistischen Analyse ist es üblich, die Variation eines Merkmals am häufigsten anhand der Standardabweichung zu bewerten. Dies ist die Quadratwurzel der Varianz.

(3)

Charakterisiert die absolute Schwankung der Werte eines variierenden Merkmals und wird in denselben Maßeinheiten wie die Optionen ausgedrückt. In der Statistik besteht häufig die Notwendigkeit, die Variation verschiedener Merkmale zu vergleichen. Für solche Vergleiche wird ein relatives Variationsmaß, der Variationskoeffizient, verwendet.

Dispersionseigenschaften:

1) Wenn Sie eine beliebige Zahl von allen Optionen subtrahieren, ändert sich die Varianz nicht.

2) Wenn alle Werte der Option durch eine beliebige Zahl b geteilt werden, verringert sich die Varianz um das b^2-fache, d. h.

3) Wenn Sie das durchschnittliche Quadrat der Abweichungen von einer Zahl mit ungleichem arithmetischen Mittel berechnen, ist es größer als die Varianz. Gleichzeitig um einen genau definierten Wert pro Quadrat der Differenz zwischen dem Durchschnittswert c.

Die Streuung kann als Differenz zwischen dem Mittelwert im Quadrat und dem Mittelwert im Quadrat definiert werden.

17. Gruppen- und Intergruppenvariationen. Varianzadditionsregel

Wenn eine statistische Grundgesamtheit entsprechend dem untersuchten Merkmal in Gruppen oder Teile unterteilt wird, können für eine solche Grundgesamtheit die folgenden Arten der Streuung berechnet werden: Gruppe (privat), Gruppendurchschnitt (privat) und Intergruppen.

Gesamtvarianz– spiegelt die Variation eines Merkmals aufgrund aller Bedingungen und Ursachen wider, die in einer bestimmten statistischen Grundgesamtheit wirken.

Gruppenvarianz- gleich dem mittleren Quadrat der Abweichungen einzelner Werte eines Merkmals innerhalb einer Gruppe vom arithmetischen Mittel dieser Gruppe, dem sogenannten Gruppenmittelwert. Allerdings stimmt der Gruppendurchschnitt nicht mit dem Gesamtdurchschnitt der Gesamtbevölkerung überein.

Die Gruppenvarianz spiegelt die Variation eines Merkmals wider, die ausschließlich auf Bedingungen und Ursachen zurückzuführen ist, die innerhalb der Gruppe wirken.

Durchschnitt der Gruppenvarianzen- ist definiert als das gewichtete arithmetische Mittel der Gruppenvarianzen, wobei die Gewichte die Gruppenvolumina sind.

Intergruppenvarianz- gleich dem mittleren Quadrat der Abweichungen der Gruppendurchschnitte vom Gesamtdurchschnitt.

Die Streuung zwischen Gruppen charakterisiert die Variation des effektiven Merkmals aufgrund des Gruppierungsmerkmals.

Es besteht ein gewisser Zusammenhang zwischen den betrachteten Streuungsarten: Die Gesamtstreuung ist gleich der Summe der durchschnittlichen Gruppenstreuung und der Streuung zwischen den Gruppen.

Diese Beziehung wird als Varianzadditionsregel bezeichnet.

18. Dynamische Reihe und ihre Komponenten. Arten von Zeitreihen.

Zeile in der Statistik- Hierbei handelt es sich um digitale Daten, die zeitliche oder räumliche Veränderungen eines Phänomens zeigen und einen statistischen Vergleich von Phänomenen sowohl im Verlauf ihrer zeitlichen als auch zeitlichen Entwicklung ermöglichen verschiedene Formen und Arten von Prozessen. Dadurch ist es möglich, die gegenseitige Abhängigkeit von Phänomenen zu erkennen.

In der Statistik wird der Entwicklungsprozess der Bewegung sozialer Phänomene im Laufe der Zeit üblicherweise als Dynamik bezeichnet. Zur Darstellung der Dynamik werden Dynamikreihen (chronologisch, zeitlich) konstruiert, bei denen es sich um Reihen zeitlich variierender Werte eines statistischen Indikators (zum Beispiel die Zahl der Verurteilten über 10 Jahre) handelt, die in chronologischer Reihenfolge angeordnet sind. Ihre konstituierenden Elemente sind die digitalen Werte eines bestimmten Indikators und die Zeiträume oder Zeitpunkte, auf die sie sich beziehen.

Das wichtigste Merkmal der Dynamikreihe- ihre Größe (Volumen, Ausmaß) eines bestimmten Phänomens, das in einem bestimmten Zeitraum oder zu einem bestimmten Zeitpunkt erreicht wird. Dementsprechend ist die Größe der Terme der Dynamikreihe ihr Niveau. Unterscheiden Anfangs-, Mittel- und Endniveau der dynamischen Reihe. Einstiegsniveau zeigt den Wert des ersten, das letzte - den Wert des letzten Termes der Reihe. Mittelstufe stellt den durchschnittlichen chronologischen Variationsbereich dar und wird abhängig davon berechnet, ob es sich bei der dynamischen Reihe um eine Intervall- oder eine Momentanreihe handelt.

Ein weiteres wichtiges Merkmal der dynamischen Serie- die Zeit, die von der ersten bis zur letzten Beobachtung verstrichen ist, oder die Anzahl solcher Beobachtungen.

Es gibt verschiedene Arten von Zeitreihen; sie können nach folgenden Kriterien klassifiziert werden.

1) Abhängig von der Methode zur Darstellung der Niveaus werden die Dynamikreihen in Reihen absoluter und abgeleiteter Indikatoren (Relativ- und Durchschnittswerte) unterteilt.

2) Abhängig davon, wie die Stufen der Reihe den Zustand des Phänomens zu bestimmten Zeitpunkten (zu Beginn des Monats, Quartals, Jahres usw.) oder seinen Wert über bestimmte Zeitintervalle (z. B. pro Tag, Monat, Jahr usw.) usw.), unterscheiden zwischen Moment und Intervallreihen Lautsprecher. Momentenreihen werden in der analytischen Arbeit von Strafverfolgungsbehörden relativ selten verwendet.

In der statistischen Theorie werden Dynamiken nach einer Reihe weiterer Klassifizierungskriterien unterschieden: je nach Abstand zwischen Niveaus – mit gleichen Niveaus und ungleichen Niveaus in der Zeit; abhängig vom Vorhandensein der Haupttendenz des untersuchten Prozesses - stationär und instationär. Bei der Analyse von Zeitreihen gehen sie von Folgendem aus; die Stufen der Reihe werden in Form von Komponenten dargestellt:

Y t = TP + E (t)

Dabei ist TP eine deterministische Komponente, die die allgemeine Änderungstendenz im Laufe der Zeit oder im Trend bestimmt.

E(t) ist eine Zufallskomponente, die Pegelschwankungen verursacht.

Die wichtigsten verallgemeinernden Indikatoren für die Variation in Statistiken sind Streuungen und Standardabweichungen.

Streuung das arithmetisches Mittel quadrierte Abweichungen jedes Merkmalswerts vom Gesamtdurchschnitt. Die Varianz wird üblicherweise als mittleres Abweichungsquadrat bezeichnet und mit  2 bezeichnet. Abhängig von den Quelldaten kann die Varianz mithilfe des einfachen oder gewichteten arithmetischen Mittels berechnet werden:

 ungewichtete (einfache) Varianz;

 Varianzgewichtet.

Standardabweichung Dies ist ein verallgemeinerndes Merkmal absoluter Größen Variationen Zeichen im Aggregat. Es wird in denselben Maßeinheiten wie das Attribut ausgedrückt (in Metern, Tonnen, Prozent, Hektar usw.).

Die Standardabweichung ist die Quadratwurzel der Varianz und wird mit  bezeichnet:

 Standardabweichung ungewichtet;

 gewichtete Standardabweichung.

Die Standardabweichung ist ein Maß für die Zuverlässigkeit des Mittelwerts. Je kleiner die Standardabweichung, desto besser spiegelt das arithmetische Mittel die gesamte dargestellte Grundgesamtheit wider.

Der Berechnung der Standardabweichung geht die Berechnung der Varianz voraus.

Das Verfahren zur Berechnung der gewichteten Varianz ist wie folgt:

1) Bestimmen Sie das gewichtete arithmetische Mittel:

2) Berechnen Sie die Abweichungen der Optionen vom Durchschnitt:

3) Quadrieren Sie die Abweichung jeder Option vom Durchschnitt:

4) Multiplizieren Sie die Quadrate der Abweichungen mit Gewichten (Häufigkeiten):

5) Fassen Sie die resultierenden Produkte zusammen:

6) Der resultierende Betrag wird durch die Summe der Gewichte dividiert:

Beispiel 2.1

Berechnen wir das gewichtete arithmetische Mittel:

Die Werte der Abweichungen vom Mittelwert und ihre Quadrate sind in der Tabelle dargestellt. Definieren wir die Varianz:

Die Standardabweichung beträgt:

Wenn die Quelldaten in Form eines Intervalls dargestellt werden Vertriebsreihe , dann müssen Sie zunächst den diskreten Wert des Attributs ermitteln und dann die beschriebene Methode anwenden.

Beispiel 2.2

Zeigen wir die Varianzberechnung für eine Intervallreihe anhand von Daten zur Verteilung der Aussaatfläche einer Kollektivwirtschaft nach Weizenertrag.

Das arithmetische Mittel ist:

Berechnen wir die Varianz:

6.3. Berechnung der Varianz anhand einer Formel auf Basis individueller Daten

Berechnungstechnik Abweichungen komplex und bei großen Optionen- und Häufigkeitswerten kann es umständlich sein. Mithilfe der Eigenschaften der Dispersion können Berechnungen vereinfacht werden.

Die Dispersion hat die folgenden Eigenschaften.

1. Das Reduzieren oder Erhöhen der Gewichte (Frequenzen) einer variierenden Charakteristik um eine bestimmte Anzahl von Malen verändert die Streuung nicht.

2. Verringern oder erhöhen Sie jeden Wert eines Merkmals um denselben konstanten Betrag A verändert die Streuung nicht.

3. Verringern oder erhöhen Sie jeden Wert eines Merkmals um eine bestimmte Anzahl von Malen k verringert bzw. erhöht die Varianz in k 2 mal und Standardabweichung  Zoll k einmal.

4. Die Streuung eines Merkmals relativ zu einem willkürlichen Wert ist immer größer als die Streuung relativ zum arithmetischen Mittel pro Quadrat der Differenz zwischen Durchschnitts- und willkürlichen Werten:

Wenn A 0, dann kommen wir zu folgender Gleichheit:

d.h. die Varianz des Merkmals ist gleich der Differenz zwischen dem Mittelquadrat der Merkmalswerte und dem Quadrat des Mittelwerts.

Jede Eigenschaft kann einzeln oder in Kombination mit anderen zur Berechnung der Varianz verwendet werden.

Das Verfahren zur Berechnung der Varianz ist einfach:

1) bestimmen arithmetisches Mittel :

2) Quadrieren Sie das arithmetische Mittel:

3) Quadrieren Sie die Abweichung jeder Variante der Reihe:

X ich 2 .

4) Ermitteln Sie die Quadratsumme der Optionen:

5) Teilen Sie die Summe der Quadrate der Optionen durch ihre Anzahl, d. h. bestimmen Sie das durchschnittliche Quadrat:

6) Bestimmen Sie die Differenz zwischen dem mittleren Quadrat des Merkmals und dem Quadrat des Mittelwerts:

Beispiel 3.1 Zur Arbeitsproduktivität liegen folgende Daten vor:

Lassen Sie uns die folgenden Berechnungen durchführen:

Die Wahrscheinlichkeitstheorie ist ein spezieller Zweig der Mathematik, der nur von Studierenden höherer Bildungseinrichtungen studiert wird. Magst du Berechnungen und Formeln? Sie haben keine Angst davor, sich mit der Normalverteilung, der Ensembleentropie, dem mathematischen Erwartungswert und der diskreten Dispersion vertraut zu machen Zufallsvariable? Dann wird dieses Thema für Sie sehr interessant sein. Machen wir uns mit einigen der wichtigsten Grundkonzepte dieses Wissenschaftszweigs vertraut.

Erinnern wir uns an die Grundlagen

Auch wenn Sie sich an die einfachsten Konzepte der Wahrscheinlichkeitstheorie erinnern, sollten Sie die ersten Absätze des Artikels nicht vernachlässigen. Der Punkt ist, dass Sie ohne ein klares Verständnis der Grundlagen nicht in der Lage sein werden, mit den unten besprochenen Formeln zu arbeiten.

Es kommt also zu einem zufälligen Ereignis, zu einem Experiment. Als Ergebnis der Maßnahmen, die wir ergreifen, können wir mehrere Ergebnisse erzielen – einige davon treten häufiger auf, andere weniger häufig. Die Wahrscheinlichkeit eines Ereignisses ist das Verhältnis der Anzahl der tatsächlich erzielten Ergebnisse einer Art zu Gesamtzahl möglich. Erst wenn Sie die klassische Definition dieses Konzepts kennen, können Sie mit dem Studium beginnen mathematische Erwartung und Varianzen kontinuierlicher Zufallsvariablen.

Arithmetisches Mittel

Schon in der Schule hast du im Mathematikunterricht angefangen, mit dem arithmetischen Mittel zu arbeiten. Dieses Konzept wird in der Wahrscheinlichkeitstheorie häufig verwendet und kann daher nicht ignoriert werden. Das Wichtigste für uns ist im Moment ist, dass wir es in den Formeln für den mathematischen Erwartungswert und die Streuung einer Zufallsvariablen antreffen werden.

Wir haben eine Zahlenfolge und wollen das arithmetische Mittel ermitteln. Alles, was von uns verlangt wird, ist, alles Verfügbare zusammenzufassen und durch die Anzahl der Elemente in der Sequenz zu dividieren. Nehmen wir Zahlen von 1 bis 9 an. Die Summe der Elemente ergibt 45 und wir teilen diesen Wert durch 9. Antwort: - 5.

Streuung

Apropos wissenschaftliche Sprache, Dispersion ist das durchschnittliche Quadrat der Abweichungen der erhaltenen Kennwerte vom arithmetischen Mittel. Es wird mit einem großen lateinischen Buchstaben D bezeichnet. Was wird zur Berechnung benötigt? Für jedes Element der Folge berechnen wir die Differenz zwischen der vorhandenen Zahl und dem arithmetischen Mittel und quadrieren sie. Es wird genau so viele Werte geben, wie es Ergebnisse für das von uns betrachtete Ereignis geben kann. Als nächstes summieren wir alles, was wir erhalten, und teilen es durch die Anzahl der Elemente in der Sequenz. Wenn wir fünf mögliche Ergebnisse haben, dividieren Sie durch fünf.

Dispersion hat auch Eigenschaften, die man sich merken muss, um sie bei der Lösung von Problemen nutzen zu können. Wenn beispielsweise eine Zufallsvariable um das X-fache zunimmt, erhöht sich die Varianz um das X-Quadrat (d. h. X*X). Er ist nie kleiner als Null und hängt nicht davon ab, dass Werte um gleiche Beträge nach oben oder unten verschoben werden. Darüber hinaus z unabhängige Tests die Varianz der Summe ist gleich der Summe der Varianzen.

Jetzt müssen wir unbedingt Beispiele für die Streuung einer diskreten Zufallsvariablen und den mathematischen Erwartungswert betrachten.

Nehmen wir an, wir haben 21 Experimente durchgeführt und 7 verschiedene Ergebnisse erhalten. Wir haben jeden von ihnen 1, 2, 2, 3, 4, 4 bzw. 5 Mal beobachtet. Wie hoch wird die Varianz sein?

Berechnen wir zunächst das arithmetische Mittel: Die Summe der Elemente beträgt natürlich 21. Teilen Sie es durch 7 und erhalten Sie 3. Subtrahieren Sie nun 3 von jeder Zahl in der ursprünglichen Reihenfolge, quadrieren Sie jeden Wert und addieren Sie die Ergebnisse. Das Ergebnis ist 12. Jetzt müssen wir nur noch die Zahl durch die Anzahl der Elemente dividieren, und das ist scheinbar alles. Aber es gibt einen Haken! Lassen Sie uns darüber diskutieren.

Abhängigkeit von der Anzahl der Experimente

Es stellt sich heraus, dass bei der Berechnung der Varianz der Nenner eine von zwei Zahlen enthalten kann: entweder N oder N-1. Hier ist N die Anzahl der durchgeführten Experimente oder die Anzahl der Elemente in der Sequenz (was im Wesentlichen dasselbe ist). Wovon hängt das ab?

Wenn die Anzahl der Tests in Hunderten gemessen wird, müssen wir N in den Nenner setzen. Wenn in Einheiten, dann N-1. Wissenschaftler haben beschlossen, die Grenze ganz symbolisch zu zeichnen: Heute geht sie durch die Zahl 30. Wenn wir weniger als 30 Experimente durchgeführt haben, teilen wir die Menge durch N-1, und wenn mehr, dann durch N.

Aufgabe

Kehren wir zu unserem Beispiel der Lösung des Problems der Varianz und des mathematischen Erwartungswerts zurück. Wir haben eine Zwischenzahl von 12 erhalten, die durch N oder N-1 geteilt werden musste. Da wir 21 Experimente durchgeführt haben, also weniger als 30, werden wir die zweite Option wählen. Die Antwort lautet also: Die Varianz beträgt 12 / 2 = 2.

Erwartung

Kommen wir zum zweiten Konzept, das wir in diesem Artikel berücksichtigen müssen. Die mathematische Erwartung ist das Ergebnis der Addition aller möglichen Ergebnisse multipliziert mit den entsprechenden Wahrscheinlichkeiten. Es ist wichtig zu verstehen, dass der erhaltene Wert sowie das Ergebnis der Varianzberechnung nur einmal ermittelt werden die ganze Aufgabe, egal wie viele Ergebnisse berücksichtigt werden.

Die Formel für die mathematische Erwartung ist recht einfach: Wir nehmen das Ergebnis, multiplizieren es mit seiner Wahrscheinlichkeit, addieren dasselbe für das zweite, dritte Ergebnis usw. Alles, was mit diesem Konzept zusammenhängt, ist nicht schwer zu berechnen. Beispielsweise ist die Summe der Erwartungswerte gleich dem Erwartungswert der Summe. Dasselbe gilt auch für die Arbeit. Nicht jede Größe in der Wahrscheinlichkeitstheorie ermöglicht die Durchführung solch einfacher Operationen. Nehmen wir das Problem und berechnen wir die Bedeutung zweier Konzepte, die wir gleichzeitig untersucht haben. Außerdem waren wir von der Theorie abgelenkt – es ist Zeit zum Üben.

Ein weiteres Beispiel

Wir führten 50 Versuche durch und erhielten 10 Arten von Ergebnissen – Zahlen von 0 bis 9 –, die in unterschiedlichen Prozentsätzen auftraten. Dies sind jeweils: 2 %, 10 %, 4 %, 14 %, 2 %, 18 %, 6 %, 16 %, 10 %, 18 %. Denken Sie daran, dass Sie zum Erhalten von Wahrscheinlichkeiten die Prozentwerte durch 100 dividieren müssen. Somit erhalten wir 0,02; 0,1 usw. Lassen Sie uns ein Beispiel für die Lösung des Problems für die Varianz einer Zufallsvariablen und den mathematischen Erwartungswert präsentieren.

Das arithmetische Mittel berechnen wir nach der Formel, die wir aus der Grundschule kennen: 50/10 = 5.

Lassen Sie uns nun die Wahrscheinlichkeiten in die Anzahl der Ergebnisse „in Stücken“ umwandeln, um das Zählen zu erleichtern. Wir erhalten 1, 5, 2, 7, 1, 9, 3, 8, 5 und 9. Von jedem erhaltenen Wert subtrahieren wir das arithmetische Mittel und quadrieren anschließend jedes der erhaltenen Ergebnisse. Sehen Sie sich am Beispiel des ersten Elements an, wie das geht: 1 - 5 = (-4). Als nächstes: (-4) * (-4) = 16. Für andere Werte führen Sie diese Operationen selbst aus. Wenn Sie alles richtig gemacht haben, erhalten Sie nach der Addition 90.

Fahren wir mit der Berechnung der Varianz und des Erwartungswerts fort, indem wir 90 durch N dividieren. Warum wählen wir N statt N-1? Richtig, denn die Anzahl der durchgeführten Experimente übersteigt 30. Also: 90/10 = 9. Wir haben die Varianz erhalten. Wenn Sie eine andere Nummer erhalten, verzweifeln Sie nicht. Höchstwahrscheinlich haben Sie bei den Berechnungen einen einfachen Fehler gemacht. Überprüfen Sie noch einmal, was Sie geschrieben haben, und wahrscheinlich wird alles zusammenpassen.

Denken Sie abschließend an die Formel für den mathematischen Erwartungswert. Wir geben nicht alle Berechnungen an, sondern verfassen lediglich eine Antwort, die Sie nach Abschluss aller erforderlichen Verfahren überprüfen können. Der erwartete Wert beträgt 5,48. Erinnern wir uns nur daran, wie Operationen ausgeführt werden, indem wir die ersten Elemente als Beispiel verwenden: 0*0,02 + 1*0,1... und so weiter. Wie Sie sehen, multiplizieren wir einfach den Ergebniswert mit seiner Wahrscheinlichkeit.

Abweichung

Ein weiteres Konzept, das eng mit der Streuung und dem mathematischen Erwartungswert zusammenhängt, ist die Standardabweichung. Es ist entweder bezeichnet in lateinischen Buchstaben sd oder griechischer Kleinbuchstabe „Sigma“. Dieses Konzept zeigt, wie stark die Werte im Durchschnitt vom zentralen Merkmal abweichen. Um seinen Wert zu ermitteln, müssen Sie berechnen Quadratwurzel aus der Zerstreuung.

Wenn Sie planen Normalverteilung und die quadratische Abweichung direkt darauf sehen möchten, kann dies in mehreren Schritten erfolgen. Nehmen Sie die Hälfte des Bildes links oder rechts vom Modus (Mittelwert) und zeichnen Sie eine Senkrechte zur horizontalen Achse, sodass die Flächen der resultierenden Figuren gleich sind. Die Größe des Segments zwischen der Mitte der Verteilung und der resultierenden Projektion auf die horizontale Achse stellt die Standardabweichung dar.

Software

Wie aus den Beschreibungen der Formeln und den vorgestellten Beispielen hervorgeht, ist die Berechnung der Varianz und des mathematischen Erwartungswerts aus arithmetischer Sicht nicht das einfachste Verfahren. Um keine Zeit zu verschwenden, ist es sinnvoll, das im Hochschulbereich verwendete Programm zu nutzen Bildungseinrichtungen- es heißt "R". Es verfügt über Funktionen, mit denen Sie Werte für viele Konzepte aus Statistik und Wahrscheinlichkeitstheorie berechnen können.

Sie geben beispielsweise einen Wertevektor an. Dies geschieht wie folgt: Vektor<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Abschließend

Streuung und mathematische Erwartung sind Faktoren, ohne die es schwierig ist, etwas in der Zukunft zu berechnen. Im Hauptstudium der Vorlesungen an Universitäten werden sie bereits in den ersten Monaten des Fachstudiums besprochen. Gerade aufgrund des mangelnden Verständnisses dieser einfachen Konzepte und der Unfähigkeit, sie zu berechnen, geraten viele Studierende im Programm sofort in Rückstand und erhalten am Ende des Kurses schlechte Noten, was ihnen die Stipendien vorenthält.

Üben Sie mindestens eine Woche lang eine halbe Stunde am Tag und lösen Sie Aufgaben, die denen in diesem Artikel ähneln. Dann werden Sie bei jedem Test in der Wahrscheinlichkeitstheorie die Beispiele ohne überflüssige Tipps und Spickzettel meistern können.





Fehler: Inhalt geschützt!!