Faktoren- und Dispersionsanalyse in Excel mit Berechnungsautomatisierung. Einweganalyse der Varianz

Varianzanalyse

1. Das Konzept der Varianzanalyse

Varianzanalyse- Dies ist eine Analyse der Variabilität eines Merkmals unter dem Einfluss von kontrollierten variablen Faktoren. In der ausländischen Literatur Varianzanalyse oft als ANOVA bezeichnet, was übersetzt Varianzanalyse (Varianzanalyse) bedeutet.

Die Aufgabe der Varianzanalyse besteht darin, die Variabilität einer anderen Art von der allgemeinen Variabilität des Merkmals zu isolieren:

a) Variabilität aufgrund der Wirkung jeder der untersuchten unabhängigen Variablen;

b) Variabilität aufgrund der Interaktion der untersuchten unabhängigen Variablen;

c) zufällige Variation aufgrund aller anderen unbekannten Variablen.

Die Variabilität aufgrund der Wirkung der untersuchten Variablen und ihrer Wechselwirkung korreliert mit zufälliger Variabilität. Ein Indikator für dieses Verhältnis ist der Fisher-F-Test.

Die Formel zur Berechnung des Kriteriums F enthält Schätzungen von Varianzen, dh der Verteilungsparameter eines Merkmals, daher ist das Kriterium F ein parametrisches Kriterium.

Je mehr die Variabilität des Merkmals auf die untersuchten Variablen (Faktoren) oder deren Zusammenspiel zurückzuführen ist, desto höher Erfahrungswerte des Kriteriums.

Null Die Hypothese in der Varianzanalyse besagt, dass die Durchschnittswerte des untersuchten effektiven Merkmals in allen Abstufungen gleich sind.

Alternative Die Hypothese besagt, dass die Durchschnittswerte des effektiven Attributs in verschiedenen Abstufungen des untersuchten Faktors unterschiedlich sind.

Die Varianzanalyse ermöglicht es uns, eine Änderung in einem Merkmal festzustellen, zeigt sie jedoch nicht an Richtung diese Veränderungen.

Beginnen wir die Varianzanalyse mit dem einfachsten Fall, wenn wir nur die Wirkung von untersuchen eins variabel (Einzelfaktor).

2. Einweg-Varianzanalyse für nicht verwandte Proben

2.1. Zweck der Methode

Die Methode der univariaten Varianzanalyse wird in Fällen verwendet, in denen Änderungen des effektiven Attributs unter dem Einfluss sich ändernder Bedingungen oder Abstufungen eines beliebigen Faktors untersucht werden. Bei dieser Version des Verfahrens ist der Einfluss jeder der Abstufungen des Faktors anders Stichprobe von Testpersonen. Es müssen mindestens drei Abstufungen des Faktors vorhanden sein. (Es kann zwei Abstufungen geben, aber in diesem Fall werden wir keine nichtlinearen Abhängigkeiten feststellen können und es erscheint sinnvoller, einfachere zu verwenden).

Eine nichtparametrische Variante dieser Analyseart ist der Kruskal-Wallis-H-Test.

Hypothesen

H 0: Unterschiede zwischen Faktornoten (unterschiedliche Bedingungen) sind nicht stärker ausgeprägt als zufällige Unterschiede innerhalb jeder Gruppe.

H 1: Unterschiede zwischen Faktorabstufungen (unterschiedliche Bedingungen) sind stärker ausgeprägt als zufällige Unterschiede innerhalb jeder Gruppe.

2.2. Einschränkungen der univariaten Varianzanalyse für unabhängige Stichproben

1. Univariate Varianzanalyse erfordert mindestens drei Abstufungen des Faktors und mindestens zwei Probanden in jeder Abstufung.

2. Das resultierende Merkmal muss in der Studienstichprobe normalverteilt sein.

Zwar wird in der Regel nicht angegeben, ob es sich um die Verteilung eines Merkmals in der gesamten untersuchten Stichprobe handelt oder in dem Teil davon, der den Streuungskomplex ausmacht.

3. Ein Beispiel für die Lösung des Problems durch die Methode der Einfaktor-Varianzanalyse für unabhängige Stichproben anhand des Beispiels:

Drei verschiedene Gruppen von sechs Probanden erhielten Listen mit zehn Wörtern. Wörter wurden der ersten Gruppe mit einer niedrigen Rate von 1 Wort pro 5 Sekunden präsentiert, der zweiten Gruppe mit einer durchschnittlichen Rate von 1 Wort pro 2 Sekunden und der dritten Gruppe mit einer hohen Rate von 1 Wort pro Sekunde. Es wurde vorhergesagt, dass die Wiedergabeleistung von der Geschwindigkeit der Wortpräsentation abhängt. Die Ergebnisse sind in der Tabelle dargestellt. 1.

Anzahl der wiedergegebenen Wörter Tabelle 1

Betreffnummer

langsame Geschwindigkeit

Durchschnittsgeschwindigkeit

schnelle Geschwindigkeit

Gesamtbetrag

H 0: Unterschiede in der Wortlautstärke zwischen Gruppen sind nicht ausgeprägter als zufällige Unterschiede innen jede Gruppe.

H1: Unterschiede in der Wortlautstärke zwischen Gruppen sind ausgeprägter als zufällige Unterschiede innen jede Gruppe. Unter Verwendung der in der Tabelle dargestellten experimentellen Werte. 1 werden wir einige Werte ermitteln, die zur Berechnung des Kriteriums F benötigt werden.

Die Berechnung der Hauptgrößen für die einfache Varianzanalyse ist in der Tabelle dargestellt:

Tabelle 2

Tisch 3

Abfolge von Operationen in der einfachen ANOVA für nicht verbundene Proben

Die in dieser und den folgenden Tabellen häufig verwendete Bezeichnung SS ist eine Abkürzung für "Quadratsumme". Diese Abkürzung wird am häufigsten in übersetzten Quellen verwendet.

SS Tatsache bedeutet die Variabilität des Merkmals aufgrund der Wirkung des untersuchten Faktors;

SS gemeinsam- allgemeine Variabilität des Merkmals;

S CA- Variabilität aufgrund nicht berücksichtigter Faktoren, „zufälliger“ oder „Rest“-Variabilität.

MS- "Mean Square" oder die mathematische Erwartung der Summe der Quadrate, der Durchschnittswert der entsprechenden SS.

df - die Anzahl der Freiheitsgrade, die wir bei Betrachtung nichtparametrischer Kriterien mit dem griechischen Buchstaben bezeichnet haben v.

Fazit: H 0 wird abgelehnt. H 1 wird akzeptiert. Unterschiede in der Lautstärke der Wortwiedergabe zwischen den Gruppen sind ausgeprägter als zufällige Unterschiede innerhalb jeder Gruppe (α = 0,05). Die Geschwindigkeit der Präsentation von Wörtern beeinflusst also die Lautstärke ihrer Wiedergabe.

Ein Beispiel für die Lösung des Problems in Excel ist unten dargestellt:

Ausgangsdaten:

Mit dem Befehl: Tools->Data Analysis->One-Way Analysis of Variance erhalten wir folgende Ergebnisse:

In diesem Thema wird nur die unidirektionale Varianzanalyse betrachtet, die für nicht zusammenhängende Stichproben verwendet wird. In Bezug auf das Grundkonzept der Varianz basiert diese Analyse auf der Berechnung von Varianzen dreier Arten:

Die für den gesamten Satz experimenteller Daten berechnete Gesamtvarianz;

Varianz innerhalb der Gruppe, die die Variabilität eines Merkmals in jeder Stichprobe charakterisiert;

Intergruppenstreuung, die die Variabilität der Gruppenmittelwerte charakterisiert.

Die Hauptbestimmung der Varianzanalyse lautet: Gesamtvarianz gleich der Summe der gruppeninternen und gruppenübergreifenden Streuungen.

Diese Position kann als Gleichung geschrieben werden:

Wo xij- Werte aller im Experiment erhaltenen Variablen; während der Index J variiert zwischen 1 Vor R, Wo R- die Anzahl der verglichenen Proben, es können drei oder mehr sein; Index ich entspricht der Anzahl der Elemente in der Probe (es können zwei oder mehr sein);

Der Gesamtdurchschnitt des gesamten analysierten Datensatzes;

Mittel J Proben;

N-Gesamtzahl alle Elemente im analysierten Satz experimenteller Daten;

R- Anzahl der Versuchsproben.

Lassen Sie uns diese Gleichung genauer analysieren.

Lass uns haben R Gruppen (Proben). Bei der ANOVA wird jede Probe als einzelne Spalte (oder Zeile) mit Zahlen dargestellt. Um dann auf eine bestimmte Gruppe (Probe) verweisen zu können, wird ein Index eingeführt J, die sich entsprechend ab ändert J= 1 zu J= r. Wenn wir zum Beispiel 5 Gruppen (Stichproben) haben, dann ist p=5 und der Index Jändert sich entsprechend ab j= 1 zu j= 5.

Stellen wir uns der Aufgabe, ein bestimmtes Element (Messwert) einer Probe zu spezifizieren. Dazu müssen wir die Nummer dieser Probe, zum Beispiel 4, und die Position des Elements (Messwert) in dieser Probe kennen. Dieses Element kann sich in der Auswahl vom ersten Wert (erste Zeile) bis zum letzten (letzte Zeile) befinden. Lassen Sie unser erforderliches Element in der fünften Zeile liegen. Dann lautet seine Notation: x 54 . Dies bedeutet, dass das fünfte Element in der Zeile aus dem vierten Sample ausgewählt wird.

IN Allgemeiner Fall In jeder Gruppe (Probe) kann die Anzahl ihrer Bestandteile unterschiedlich sein - daher bezeichnen wir die Anzahl der Elemente in J Gruppe (Probe) durch NJ. Die im Experiment erhaltenen Werte des Merkmals in J Gruppe bezeichnet mit xij, Wo ich= 1, 2, ... n ist die laufende Nummer der Beobachtung in J Gruppe.

Es ist ratsam, weitere Überlegungen auf der Grundlage von Tabelle 35 anzustellen. Beachten Sie jedoch, dass die Proben in dieser Tabelle zur Vereinfachung der weiteren Überlegungen nicht als Spalten, sondern als Zeilen dargestellt werden (was jedoch nicht wichtig ist).

In der letzten, letzten Zeile der Tabelle ist das Gesamtvolumen der gesamten Probe angegeben - N, die Summe aller erhaltenen Werte von G und der Gesamtdurchschnitt der gesamten Probe. Dieser Gesamtdurchschnitt ergibt sich als Summe aller Elemente des analysierten Satzes experimenteller Daten, oben mit G bezeichnet, dividiert durch die Anzahl aller Elemente N.


Die rechte Spalte der Tabelle zeigt die Mittelwerte für alle Proben. Zum Beispiel im J Probe (Zeile der Tabelle mit dem Symbol j bezeichnet) Der Wert des Durchschnitts (für die gesamte j-Probe) ist wie folgt:

Mit der Varianzanalyse können Sie den Unterschied zwischen Datengruppen untersuchen, um festzustellen, ob diese Abweichungen zufällig sind oder durch bestimmte Umstände verursacht wurden. Wenn beispielsweise der Umsatz eines Unternehmens in einer der Regionen zurückgegangen ist, können Sie anhand der Varianzanalyse herausfinden, ob der Umsatzrückgang in dieser Region im Vergleich zu den anderen zufällig ist, und gegebenenfalls durchführen organisatorische Veränderungen. Bei der Durchführung eines Experiments in unterschiedliche Bedingungen Die Varianzanalyse hilft festzustellen, wie stark externe Faktoren die Messungen beeinflussen oder Abweichungen zufällig sind. Wenn in der Produktion zur Verbesserung der Produktqualität die Art der Prozesse geändert wird, ermöglicht uns die Varianzanalyse, die Ergebnisse der Auswirkungen dieses Faktors zu bewerten.

Darauf Beispiel Wir zeigen, wie man ANOVA an experimentellen Daten durchführt.

Übung 1. Es gibt vier Rohstoffchargen für die Textilindustrie. Aus jeder Charge wurden fünf Proben ausgewählt und Tests durchgeführt, um die Größe der Bruchlast zu bestimmen. Die Testergebnisse sind in der Tabelle gezeigt.

71" height="29" bgcolor="white" style="border:.75pt einfarbig schwarz; vertikal ausrichten:oben;hintergrund:weiß">

Abb.1


> Öffnen Sie eine Microsoft Excel-Tabelle. Klicken Sie auf die Beschriftung Sheet2, um zu einem anderen Arbeitsblatt zu wechseln.

> Geben Sie die in Abbildung 1 gezeigten ANOVA-Daten ein.

> Daten in Zahlenformat umwandeln. Wählen Sie dazu den Menübefehl Zelle formatieren. Das Zellenformatfenster erscheint auf dem Bildschirm (Abb. 2). Wählen Sie Numerisches Format und die eingegebenen Daten werden in das in Abb. 3

> Wählen Sie den Menübefehl Servicedatenanalyse (Extras * Datenanalyse). Das Fenster Datenanalyse (Datenanalyse) erscheint auf dem Bildschirm (Abb. 4).

> Klicken Sie in der Liste Analysewerkzeuge (Anova: Einzelfaktor) auf die Zeile Einzelfaktoranalyse der Varianz (Anova: Einzelfaktor).

> Klicken Sie auf OK, um das Fenster Datenanalyse (Datenanalyse) zu schließen. Das Fenster Einweg-Varianzanalyse erscheint auf dem Bildschirm zur Durchführung der Streuungsanalyse der Daten (Abb. 5).

https://pandia.ru/text/78/446/images/image006_46.jpg" width="311" height="214 src=">

Abb.5

> Wenn in einer Gruppe von Kontrollen Eingabedaten(Eingabe) der zeilenweise Schalter nicht gesetzt ist, dann stellen Sie ihn so ein, dass das Excel-Programm Datengruppen zeilenweise akzeptiert - Batches.

> Installieren Kontrollkästchen-Tags in der ersten Zeile (Labels in Firts Rom) in der Gruppe Eingabesteuerelemente, wenn die erste Spalte des ausgewählten Datenbereichs Zeilennamen enthält.

> Im Eingabefeld Alpha Der (A1pha) Control Group Input ist standardmäßig auf einen Wert von 0,05 eingestellt, was sich auf die Fehlerwahrscheinlichkeit bei der Varianzanalyse bezieht.

> Wenn der Schalter Nev Worksheet Ply in der Controls-Gruppe Input options nicht gesetzt ist, stellen Sie ihn so ein, dass die Ergebnisse der Varianzanalyse auf einem neuen Worksheet abgelegt werden

> Klicken Sie auf OK, um das Fenster Anova: Single Factor zu schließen. Die Ergebnisse der Varianzanalyse erscheinen auf einem neuen Arbeitsblatt (Abb. 6).

Der Zellbereich A4:E6 enthält die Ergebnisse der deskriptiven Statistik. Zeile 4 enthält die Namen der Parameter, die Zeilen enthalten die nach Chargen berechneten Statistikwerte.

In Spalte Überprüfen(Anzahl) sind die Anzahl der Messungen, in der Spalte Sum die Summe der Werte, in der Spalte Average (Avegage) die arithmetischen Mittelwerte, in der Spalte Variance (Varianse) die Streuung.

Die erhaltenen Ergebnisse zeigen, dass die höchste durchschnittliche Bruchlast in Charge Nr. 3, und größte Abweichung Bruchlast - in Partei Nr. 1.

In einer Reihe von Zellen A11:G16 zeigt Informationen zur Signifikanz von Abweichungen zwischen Datengruppen an. Zeile 12 enthält die Namen der Varianzanalyseparameter, Zeile 13 - die Ergebnisse der gruppeninternen Verarbeitung, Zeile 14 - die Ergebnisse der gruppeninternen Verarbeitung und Zeile 16 - die Summe der Werte der beiden genannten Zeilen.

In Spalte SS (qi) sind die Variationswerte eingezeichnet, also die Quadratsummen über alle Abweichungen. Variation, wie Streuung, charakterisiert die Verbreitung von Daten. Aus der Tabelle ist ersichtlich, dass die gruppeninterne Streuung der Bruchlast deutlich höher ist als die gruppeninterne Streuung.

In Spalte df (k) die Werte der Anzahl der Freiheitsgrade werden gefunden. Diese Zahlen geben die Anzahl der unabhängigen Abweichungen an, über die die Varianz berechnet wird. Beispielsweise ist die Anzahl der Freiheitsgrade zwischen den Gruppen gleich der Differenz zwischen der Anzahl der Datengruppen und eins. Je größer die Zahl der Freiheitsgrade ist, desto höher ist die Zuverlässigkeit der Dispersionsparameter. Die Daten zu den Freiheitsgraden in der Tabelle zeigen, dass die Ergebnisse innerhalb der Gruppe zuverlässiger sind als die Parameter zwischen den Gruppen.

In Spalte MS (S2 ) sind die Streuungswerte eingezeichnet, die durch das Variationsverhältnis und die Anzahl der Freiheitsgrade bestimmt werden. Streuung charakterisiert den Grad der Streuung von Daten, hat aber im Gegensatz zur Größe der Variation keine direkte Tendenz, mit zunehmender Anzahl von Freiheitsgraden zuzunehmen. Das ist aus der Tabelle ersichtlich Intergruppenvarianz viel größer als die Intragruppenvarianz.

In Spalte F gelegen, bedeutet F- Statistiken, berechnet aus dem Verhältnis von Intergruppen- und Intragruppenvarianzen.

In Spalte Fkritisch(F crit) ist der F-kritische Wert eingezeichnet, berechnet aus der Anzahl der Freiheitsgrade und dem Wert von Alpha (A1pha). Verwendungskriterium für F-Statistik und F-kritischen Wert Fischer-Snedekora.

Wenn die F-Statistik größer als der F-kritische Wert ist, kann argumentiert werden, dass die Unterschiede zwischen Datengruppen nicht zufällig sind. also auf dem Signifikanzniveau α = 0,05 (bei einer Reliabilität von 0,95) wird die Nullhypothese verworfen und die Alternative akzeptiert: Der Unterschied zwischen den Rohstoffchargen hat einen erheblichen Einfluss auf die Größe der Bruchlast.

Die Spalte P-Wert enthält den Wahrscheinlichkeitswert, dass die Diskrepanz zwischen Gruppen zufällig ist. Da diese Wahrscheinlichkeit in der Tabelle sehr klein ist, ist die Abweichung zwischen den Gruppen nicht zufällig.

2. Lösen von Problemen der zweifachen Varianzanalyse ohne Wiederholungen

Microsoft Excel hat die Funktion Anova: (Two-Factor Without Replication), die verwendet wird, um die Tatsache des Einflusses kontrollierter Faktoren zu identifizieren A Und IN auf einem effektiven Attribut basierend auf Beispieldaten und jeder Ebene von Faktoren A Und IN nur eine Probe passt. Um diese Funktion aufzurufen, wählen Sie den Befehl in der Menüleiste Service – Datenanalyse. Auf dem Bildschirm öffnet sich ein Fenster. Datenanalyse, in dem Sie einen Wert auswählen sollten Zweiweg-Varianzanalyse ohne Wiederholungen und klicken Sie auf die Schaltfläche OK. Als Ergebnis wird das in Abbildung 1 gezeigte Dialogfeld auf dem Bildschirm geöffnet.

78" height="42" bgcolor="white" style="border:.75pt einfarbig schwarz; vertikal ausrichten:oben;hintergrund:weiß">

2. Das Kontrollkästchen Beschriftungen ist aktiviert, wenn die erste Zeile im Eingabebereich Spaltenüberschriften enthält. Wenn keine Kopfzeilen vorhanden sind, sollte das Kontrollkästchen deaktiviert werden. In diesem Fall werden automatisch Standardnamen für die Ausgabebereichsdaten generiert.

3. Im Feld Alpha wird das akzeptierte Signifikanzniveau eingegeben. α , was der Wahrscheinlichkeit eines Fehlers erster Art entspricht.

4. Der Schalter in der Gruppe Ausgabeoptionen kann auf eine von drei Positionen eingestellt werden: Ausgabebereich, Neue Arbeitsblattlage oder Neue Arbeitsmappe.

Beispiel.

Zweiweg-Varianzanalyse ohne Wiederholungen(Anova: Two-Factor Without Replication) im folgenden Beispiel.

Auf dem Bild. Abbildung 2 zeigt den Ertrag (c/ha) von vier Weizensorten (vier Stufen von Faktor A), der mit fünf Arten von Düngemitteln (fünf Stufen von Faktor B) erzielt wurde. Die Daten wurden von 20 Parzellen gleicher Größe und ähnlicher Bodenbedeckung gewonnen. Muss definiert werden ob Sorte und Art des Düngers den Weizenertrag beeinflussen.

Zweiweg-Varianzanalyse ohne Wiederholungen sind in Abbildung 3 dargestellt.

Wie aus den Ergebnissen ersichtlich, ist der errechnete Wert des F-Statistikwertes für Faktor A (Düngertyp) FA= l,67 , und der kritische Bereich wird durch das rechte Intervall (3.49; +∞) gebildet. Als FA= l,67 nicht in den kritischen Bereich fällt, gilt die HA-Hypothese: A 1 = A 2 + = ja akzeptieren, d.h. wir glauben das in diesem Experiment die Art des Düngers hatte keinen Einfluss auf den Ertrag.

Schätzwert der F-Statistik für Faktor B (Weizensorte) FIN =2,03 , und der kritische Bereich wird durch das rechte Intervall (3.259;+∞) gebildet.

Als FIN=2,03 fällt nicht in den kritischen Bereich, die Hypothese HB: B1 = B2 = ... = bm

auch akzeptieren, d.h. wir glauben daran Auch die Weizensorte hatte im Versuch keinen Einfluss auf den Ertrag.

2. Zweiweg-VarianzanalyseCWiederholungen

Microsoft Excel verfügt über die Anova-Funktion: Two-Factor With Replication, die auch verwendet wird, um zu bestimmen, ob die kontrollierten Faktoren A und B ein Leistungsmerkmal basierend auf Stichprobendaten beeinflussen, jedoch entspricht jede Stufe eines der Faktoren A (oder B) mehr als einer Datenprobe.

Erwägen Sie die Verwendung der Funktion Zweiweg-Varianzanalyse mit Wiederholungen am nächsten Beispiel.

Beispiel 2. in der Tabelle. Abbildung 6 zeigt die tägliche Gewichtszunahme (g) von 18 für die Studie gesammelten Ferkeln in Abhängigkeit von der Haltung der Ferkel (Faktor A) und der Qualität ihrer Fütterung (Faktor B).

75" height="33" bgcolor="white" style="border:.75pt einfarbig schwarz; vertikal ausrichten:oben;hintergrund:weiß">

Dieses Dialogfeld legt die folgenden Optionen fest.

1. Geben Sie im Feld Eingabebereich einen Verweis auf den Zellbereich ein, der die analysierten Daten enthält. Wählen Sie Zellen aus G 4 Vor ICH 13.

2. Definieren Sie im Feld Zeilen pro Stichprobe die Anzahl der Stichproben für jede Stufe eines der Faktoren. Jede Faktorstufe muss die gleiche Anzahl von Stichproben (Tabellenzeilen) enthalten. In unserem Fall beträgt die Anzahl der Zeilen drei.

3. Geben Sie im Feld Alpha den akzeptierten Wert des Signifikanzniveaus ein α , was gleich der Wahrscheinlichkeit eines Fehlers 1. Art ist.

4. Der Schalter in der Gruppe Ausgabeoptionen kann auf eine von drei Positionen eingestellt werden: Ausgabebereich (Ausgabeintervall), Neue Arbeitsblattlage (Neues Arbeitsblatt) oder Neue Arbeitsmappe (Neue Arbeitsmappe).

Ergebnisse der Zweiweg-Varianzanalyse unter Verwendung der Funktion Zweiweg-Varianzanalyse mit signifikanten Wiederholungen. Aufgrund der Tatsache, dass das Zusammenspiel dieser Faktoren ist unbedeutend (auf dem 5%-Niveau).

Hausaufgaben

1. Im Laufe von sechs Jahren wurden fünf verschiedene Technologien zum Anbau von Pflanzen eingesetzt. Versuchsdaten (in c/ha) sind in der Tabelle angegeben:

https://pandia.ru/text/78/446/images/image024_11.jpg" width="642" height="190 src=">

Es wird auf dem Signifikanzniveau α = 0,05 benötigt, um die Abhängigkeit der Produktion hochwertiger Fliesen von der Produktionslinie (Faktor A) festzustellen.

3. Über den Ertrag von vier Weizensorten auf den zugeteilten fünf Parzellen (Blöcken) liegen folgende Daten vor:

https://pandia.ru/text/78/446/images/image026_9.jpg" width="598" height="165 src=">

Es ist auf dem Signifikanzniveau α = 0,05 erforderlich, um den Einfluss von Technologien (Faktor A) und Unternehmen (Faktor B) auf die Arbeitsproduktivität zu ermitteln.

Ein-Faktor-Streuungsmodell hat die Form

Wo Xjj- der Wert der untersuchten Variablen, erhalten am z-Ebene Faktor (r = 1, 2,..., T) su-te Seriennummer (J- 1,2,..., P);/y - Effekt aufgrund des Einflusses der i-ten Stufe des Faktors; e^. - eine zufällige Komponente oder eine Störung, die durch den Einfluss unkontrollierbarer Faktoren verursacht wird, d.h. Variation einer Variablen innerhalb einer Ebene.

Unter Faktorstufe Einige seiner Maße oder Zustände werden verstanden, zum Beispiel die Menge der ausgebrachten Düngemittel, die Art der Metallschmelze oder die Chargennummer der Teile usw.

Grundvoraussetzungen für die Varianzanalyse.

1. Mathematische Erwartung der Störung ? (/ - ist Null für jedes i, diese.

  • 2. Störungen sind voneinander unabhängig.
  • 3. Die Streuung der Störung (oder der Variablen Xu) ist für jedes ij> konstant diese.

4. Die Störung e# (oder die Variable Xu) hat ein Normalverteilungsgesetz N( 0; ein 2).

Der Einfluss von Faktorstufen kann z Fest, oder systematisch(Modell I) und willkürlich(Modell II).

Angenommen, es ist notwendig herauszufinden, ob es signifikante Unterschiede zwischen Produktchargen in Bezug auf einen Qualitätsindikator gibt, d.h. Überprüfen Sie die Auswirkungen eines Faktors auf die Qualität - einer Produktcharge. Wenn alle Chargen von Rohstoffen in die Studie einbezogen werden, dann ist der Einfluss der Höhe eines solchen Faktors systematisch (Modell I), und die Ergebnisse gelten nur für die einzelnen Chargen, die in die Studie einbezogen wurden; wird nur ein zufällig ausgewählter Teil der Chargen einbezogen, so ist der Einfluss des Faktors zufällig (Modell II). In multifaktoriellen Komplexen ist ein gemischtes Modell III möglich, bei dem einige Faktoren zufällige Ebenen haben, während andere fest sind.

Betrachten wir dieses Problem genauer. Lass es sein T Chargen von Produkten. Aus jeder Charge entsprechend selektiert pL, p2 ,p t Produkte (der Einfachheit halber gehen wir davon aus u = n 2 =... = nt = n). Wir stellen die Werte des Qualitätsindex dieser Produkte in Form einer Beobachtungsmatrix dar


Es ist notwendig, die Bedeutung des Einflusses von Produktchargen auf deren Qualität zu prüfen.

Wenn wir davon ausgehen, dass die Elemente der Zeilen der Beobachtungsmatrix Zahlenwerte sind (Realisierungen) zufällige Variablen Xt, X 2 ,..., x t, die die Qualität von Produkten ausdrücken bzw. ein Normalverteilungsgesetz mit mathematischen Erwartungen haben ein v ein 2 , ..., bei und gleiche Dispersionen a 2 , dann gestellte Aufgabe kommt es darauf an, die Nullhypothese #0 zu testen: ein v = ein 2l = ... = A t, durchgeführt in der Varianzanalyse.

Lassen Sie uns die Mittelung über einen Index mit einem Sternchen (oder einem Punkt) anstelle eines Index bezeichnen, dann den durchschnittlichen Qualitätsindex von Produkten der i-ten Charge oder Gruppendurchschnitt für die i-te Stufe des Faktors nimmt die Form an

A Gesamtdurchschnitt -

Betrachten Sie die Summe der quadrierten Abweichungen der Beobachtungen vom Gesamtmittelwert xn:

oder Q= Q+ Q2+ ?>ç Der letzte Term

da die Summe der Abweichungen der Werte der Variablen von ihrem Mittelwert, d.h. ? 1.g y - x) gleich Null ist. ) = x

Der erste Term kann geschrieben werden als

Als Ergebnis erhalten wir die folgende Identität:

t p. _

Wo Q=Y X [x ij _ x ", ich 2 - allgemein, oder vollständig, Summe der quadrierten Abweichungen; 7=1

Q, -n^)



Fehler: Inhalt ist geschützt!!