Vyberte možnost Stránka

Pearsonův t test a další. Pearsonovo kritérium pro testování hypotézy o tvaru distribučního zákona náhodné veličiny

Statistický test

Pravidlo, podle kterého je hypotéza I 0 zamítnuta nebo přijata, se nazývá statistické kritérium. Název kritéria zpravidla obsahuje písmeno, které označuje speciálně sestavenou charakteristiku z odstavce 2 ověřovacího algoritmu statistická hypotéza(viz odstavec 4.1), vypočtené v kritériu. Za podmínek tohoto algoritmu by bylo voláno kritérium "PROTI-kritérium".

Při testování statistických hypotéz jsou možné dva typy chyb:

  • - Chyba typu I(můžete odmítnout hypotézu I 0, když je skutečně pravdivá);
  • - Chyba typu II(můžete přijmout hypotézu I 0, když ve skutečnosti není pravdivá).

Pravděpodobnost A vytvoření chyby typu I se nazývá hladina významnosti kritéria.

Pokud pro r označují pravděpodobnost, že uděláte chybu druhého typu, pak (l - p) - pravděpodobnost, že se nedopustí chyby typu II, která se nazývá síla kritéria.

Pearsonův x 2 test dobré shody

Existuje několik typů statistických hypotéz:

  • - o zákonu rozdělování;
  • - homogenita vzorků;
  • - číselné hodnoty distribučních parametrů atd.

Hypotézu o distribučním zákoně budeme uvažovat na příkladu Pearsonova x 2 testu dobré shody.

Kritérium dohody se nazývá statistické kritérium pro testování nulové hypotézy o předpokládaném zákonu neznámého rozdělení.

Pearsonův test dobré shody je založen na srovnání empirických (pozorovaných) a teoretických četností pozorování vypočítaných za předpokladu určitého distribučního zákona. Hypotéza č. 0 je zde formulována následovně: podle studované charakteristiky je populace normálně rozložena.

Algoritmus testování statistických hypotéz č. 0 pro kritérium x 1 Pearson:

  • 1) předkládáme hypotézu I 0 - podle studované charakteristiky je obecná populace rozložena normálně;
  • 2) vypočítat výběrový průměr a výběrovou směrodatnou odchylku Ó PROTI;

3) podle dostupného objemu vzorku n vypočítáme speciálně sestavenou charakteristiku,

kde: i, jsou empirické frekvence, - teoretické frekvence,

p - velikost vzorku,

h- velikost intervalu (rozdíl mezi dvěma sousedními možnostmi),

normalizované hodnoty sledované charakteristiky,

- funkce stolu. Také teoretické frekvence

lze vypočítat pomocí standardní funkce MS Excel NORMIDIST pomocí vzorce;

4) pomocí výběrového rozdělení určíme kritickou hodnotu speciálně sestavené charakteristiky xl P

5) když je hypotéza # 0 zamítnuta, když je hypotéza # 0 přijata.

Příklad. Podívejme se na znamení X- hodnota testovacích ukazatelů pro odsouzené v jedné z nápravných kolonií pro nějakou psychologickou charakteristiku, prezentovaná ve formě variační řady:

Na hladině významnosti 0,05 otestujte hypotézu normálního rozdělení populace.

1. Na základě empirického rozdělení lze vyslovit hypotézu H 0: podle studovaného kritéria „hodnota testovacího ukazatele pro danou psychologickou charakteristiku“ obecná populace

očekávaný je distribuován normálně. Alternativní hypotéza 1: podle studovaného kritéria „hodnota indikátoru testu pro danou psychologickou charakteristiku“ není běžná populace odsouzených rozložena.

2. Vypočítejme numerické charakteristiky vzorku:

Intervaly

x g y

X) sch

3. Vypočítejme speciálně sestavenou charakteristiku j 2 . Za tímto účelem najdeme v předposledním sloupci předchozí tabulky teoretické četnosti pomocí vzorce a v posledním sloupci

Vypočítejme charakteristiky % 2. Dostáváme x 2 = 0,185.

Pro názornost sestrojíme polygon empirického rozdělení a normálovou křivku na základě teoretických četností (obr. 6).

Rýže. 6.

4. Určete počet stupňů volnosti s: k = 5, t = 2, s = 5-2-1 = 2.

Podle tabulky nebo pomocí standardní funkce MS Excel „HI20BR“ pro počet stupňů volnosti 5 = 2 a hladinu významnosti a = 0,05 najdeme kritickou hodnotu kritéria xl P.=5,99. Pro hladinu významnosti A= 0,01 hodnota kritického kritéria X %. = 9,2.

5. Hodnota sledovaného kritéria X=0,185 méně než všechny nalezené hodnoty Hk R.-> proto je hypotéza I 0 přijata na obou hladinách významnosti. Rozdíl mezi empirickými a teoretickými četnostmi je nevýznamný. Údaje z pozorování jsou tedy v souladu s hypotézou o normální distribuci populace. Podle studovaného kritéria „hodnota indikátoru testování pro danou psychologickou charakteristiku“ je tedy běžná populace odsouzených rozložena normálně.

  • 1. Koryachko A.V., Kulichenko A.G. Algebra pro pokročilé a matematické metody v psychologii: průvodce praktickými cvičeními pro studenty PF. Rjazaň, 1994.
  • 2. Následov A.D. Matematické metody psychologický výzkum. Analýza a interpretace dat: Učebnice, příručka. Petrohrad, 2008.
  • 3. Sidorenko E.V. Metody matematického zpracování v psychologii. Petrohrad, 2010.
  • 4. Soshnikova L.A. a další Vícerozměrná statistická analýza v ekonomii: učebnice, příručka pro vysoké školy. M., 1999.
  • 5. Suchodolskij E.V. Matematické metody v psychologii. Charkov, 2004.
  • 6. Shmoilova R.A., Minashkin V.E., Sadovnikova N.A. Workshop z teorie statistiky: Učebnice, příručka. M., 2009.
  • Gmurman V.E. Teorie pravděpodobnosti a matematická statistika. str. 465.

Šířka intervalu bude:

Xmax je maximální hodnota seskupovací charakteristiky v agregaci.
Xmin je minimální hodnota seskupovací charakteristiky.
Definujme hranice skupiny.

Číslo skupinyDolní hraniceHorní hranice
1 43 45.83
2 45.83 48.66
3 48.66 51.49
4 51.49 54.32
5 54.32 57.15
6 57.15 60

Stejná hodnota atributu slouží jako horní a dolní hranice dvou sousedních (předchozí a následující) skupin.
Pro každou hodnotu řady počítáme, kolikrát spadá do určitého intervalu. Za tímto účelem seřadíme řady ve vzestupném pořadí.
43 43 - 45.83 1
48.5 45.83 - 48.66 1
49 48.66 - 51.49 1
49 48.66 - 51.49 2
49.5 48.66 - 51.49 3
50 48.66 - 51.49 4
50 48.66 - 51.49 5
50.5 48.66 - 51.49 6
51.5 51.49 - 54.32 1
51.5 51.49 - 54.32 2
52 51.49 - 54.32 3
52 51.49 - 54.32 4
52 51.49 - 54.32 5
52 51.49 - 54.32 6
52 51.49 - 54.32 7
52 51.49 - 54.32 8
52 51.49 - 54.32 9
52.5 51.49 - 54.32 10
52.5 51.49 - 54.32 11
53 51.49 - 54.32 12
53 51.49 - 54.32 13
53 51.49 - 54.32 14
53.5 51.49 - 54.32 15
54 51.49 - 54.32 16
54 51.49 - 54.32 17
54 51.49 - 54.32 18
54.5 54.32 - 57.15 1
54.5 54.32 - 57.15 2
55.5 54.32 - 57.15 3
57 54.32 - 57.15 4
57.5 57.15 - 59.98 1
57.5 57.15 - 59.98 2
58 57.15 - 59.98 3
58 57.15 - 59.98 4
58.5 57.15 - 59.98 5
60 57.15 - 59.98 6

Výsledky seskupení uvedeme ve formě tabulky:
SkupinySbírka čís.Frekvence f i
43 - 45.83 1 1
45.83 - 48.66 2 1
48.66 - 51.49 3,4,5,6,7,8 6
51.49 - 54.32 9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26 18
54.32 - 57.15 27,28,29,30 4
57.15 - 59.98 31,32,33,34,35,36 6

Tabulka pro výpočet ukazatelů.
Skupinyx iMnožství, f ix i * f iAkumulovaná frekvence, S|x - x prům. |*f(x - x prům.) 2 *fFrekvence, f i /n
43 - 45.83 44.42 1 44.42 1 8.88 78.91 0.0278
45.83 - 48.66 47.25 1 47.25 2 6.05 36.64 0.0278
48.66 - 51.49 50.08 6 300.45 8 19.34 62.33 0.17
51.49 - 54.32 52.91 18 952.29 26 7.07 2.78 0.5
54.32 - 57.15 55.74 4 222.94 30 9.75 23.75 0.11
57.15 - 59.98 58.57 6 351.39 36 31.6 166.44 0.17
36 1918.73 82.7 370.86 1

Pro vyhodnocení distribuční řady najdeme následující ukazatele:
Indikátory distribučního centra.
Vážený průměr


Móda
Režim je nejběžnější hodnota charakteristiky mezi jednotkami dané populace.

kde x 0 je začátek modálního intervalu; h – intervalová hodnota; f 2 – frekvence odpovídající modálnímu intervalu; f 1 – premodální frekvence; f 3 – postmodální frekvence.
Jako začátek intervalu zvolíme 51,49, protože tento interval představuje největší číslo.

Nejběžnější hodnota řady je 52,8
Medián
Medián rozděluje vzorek na dvě části: polovina je menší než medián, polovina je více.
V intervalové řady distribuce, můžete rovnou určit pouze interval, ve kterém se bude režim nebo medián nacházet. Medián odpovídá opci uprostřed hodnocené série. Medián je interval 51,49 - 54,32, protože v tomto intervalu je akumulovaná frekvence S větší než střední číslo (medián je první interval, jehož akumulovaná frekvence S přesahuje polovinu celkového součtu frekvencí).


Tedy 50 % jednotek v populaci bude mít menší velikost než 53,06
Variační indikátory.
Absolutní variace.
Rozsah variace je rozdíl mezi maximální a minimální hodnotou charakteristiky primární řady.
R = X max - X min
R = 60-43 = 17
Průměrná lineární odchylka- vypočítané tak, aby byly zohledněny rozdíly všech jednotek zkoumané populace.


Každá hodnota řady se od druhé neliší o více než 2,3
Disperze- charakterizuje míru rozptylu kolem své průměrné hodnoty (míra rozptylu, tj. odchylka od průměru).


Nestranný odhad rozptylu- konzistentní odhad rozptylu.


Směrodatná odchylka.

Každá hodnota řady se liší od průměrné hodnoty 53,3 nejvýše o 3,21
Odhad směrodatné odchylky.

Míry relativní variace.
Mezi relativní ukazatele variace patří: koeficient oscilace, lineární koeficient variace, relativní lineární odchylka.
Variační koeficient- míra relativního rozptylu populačních hodnot: ukazuje, jaký podíl průměrné hodnoty této hodnoty tvoří její průměrný rozptyl.

Protože v ≤ 30 %, populace je homogenní a variace je slabá. Získaným výsledkům lze věřit.
Lineární variační koeficient nebo Relativní lineární odchylka- charakterizuje podíl průměrné hodnoty znaménka absolutních odchylek od průměrné hodnoty.

Testování hypotéz o typu distribuce.
1. Ověřte hypotézu, že X je distribuováno přes normální zákon pomocí Pearsonova testu dobré shody.

kde p i je pravděpodobnost zásahu i-tý interval náhodná veličina, distribuované podle hypotetického zákona
Pro výpočet pravděpodobností p i použijeme vzorec a tabulku Laplaceovy funkce

Kde
s = 3,21, xav = 53,3
Teoretická (očekávaná) frekvence je n i = np i , kde n = 36
Intervaly seskupováníPozorovaná frekvence n ix 1 = (x i - x prům.)/sx 2 = (x i+1 - x av)/sF(x 1)F(x 2)Pravděpodobnost vstupu do i-tého intervalu, p i = Ф(x 2) - Ф(x 1)Očekávaná frekvence, 36p iPearsonovy statistické termíny, K i
43 - 45.83 1 -3.16 -2.29 -0.5 -0.49 0.01 0.36 1.14
45.83 - 48.66 1 -2.29 -1.42 -0.49 -0.42 0.0657 2.37 0.79
48.66 - 51.49 6 -1.42 -0.56 -0.42 -0.21 0.21 7.61 0.34
51.49 - 54.32 18 -0.56 0.31 -0.21 0.13 0.34 12.16 2.8
54.32 - 57.15 4 0.31 1.18 0.13 0.38 0.26 9.27 3
57.15 - 59.98 6 1.18 2.06 0.38 0.48 0.0973 3.5 1.78
36 9.84

Stanovme hranici kritické oblasti. Protože Pearsonova statistika měří rozdíl mezi empirickým a teoretickým rozdělením, čím větší je její pozorovaná hodnota K obs, tím silnější je argument proti hlavní hypotéze.
Proto je kritická oblast pro tuto statistiku vždy pravá:

Empirické frekvence

ni

Pravděpodobnosti

Teoretické frekvence
npi

(ni-npi)2

Pearsonův test

Pearsonův test nebo χ 2 test- nejčastěji používané kritérium pro testování hypotézy o distribučním zákoně. V mnoha praktických problémech je přesný zákon rozdělení neznámý, to znamená, že jde o hypotézu, která vyžaduje statistické ověření.

Označme X zkoumanou náhodnou veličinu. Předpokládejme, že chceme otestovat hypotézu H 0, že tato náhodná veličina vyhovuje distribučnímu zákonu F(x). Pro ověření hypotézy vytvoříme vzorek skládající se z n nezávislých pozorování náhodné veličiny X. Pomocí vzorku můžeme sestrojit empirické rozdělení F * (x) zkoumané náhodné proměnné. Srovnání empirických F * (x) a teoretická rozdělení se provádějí pomocí speciálně vybrané náhodné veličiny – kritéria dobré shody. Jedním z těchto kritérií je Pearsonovo kritérium.

Statistika kritérií

Pro kontrolu kritéria se zadávají statistiky:

Kde - odhadovaná pravděpodobnost zásahu i-interval, - odpovídající empirická hodnota, n i- počet prvků vzorku z i-tý interval.

Tato veličina je zase náhodná (kvůli náhodnosti X) a musí se řídit rozdělením χ 2.

Pravidlo kritéria

Před formulováním pravidla pro přijetí nebo zamítnutí hypotézy je nutné vzít v úvahu to Pearsonovo kritérium má pravostrannou kritickou oblast.

Pravidlo.
Pokud získaná statistika překročí kvantil distribučního zákona dané hladiny významnosti se stupni volnosti nebo se stupni volnosti, kde k je počet pozorování nebo počet intervalů (pro případ intervalové variační řady) a p je počet odhadovaných parametrů distribučního zákona, pak je hypotéza zamítnuta. Jinak je hypotéza přijata na zadané hladině významnosti.

Literatura

  • Kendall M., Stewart A. Statistické závěry a souvislosti. - M.: Nauka, 1973.

Viz také

  • Pearsonovo kritérium na webových stránkách Novosibirské státní univerzity
  • Chí-kvadrát testy na stránkách Novosibirské státní technické univerzity (Doporučení pro standardizaci R 50.1.033–2001)
  • O výběru počtu intervalů na webu Novosibirské státní technické univerzity
  • O kritériu Nikulin na webových stránkách Státní technické univerzity v Novosibirsku

Nadace Wikimedia.

2010.

    Podívejte se, co je „Pearsonovo kritérium“ v jiných slovnících:

    Nebo Kolmogorov Smirnov test dobré shody je statistický test používaný k určení, zda se dvě empirická rozdělení řídí stejným zákonem, nebo zda výsledné rozdělení vyhovuje předpokládanému modelu.... ... Wikipedia

    - (maximální kritérium) jedno z kritérií pro rozhodování za podmínek nejistoty. Kritérium extrémního pesimismu. Historie Waldovo kritérium navrhl Abraham Wald v roce 1955 pro vzorky stejné velikosti a poté jej rozšířil na ... Wikipedia

    Wallisův test je určen k testování rovnosti mediánů několika vzorků. Toto kritérium je vícerozměrným zobecněním Wilcoxon-Mann-Whitneyho testu. Kritérium Kruskal Wallis je kritériem pořadí, takže je invariantní s ohledem na jakékoli... ... Wikipedia

    - (F test, φ* test, test nejmenších významných rozdílů) a posteriori statistický test používaný k porovnání rozptylů dvou variační série, tedy určit významné rozdíly mezi skupinovými prostředky v ... ... Wikipedii

    Cochranův test se používá při porovnávání tří nebo více vzorků stejné velikosti. Nesoulad mezi rozptyly se na zvolené hladině významnosti považuje za náhodný, pokud: kde je kvantil náhodné veličiny s počtem sečtených... ... Wikipedie

    Statistický test pojmenovaný po Hubertu Lillieforsovi, profesorovi statistiky na Univerzitě George Washingtona, který je modifikací Kolmogorova-Smirnovova testu. Používá se k testování nulové hypotézy, že vzorek... ... Wikipedie

    Pro vylepšení tohoto článku je žádoucí?: Najděte a uspořádejte ve formě poznámek pod čarou odkazy na věrohodné zdroje potvrzující to, co bylo napsáno. Přidejte ilustrace. T Kréta ... Wikipedie

    Ve statistice se Kolmogorovův test dobré shody (také známý jako Kolmogorov-Smirnovův test dobré shody) používá k určení, zda dvě empirická rozdělení dodržují stejný zákon, nebo k určení, zda ... ... Wikipedia

    kritérium nezávislosti- u kontingenčních tabulek testuje hypotézu, že řádkové a sloupcové proměnné jsou nezávislé. Mezi taková kritéria patří chí-kvadrát test nezávislosti (Pearson) a Fisherův přesný test... Slovník sociologické statistiky

knihy

  • Kritéria pro kontrolu odchylky rozdělení od jednotného zákona. Návod k použití: monografie, Lemeshko B.Yu.. Kniha je určena odborníkům, kteří se v té či oné míře při své činnosti potýkají s problematikou statistické analýzy dat se zpracováním experimentálních výsledků, aplikací ...




chyba: Obsah chráněn!!