Kritérium osoby t test a iné. Pearsonovo kritérium pre kontrolu hypotézy vo forme náhodného práva premenného distribúcie

Štatistické kritérium

Pravidlo, ktorým je hypotéza I 0 zamietnutá alebo akceptuje Štatistické kritérium. Názov kritéria, spravidla obsahuje list, ktorý je označený osobitne zostavenou charakteristikou odseku 2 overovacieho algoritmu Štatistická hypotéza (Pozri bod 4.1), vypočítaný v kritériách. V podmienkach tohto algoritmu by sa kritérium povolalo "v-Prition ".

Pri kontrole štatistickej hypotézy sú možné dva typy chýb:

  • - chyba prvého druhu (Môžem odmietnuť hypotézu I 0, keď je skutočne pravda);
  • - druhá Roda Chyba (Môžete si vziať hypotézu 0, keď nie je naozaj pravda).

Pravdepodobnosť ale Ak chcete povoliť chybu prvého druhu Úroveň významnosti kritéria.

Ak chcete ročník Všimnite si pravdepodobnosť, že povolíte chybu druhého druhu, potom - r) - Pravdepodobnosť prevencie chyby druhého druhu power kritériá.

Kritérium súhlasu X 2 Pearson

Existuje niekoľko typov štatistických hypotéz:

  • - o základe distribúcie práva;
  • - Homogenita vzorky;
  • - Numerické hodnoty distribučných parametrov atď.

Budeme zvážiť hypotézu o distribučnom práve na príklade kritéria súhlasu X 2 Pearsona.

Kritérium súhlasu Zavolajte štatistické kritérium na kontrolu nulovej hypotézy o údajnom zákone neznámej distribúcie.

Kritérium súhlasu Pearsonu je založené na porovnaní empirických (pozorovateľných) a teoretických frekvencií pripomienok vypočítaných za predpokladu určitého distribučného zákona. Hypotéza # 0 je formulovaná nasledovne: Podľa študovanej funkcie je všeobecná hodnota distribuovaná normálne.

Algoritmus na kontrolu štatistickej hypotézy # 0 pre kritériá x 1 Pearson:

  • 1) Predložil som hypotézu 0 - podľa skúšobnej položky, všeobecný agregát je normálne distribuovaný;
  • 2) Vypočítajte selektívnu strednú a selektívnu priemernú kvadratickú odchýlku o v;

3) Na existujúcom objeme vzorky strhnúť Vypočítať špeciálne zostavovanú charakteristiku,

kde: i, - empirické frekvencie, \\ t - teoretické frekvencie, \\ t

p - vzorkovanie

h. - veľkosť intervalu (rozdiel medzi dvomi susednými možnosťami), \\ t

Normalizované hodnoty pozorovaného funkcie, \\ t

- Funkcia tabuľky. Tiež teoretické frekvencie

môže byť vypočítané pomocou štandardného MS Excel funkcie Normarasptu pomocou vzorca;

4) Selektívnou distribúciou určujeme kritickú hodnotu špeciálne zostavenej charakteristiky. xL P.

5) S hypotézou # 0 odmietnuté, s hypotézou # 0 je akceptovaná.

Príklad. Zvážte znamenie X. - hodnota testovacích ukazovateľov odsúdených v jednej z korekčných kolónií pre niektoré psychologické charakteristiky, predložené ako variačné série:

Na úrovni významnosti 0,05 skontrolujte hypotézu o normálnej distribúcii všeobecný agregát.

1. Na základe empirickej distribúcie môžete hypotézu H 0 : Podľa študovanej funkcie "hodnota indikátora testu pre túto psychologickú charakteristiku", všeobecná poľnohospodárska činnosť

normálne rozdelené. Alternatívna hypotéza 1: Podľa testovacieho znaku "veľkosť indikátora testu pre túto psychologickú charakteristiku", všeobecný súbor odsúdených nie je normálne distribuovaný.

2. Vypočítajte číselné funkcie výberu:

Intervaly

x g sh

x) sh

3. Vypočítajte špeciálne zostavovanú charakteristiku J 2. Ak to chcete urobiť, v predposlednom stĺpci predchádzajúcej tabuľky nájdeme teoretické frekvencie podľa vzorca a v poslednom stĺpci

vypočítajte vlastnosti% 2. Prijať x 2 = 0,185.

Pre jasnosť vytvárame polygón empirickej distribúcie a normálnu krivku teoretických frekvencií (obr. 6).

Obr. 6.

4. Určite počet stupňov slobody s.: k \u003d 5, t \u003d 2, s \u003d 5-2-1 \u003d 2.

Podľa tabuľky alebo pomocou štandardnej funkcie MS Excel "HEX0BR" pre počet slobôd 5 \u003d 2 a úroveň významu a \u003d. 0.05 Nájdeme kritickú hodnotu kritéria xL p.=5,99. Pre význam ale \u003d 0,01 kritérií kritických hodnôt x% = 9,2.

5. Pozorovanú hodnotu kritéria h. \u003d 0,185 menej ako všetky nájdené hodnoty HC r .-\u003e Preto je hypotéza I 0 akceptovaná na oboch úrovniach významnosti. Rozdiel empirických a teoretických frekvencií je zanedbateľný. Tieto pozorovania sú preto v súlade s hypotézou o normálnej distribúcii všeobecnej populácie. Tak, podľa študovaného atribútu "hodnota indikátora testovania pre túto psychologickú charakteristiku", je všeobecný súbor odsúdených, je normálne distribuovaný.

  • 1. KULCHENKKO A.V., KULICHENKO A.G. Vyššia matematika a matematické metódy v psychológii: Sprievodca praktickými cvičeniami pre študentov psychologickej fakulty. Ryazan, 1994.
  • 2. vypočutie A.D. Matematické metódy Psychologický výskum. Analýza a interpretácia údajov: Štúdie, prospech. Petrohrad., 2008.
  • 3. SIDORENKO E.V. Metódy matematického spracovania v psychológii. St. Petersburg., 2010.
  • 4. Soshnikova L.A. a ďalšie. Multidimenzionálna štatistická analýza v ekonomike: štúdie, príspevok na univerzity. M., 1999.
  • 5. SUKHODOLSKY E.V. Matematické metódy v psychológii. Kharkov, 2004.
  • 6. Schmeylova R.A., Minashkin V.E., Sadovnikova n.a. Workshop na štatistickej teórii: Štúdie, prospech. M., 2009.
  • GMURMAN V.E. Teória pravdepodobnosti a matematickej štatistiky. P. 465.

Šírka intervalu bude:

Xmax je maximálna hodnota funkcie zoskupenia v agregáte.
XMIN je minimálna hodnota funkcie zoskupenia.
Definujeme hranice skupiny.

Číslo skupiny Spodná čiara Horná hranice
1 43 45.83
2 45.83 48.66
3 48.66 51.49
4 51.49 54.32
5 54.32 57.15
6 57.15 60

Rovnaká hodnota znaku slúži ako horné a dolné hranice dvoch susedných (predchádzajúcich a následných) skupín.
Pre každú hodnotu riadku budeme vypočítať, koľkokrát vstupuje do konkrétneho intervalu. Aby sme to urobili, triedime riadok vzostupne.
43 43 - 45.83 1
48.5 45.83 - 48.66 1
49 48.66 - 51.49 1
49 48.66 - 51.49 2
49.5 48.66 - 51.49 3
50 48.66 - 51.49 4
50 48.66 - 51.49 5
50.5 48.66 - 51.49 6
51.5 51.49 - 54.32 1
51.5 51.49 - 54.32 2
52 51.49 - 54.32 3
52 51.49 - 54.32 4
52 51.49 - 54.32 5
52 51.49 - 54.32 6
52 51.49 - 54.32 7
52 51.49 - 54.32 8
52 51.49 - 54.32 9
52.5 51.49 - 54.32 10
52.5 51.49 - 54.32 11
53 51.49 - 54.32 12
53 51.49 - 54.32 13
53 51.49 - 54.32 14
53.5 51.49 - 54.32 15
54 51.49 - 54.32 16
54 51.49 - 54.32 17
54 51.49 - 54.32 18
54.5 54.32 - 57.15 1
54.5 54.32 - 57.15 2
55.5 54.32 - 57.15 3
57 54.32 - 57.15 4
57.5 57.15 - 59.98 1
57.5 57.15 - 59.98 2
58 57.15 - 59.98 3
58 57.15 - 59.98 4
58.5 57.15 - 59.98 5
60 57.15 - 59.98 6

Výsledky vydania zoskupenia vo forme tabuľky: \\ t
Skupina Úprava Frekvencia F. i.
43 - 45.83 1 1
45.83 - 48.66 2 1
48.66 - 51.49 3,4,5,6,7,8 6
51.49 - 54.32 9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26 18
54.32 - 57.15 27,28,29,30 4
57.15 - 59.98 31,32,33,34,35,36 6

Tabuľka pre výpočet ukazovateľov.
Skupina X I. Množstvo, F I X I * F I Akumulovaná frekvencia, S X - X CP | * F (X - X CP) 2 * F Frekvencia, F I / N
43 - 45.83 44.42 1 44.42 1 8.88 78.91 0.0278
45.83 - 48.66 47.25 1 47.25 2 6.05 36.64 0.0278
48.66 - 51.49 50.08 6 300.45 8 19.34 62.33 0.17
51.49 - 54.32 52.91 18 952.29 26 7.07 2.78 0.5
54.32 - 57.15 55.74 4 222.94 30 9.75 23.75 0.11
57.15 - 59.98 58.57 6 351.39 36 31.6 166.44 0.17
36 1918.73 82.7 370.86 1

Ak chcete odhadnúť niekoľko distribúcie, nájdeme tieto ukazovatele:
Ukazovatele distribučného centra.
Stredne vážený


Móda
Móda - najbežnejší význam znamenia v jednotkách tejto sady.

kde X 0 je začiatkom intextu modálneho; H - veľkosť intervalu; F2-ZAPNUTIE, ZAHRNUTIE MODAL Interval; F 1 - Pred správnou frekvenciou; F 3 - Poštová frekvencia.
Vyberáme sa ako začiatok intervalu 51.49, pretože je to pre tento interval najväčší počet.

Najčastejšou hodnotou riadku je 52,8
Medián
Medián rozdeľuje vzorku do dvoch častí: polovica voľby je menej medián, polovica - viac.
V riadku intervalu distribúcie môžete okamžite špecifikovať iba interval, v ktorom bude umiestnený móda alebo medián. Medián zodpovedá možnosti, ktorá stojí v strede rady. Medián je interval 51.49 - 54,32, pretože V tomto intervale sa akumulovaná frekvencia S, viac mediánskeho čísla (medián nazýva prvý interval, ktorej akumulovaná frekvencia presahuje polovicu celkovej frekvenčnej sumy).


50% jednotiek agregátu bude teda menšie ako vo veľkosti 53.06
Ukazovatele variácie.
Absolútne ukazovatele variácie.
Odchýlka variácie je rozdiel medzi maximálnymi a minimálnymi hodnotami znaku primárneho riadku.
R \u003d x max - x min
R \u003d 60 - 43 \u003d 17
Stredná lineárna odchýlka - vypočítať, aby sa zohľadnili rozdiely medzi všetkými jednotkami celkovej celistvosti.


Každá hodnota série sa líši od druhého viac ako 2,3
Disperzia - charakterizuje mieru rozptylu v blízkosti jej priemeru (disperzné opatrenie, t.j. odchýlky od priemeru).


Nezmenené vyhodnotenie disperzie - bohaté vyhodnotenie disperzie.


Priemerná kvadratická odchýlka.

Každá hodnota riadku sa líši od priemernej hodnoty 53,3 nie viac ako 3,21
Posúdenie štandardnej odchýlky.

Relatívne ukazovatele variácie.
Relatívne variácie zahŕňajú: Koeficient oscilácie, lineárny koeficient Variácie, relatívna lineárna odchýlka.
Variácie koeficientu - Meranie relatívneho rozptylu súborov agregátu: ukazuje, že podiel priemernej hodnoty tejto hodnoty je jeho priemerná variácia.

Pretože v ≤ 30%, potom je agregát homogénny a variácia je slabá. Získané výsledky môžu byť dôveryhodné.
Lineárny koeficient variácie alebo Relatívna lineárna odchýlka - charakterizuje podiel priemernej hodnoty znamenia absolútnych odchýlok od priemernej hodnoty.

Kontrola hypotéz na formulári distribúcie.
1. Skontrolujte hypotézu, že X je distribuovaná normálny zákon Pomocou kritéria pre súhlas Pearsona.

kde p je pravdepodobnosť návratu i-interval náhodná premennáDistribuované hypotetickým zákonom
Na výpočet pravdepodobnosti P I, aplikujeme vzorec a tabuľku funkcie Laplace

kde
s \u003d 3,21, X CP \u003d 53,3
Teoretická (očakávaná) frekvencia je n i \u003d np i, kde n \u003d 36
Zoskupenie intervalov Pozorovaná frekvencia n i X 1 \u003d (X I - X CP) / S x 2 \u003d (x i + 1 - x cp) / s F (x 1) F (x 2) Pravdepodobnosť vstupu do I-th intervalu, p i \u003d f (x 2) - f (x 1) Očakávaná frekvencia, 36P Továreň Štatistika Pearson, K i
43 - 45.83 1 -3.16 -2.29 -0.5 -0.49 0.01 0.36 1.14
45.83 - 48.66 1 -2.29 -1.42 -0.49 -0.42 0.0657 2.37 0.79
48.66 - 51.49 6 -1.42 -0.56 -0.42 -0.21 0.21 7.61 0.34
51.49 - 54.32 18 -0.56 0.31 -0.21 0.13 0.34 12.16 2.8
54.32 - 57.15 4 0.31 1.18 0.13 0.38 0.26 9.27 3
57.15 - 59.98 6 1.18 2.06 0.38 0.48 0.0973 3.5 1.78
36 9.84

Určiť hranicu kritickej oblasti. Keďže štatistiky Personon merajú rozdiel medzi empirickými a teoretickými distribúciami, tým viac jeho pozorovanou hodnotou K pupku, tým silnejší argument proti hlavnej hypotéze.
Preto je kritická oblasť pre túto štatistiku vždy pravú ruku:

Empirické frekvencie

ni.

Pravdepodobnosť
pi

Teoretické frekvencie
nPI

(NI-NPI) 2

Kritériá Pearson

Kritériá Pearsonalebo kritérium χ 2. - najčastejšie používané kritérium na kontrolu hypotézy o zákone o distribúcii. V mnohých praktických úlohách nie je presná distribučná zákonná, to znamená, že je to hypotéza, ktorá si vyžaduje štatistické overenie.

Označujú X výslednú náhodnú hodnotu. Nechajte to skontrolovať hypotézu H. 0, že táto náhodná hodnota obetuje zákon o distribúcii F.(x.). Ak chcete otestovať hypotézu, urobíme vzorku pozostávajúcu z n nezávislých pozorovaní na náhodné variabilné X. Od vzorky môžete vybudovať empirickú distribúciu F. * (x.) Základná náhodná premenná. Porovnanie empirického F. * (x.) A teoretické distribúcie sú vyrobené pomocou špeciálne vybranej náhodnej premennej - kritérium súhlasu. Jedným z týchto kritérií je kritériom Pearsona.

Štatistika CRITRIA

Na overenie kritéria sa zadávajú štatistiky:

kde - odhadovaná pravdepodobnosť pádu i. - a interval je zodpovedajúca empirická hodnota, \\ t n. i. - počet prvkov vzorky z i. -HO interval.

Táto hodnota je náhodná (na základe nehody x) a musí dodržiavať distribúciu χ 2.

Pravidlo kritérií

Pred formulovaním pravidla prijatia alebo odmietnutia hypotézy je potrebné zvážiť, že kritérium Pearson má pravú kritickú oblasť.

Pravidlo.
Ak sa získané štatistiky presiahne kvantifikáciu distribučného zákona danej úrovne významnosti s alebo s stupňami slobody, kde K predstavuje počet pozorovaní alebo počet intervalov (pre prípad intervalového variačného série) a p je Počet ocenených parametrov distribučného zákona, hypotéza je zamietnutá. V opačnom prípade sa hypotéza akceptuje na danej úrovni významnosti.

Literatúra

  • Kendall M., stoutuart A. Štatistické závery a komunikácie. - m.: Veda, 1973.

pozri tiež

  • Kritérium Pearson na internetovej stránke Štátnej univerzity Novosibirska
  • Kritériá typu CHI-Square na internetovej stránke NOVOSIBIBIRK Štátnej technickej univerzity (odporúčania pre normalizáciu R 50.1.033-2001)
  • O výbere počtu intervalov na internetovej stránke NOVOSIBIRIK ŠTÁTNYCH TECHNICITION
  • O kritériách Nikuliny na internetovej stránke Štátnej technickej univerzity Novosibirska

Nadácia Wikimedia. 2010.

Sledujte, čo je "kritériá Pearson" v iných slovníkoch:

    Kritérium osoby alebo kritérium χ² (Hee Square) je najčastejšie používaným kritériom na testovanie hypotézy o distribučnom práve. V mnohých praktických úlohách je presné distribučné právo neznáme, to znamená, že je hypotéza, ktorá ... ... Wikipedia

    Alebo kritérium súhlasu Kolmogorova Smirnov, štatistické kritérium použité na určenie, či dve empirické rozdelenie podliehajú jednému zákonu, alebo či je získaná distribúcia určeného modelu podriadená. ... ... Wikipedia

    - (maximen kritérium) jeden z rozhodovacích kritérií v podmienkach neistoty. Kritériá extrémneho pesimizmu. História kritériá Walda navrhla Abrahám Waldom v roku 1955 pre vzorky rovnakého objemu, a potom distribuované ... Wikipedia

    Wallis je navrhnutý tak, aby otestoval rovnosť mediánu niekoľkých vzoriek. Toto kritérium je multidimenzionálna zovšeobecnenie kritéria Wilcoxon Mann Whitney. Kritériom Wallisovho kolapsu je hodnosť, takže je invariantný voči kohokoľvek ... ... Wikipedia

    - (kritérium F, φ * Kritérium, kritérium najmenej významného rozdielu) Posteriori štatistické kritérium používané na porovnanie disperzií dvoch variačná sériaTo znamená, že určiť zmysluplné rozdiely medzi priemernými priemermi v ... ... Wikipedia

    Kritérium Kohrena sa používa pri porovnávaní troch alebo viacerých vzoriek rovnakého objemu. Rozdiel medzi disperziami je považovaný za náhodný s zvolenou úrovňou významnosti, ak: kde je kvantitatívna náhodná premenná s počtom sústredených ... Wikipedia

    Štatistické kritérium pomenované po Hubertovi Lillifeors, profesor štatistiky Univerzity Georgea Washingtonu, ktorý je modifikáciou Kolmogorov-Smirnovho kritéria. Používa sa na kontrolu nulovej hypotézy, ktorú vzorka ... ... Wikipedia

    Na zlepšenie tohto článku je žiaduce?: Nájdite a usporiadajte vo forme poznámok odkazov na autoritatívne zdroje potvrdzujúce písomné. Pridať obrázok. T Kréta ... Wikipedia

    V štatistike sa kritériom pre súhlas Kolmmogorov (tiež známy ako kritérium súhlasu Kolmmogorova Smirnov) používa na určenie, či dve empirické rozdelenia podliehajú jednému zákonu, alebo určiť, či ... Wikipedia

    kritérium nezávislosti - Pre konjuccie tabuľky kontroluje hypotézu, že premenné premenné reťazca a stĺpca sú nezávislé. Takéto kritériá zahŕňajú kritériá nezávislosti CH Square (Pearson) a presné kritérium Fisher ... Slovník sociologických štatistík

Knihy

  • Kritériá na kontrolu odchýlky rozdelenia z jednotného zákona. Sprievodca pre použitie: Monografia, LEMESHKO B.YU .. Kniha je určená pre špecialistov, do jedného stupňa alebo iného kolízny v ich aktivitách s otázkami štatistickej analýzy údajov so spracovaním experimentov, používania ...


chyba:Obsah je chránený!