Nivelul de semnificație în testul Pearson. criteriul lui Pearson

Scopul criteriului χ 2 - Criteriul lui Pearson Criteriul χ 2 este utilizat în două scopuri: 1) pentru a compara distribuția empirică a unei trăsături cu cea teoretică - uniformă, normală sau alta; 2) pentru a compara două, trei sau mai multe distribuții empirice ale aceleiași caracteristici. Descrierea criteriului Criteriul χ 2 răspunde la întrebarea dacă sensuri diferite trăsătură în distribuții empirice și teoretice sau în două sau mai multe distribuții empirice. Avantajul metodei este că permite compararea distribuțiilor de caracteristici prezentate la orice scară, pornind de la scara numelor. În cel mai simplu caz al distribuției alternative „da – nu”, „a permis căsătoria – nu a permis căsătoria”, „a rezolvat problema – nu a rezolvat problema”, etc., putem aplica deja criteriul χ 2 . Cu cât discrepanța dintre două distribuții comparabile este mai mare, cu atât valoarea empirică a lui χ 2 este mai mare. Calculul automat al χ 2 - criteriul lui Pearson Pentru a calcula automat χ 2 - criteriul lui Pearson, este necesar să se efectueze doi pași: Pasul 1. Precizați numărul de distribuții empirice (de la 1 la 10); Pasul 2. Introduceți frecvențele empirice în tabel; Pasul 3. Obțineți un răspuns.

Avantajul criteriului Pearson este universalitatea acestuia: poate fi folosit pentru a testa ipoteze despre diverse legi de distribuție.

1. Testarea ipotezei unei distribuții normale.

Să se obțină o probă de o dimensiune suficient de mare P cu multe sensuri diferite opțiune. Pentru comoditatea procesării sale, împărțim intervalul de la cea mai mică la cea mai mare dintre valorile variantei prin s părți egale și vom presupune că valorile opțiunilor care se încadrează în fiecare interval sunt aproximativ egale cu numărul care specifică mijlocul intervalului. După ce am numărat numărul de opțiuni care au intrat în fiecare interval, vom face așa-numitul eșantion grupat:

Opțiuni……….. X 1 X 2 … x s

frecvențe…………. P 1 P 2 … n s ,

Unde x i sunt valorile punctelor medii ale intervalelor și n i este numărul de opțiuni incluse în i al-lea interval (frecvențe empirice).



Pe baza datelor obținute, este posibil să se calculeze media eșantionului și abaterea standard a eșantionului σ B. Să verificăm ipoteza că populația generală este distribuită conform legii normale cu parametri M(X) = , D(X) = . Apoi puteți găsi numărul de numere din eșantionul de volum P, care ar trebui să fie în fiecare interval sub această ipoteză (adică frecvențe teoretice). Pentru a face acest lucru, folosind tabelul de valori al funcției Laplace, găsim probabilitatea de a lovi i- al-lea interval:

,

Unde un iȘi b i- granițe i- al-lea interval. Înmulțind probabilitățile rezultate cu dimensiunea eșantionului n, găsim frecvențele teoretice: p i = n p i.Scopul nostru este să comparăm frecvențele empirice și teoretice, care, desigur, diferă între ele, și să aflăm dacă aceste diferențe sunt nesemnificative, nu infirmă ipoteza distribuției normale a variabilei aleatoare studiate, sau sunt așa. mare că contrazic această ipoteză. Pentru aceasta, se folosește un criteriu sub forma unei variabile aleatoare

. (20.1)

Sensul ei este evident: se însumează părțile, care sunt pătratele abaterilor frecvențelor empirice de la cele teoretice de la frecvențele teoretice corespunzătoare. Se poate dovedi că indiferent de legea distribuţiei propriu-zisă populatia legea distribuției unei variabile aleatoare (20.1) tinde spre legea distribuției (vezi prelegerea 12) cu numărul de grade de libertate k = s - 1 – r, Unde r este numărul de parametri ai distribuției estimate estimați din datele eșantionului. Distributie normala are doi parametri, deci k = s - 3. Pentru criteriul selectat se construiește o regiune critică de dreapta, determinată de condiție

(20.2)

Unde α - nivelul de semnificație. Prin urmare, regiunea critică este dată de inegalitate iar zona de acceptare a ipotezei este .

Deci, pentru a testa ipoteza nulă H 0: populația este distribuită în mod normal - trebuie să calculați valoarea observată a criteriului din eșantion:

, (20.1`)

și conform tabelului punctelor critice ale distribuției χ 2 găsiți punctul critic folosind valorile cunoscute ale lui α și k = s - 3. Dacă - se acceptă ipoteza nulă, dacă se respinge.

2. Testarea ipotezei distribuţiei uniforme.

Când se utilizează testul Pearson pentru a testa ipoteza unei distribuții uniforme a populației generale cu o densitate de probabilitate presupusă

este necesar, după calcularea valorii din eșantionul disponibil, estimarea parametrilor AȘi b dupa formulele:

Unde A*Și b*- estimări AȘi b. Într-adevăr, pentru o distribuție uniformă M(X) = , , de unde puteți obține un sistem de determinare A*Și b*: , a cărui soluție sunt expresiile (20.3).

Apoi, presupunând că , puteți găsi frecvențele teoretice folosind formulele

Aici s este numărul de intervale în care este împărțit eșantionul.

Valoarea observată a criteriului Pearson se calculează prin formula (20.1`), iar valoarea critică se calculează din tabel, ținând cont de faptul că numărul de grade de libertate k = s - 3. După aceea, limitele regiunii critice se determină în același mod ca și pentru testarea ipotezei unei distribuții normale.

3. Testarea ipotezei despre distribuția exponențială.

În acest caz, împărțind eșantionul existent în intervale de lungime egală, considerăm o secvență de opțiuni echidistantă între ele (presupunem că toate opțiunile care se încadrează în i--lea interval, ia o valoare care coincide cu mijlocul său) și frecvențele corespunzătoare n i(numărul de opțiuni de eșantion incluse în i– al-lea interval). Calculăm din aceste date și luăm ca estimare a parametrului λ valoare . Apoi frecvențele teoretice sunt calculate prin formula

Apoi, se compară valorile observate și critice ale criteriului Pearson, ținând cont de faptul că numărul de grade de libertate k = s - 2.

La verificare ipotezele statistice asupra corespondenței parametrilor individuali cu legea de distribuție a variabilelor aleatoare s-a presupus că sunt cunoscute legile de distribuție a acestor variabile. Cu toate acestea, la rezolvarea problemelor practice (în special a celor economice), modelul dreptului distribuției în caz general nu este cunoscut dinainte, prin urmare, devine necesar să se aleagă un model al legii de distribuție care să fie în concordanță cu rezultatele observațiilor eșantionului.

Lăsa x 1 , x 2 ,...,x n este un eșantion de observații ale unei variabile aleatorii X cu funcție de distribuție continuă necunoscută F(x). Ipoteza in curs de testare H 0, afirmând că X distribuite conform legii având funcţia de repartizare F(x), egală cu funcția F 0 (x), adică se testează ipoteza nulă.

Se numesc criteriile prin care se testează ipoteza nulă a unei distribuții necunoscute criteriile de consimțământ. Luați în considerare testul de bunăstare a potrivirii lui Pearson.

Schema de testare a ipotezei nule :

1. După probă x 1 , x 2 ,..., x n se construiesc serie de variații; poate fi fie discret, fie interval. Luați în considerare, pentru certitudine, seria variațională discretă

x i x 1 x2 ... x k-1 x k
m i m 1 m2 ... m k-1 m k

2. Conform studiilor anterioare sau conform datelor preliminare, aceștia fac o presupunere (acceptă o ipoteză) despre modelul legii de distribuție a unei variabile aleatoare X.

3. În conformitate cu datele eșantionului, sunt evaluați parametrii modelului selectat ai legii de distribuție. Să presupunem că legea distribuției are r parametrii (de exemplu, legea binomială are un singur parametru p; normal - doi parametri ( a 0 , σx) etc.).

4. Înlocuind estimările eșantionului ale valorilor parametrilor de distribuție, găsiți valorile teoretice ale probabilităților

, i=1,2,..., k.

5. Calculați frecvențele teoretice , unde .

6. Calculați valoarea testului de bunăstare a potrivirii lui Pearson

.

Această cantitate at tinde spre o distribuție cu grade de libertate. Prin urmare, tabelele de distribuție sunt utilizate pentru calcule.

7. Având în vedere nivelul de semnificație α, găsiți regiunea critică (este întotdeauna dreptaci); valoarea se determină din raport . Dacă valoarea numerică se încadrează în intervalul , atunci ipoteza este respinsă și se acceptă o ipoteză alternativă conform căreia modelul ales al legii de distribuție nu este confirmat de datele eșantionului, în timp ce este permisă o eroare, a cărei probabilitate este egală cu α .

Sarcina 6. Biletul de examen la matematică conține 10 sarcini. Lăsa Xvaloare aleatorie numărul de probleme rezolvate de candidați la examenul de admitere. Rezultatele examenului de matematică pentru 300 de candidați sunt următoarele:



i
x i
m i

X.

Soluţie. A face o ipoteză despre modelul legii de distribuție a unei variabile aleatoare X Să facem următoarele ipoteze:

probabilitatea de a rezolva o problemă nu depinde de rezultatul rezolvării altor probleme;

Probabilitatea de a rezolva orice problemă dată este aceeași și egală cu p, iar probabilitatea de a nu rezolva problema este egală cu q=1-p.

Cu aceste presupuneri, se poate presupune că X subordonat legea binomială distributie (ipoteza nula), i.e. probabilitatea ca elevul să decidă X sarcini, pot fi calculate prin formula

Să găsim estimarea parametrului p incluse în modelul (1).

Aici p este probabilitatea ca elevul să rezolve problema. Estimarea probabilității p este frecvența relativă p*, care se calculează prin formula

,

unde este numărul mediu de probleme rezolvate de un solicitant;

v- numărul de sarcini rezolvate de fiecare solicitant.

Apoi estimarea pentru p intram in forma

Înlocuiți valorile p*=0,6Și q*=1-0,6=0,4în expresia (1) și pentru diferit x i obţinem probabilităţi şi frecvenţe teoretice (Tabelul 1).

tabelul 1

Număr de grup i x i
0,0001 0,03
0,0016 0,48
0,0106 3,18
0,0425 12,75
0,1115 33,45
0,2007 60,21
0,2508 75,24
0,2150 64,50
0,1209 36,27
0,0403 12,09
0,0060 1,80

Tabelul arată că pentru grupele 1, 2, 3 și 11 frecvența teoretică este . Astfel de grupuri se unesc de obicei cu cele vecine. Valorile pentru grupurile 1, 2 și 3 pot fi combinate cu . Acest lucru pare firesc, deoarece pentru 0, 1, 2 și 3 probleme rezolvate la examen se acordă de obicei o notă nesatisfăcătoare. Combinăm și grupa 11 cu grupa 10 și facem un tabel. 2.



masa 2

Număr de grup i
x i 0-3 9-10
m i

Conform Tabelului. 2 calculați valoarea criteriului acordului:

Să setăm nivelul de semnificație α=0,05, apoi pentru gradele de libertate .

Valoare deci ipoteza nulă trebuie respinsă.

Sarcina 7. Rezultatele cântăririi a 50 de pachete de ceai alese aleatoriu sunt prezentate mai jos (în grame):

150, 147, 152, 148, 149, 153,. 151, 150,149, 147, 153, 151, 152, 151, 149, 152, 150, 148, 152, 150, 152, 151, 148, 151, 152, 150, 151, 149, 148, 149, 150, 150, 151, 149, 151, 150, 151, 150, 149, 148, 147, 153, 147, 152, 150, 151, 149, 150, 151, 153.

Estimați legea distribuției unei variabile aleatoare X– greutatea unui pachet de ceai – pentru nivelul de semnificație α=0,05.

Soluţie. Masa unui pachet de ceai este o variabilă aleatorie continuă, dar datorită faptului că cântărirea a fost efectuată cu o discreție de 1 g și intervalul este de 147÷153 g, cantitate continuă poate fi reprezentat ca un discret serie variațională:

Tabelul 1.

Ca model al legii distribuției, alegem legea normală, al cărei număr de parametri este r=2: un 0valorea estimata, σ X este abaterea standard.

Pe baza datelor eșantionului, obținem estimări pentru parametrii legii distribuției normale:

;

, s=1,68.

Pentru a calcula frecvențele teoretice, folosim valorile tabelare ale funcției Laplace Ф( z). Algoritmul de calcul este următorul:

Găsim prin valori normalizate ale unei variabile aleatorii Z valori Ф( z), și apoi FN(X):

, .

De exemplu,

x 1=147; z1\u003d (147 - 150,14) / 1,68 \u003d -1,87; Ф(–1,87)= –0,46926; FN(147)=0,03074;

Găsi ;

Găsim , iar dacă unele , atunci grupurile corespunzătoare sunt combinate.

Rezultatele calculului și sunt date în tabel. 2.

Conform tabelului, găsim conform schemei: pentru nivelul de semnificație și numărul de grade de libertate. De aici regiunea critică.

Valoarea nu este inclusă în regiunea critică, deci ipoteza că variabila aleatoare X- masa unui pachet de ceai - este supusă legii de distribuție normală, în conformitate cu datele eșantionului.

masa 2

i x i +x i +1 m i F( z i) FN(x i) FN(x i+1) =FN(x i+1)– –FN(x i)
–∞÷147 –0,50000 0,00000 0,03074 0,03074 1,537 -
147÷148 –0,46926 0,03074 0,10204 0,07130 3,563 0,237
148÷149 –0,39796 0,10204 0,24825 0,14621 7,31 0,730
149÷150 –0,25175 0,24825 0,46812 0,21987 10,99 0,813
150÷151 –0,03188 0,46812 0,69497 0,22685 11,34 0,010
151÷152 0,19497 0,69497 0,86650 0,17153 8,58 0,683
152÷153 0,36650 0,86650 0,95543 0,08893 4,45 2,794
153÷∞ 0,45543 0,95543 1,00000 0,04457 2,23 -
Σ=50 Σ=1,00000 Σ=5,267

Scopul lecțiilor: Să insufle elevilor abilitățile de testare a ipotezelor statistice. inversa Atentie speciala privind asimilarea conceptelor legate de testarea ipotezelor (test statistic, erori 1 Și 2 amabil etc.). După rezolvarea fiecărei probleme, discutați despre alte opțiuni pentru concluzii cu niveluri diferite și diferite de semnificație.

Pentru această sesiune, ar trebui să pregătiți răspunsuri la următoarele întrebări:

1. Cum se modifică probabilitățile de a face o eroare de primul și al doilea fel odată cu creșterea dimensiunii eșantionului?

2. Probabilitățile de a face erori de primul și al doilea fel depind de tipul de ipoteză alternativă, de criteriul aplicat?

3. Care este caracterul unilateral al testelor de semnificație statistică?

4. Este posibil, folosind un test de semnificație statistică, să concluzionați: „Ipoteza nulă testată este adevărată”?

5. Care este diferența dintre a construi o regiune critică cu două fețe și a construi interval de încredere pentru acelasi parametru?

Sarcina 1. au fost cercetate 200 piese finite pentru abaterea dimensiunii reale de la cea calculată. Datele grupate de cercetare sunt prezentate în Tabelul 5.

Tabelul 5

Construiți o histogramă pentru această serie statistică. După forma histogramei, formulați o ipoteză despre forma legii de distribuție (de exemplu, sugerați că valoarea studiată are o lege de distribuție normală). Selectați parametrii legii de distribuție (egale cu estimările lor pe baza datelor experimentale). Pe același grafic, construiți o funcție de densitate de probabilitate corespunzătoare ipotezei prezentate. Utilizând testul de potrivire, verificați dacă ipoteza este în concordanță cu datele experimentale. Luați nivelul de semnificație, de exemplu, egal cu 0,05 .

Soluţie. Pentru a ne face o idee despre forma legii de distribuție a cantității studiate, construim o histogramă. Pentru a face acest lucru, construim un dreptunghi pe fiecare interval, aria lui care este numeric egală cu frecvența de cădere în interval.


(fig.8.)

Prin forma histogramei, se poate presupune că valoarea studiată are o lege de distribuție normală. Estimăm parametrii legii distribuției normale (așteptările matematice și varianța) pe baza datelor experimentale, considerând mijlocul acestuia ca reprezentativ al fiecărui interval:

.

Deci, am înaintat ipoteza că valoarea studiată are o lege de distribuție normală N(5;111,6), adică are o funcție de densitate de probabilitate

.

Este mai convenabil să-i construiți graficul folosind tabele de funcții

.

De exemplu, punctul maxim și, respectiv, punctele de inflexiune au ordonate

Să calculăm măsura discrepanței dintre ipoteza propusă și datele experimentale, i.e. . Pentru a face acest lucru, mai întâi calculăm probabilitățile pentru fiecare interval în conformitate cu ipoteza

De asemenea,

Este convenabil să efectuați calculul scriind înregistrarea după cum urmează:

0,069 0,242 0,362 0,242 0,069 13,8 48,4 72,4 48,4 23,8 5,2 -6,4 -1,4 7,5 -1,8 -27,04 40,96 1,96 57,76 3,24 1,96 0,85 0,02 1,19 0,23

Deci, valoarea este calculată. Să construim o regiune critică pentru nivelul de semnificație. Numărul de grade de libertate pentru este egal cu 2 (numărul de intervale , iar trei legături sunt suprapuse pe: , și . Ca rezultat, ). Pentru un anumit nivel de semnificație și numărul de grade de libertate, găsim din tabel distribuția unei astfel de valori care .

În cazul nostru, și intervalul [ 5,99; ¥). Valoarea nu este în regiunea critică. Concluzie: ipoteza nu contrazice datele experimentale (ceea ce nu înseamnă, desigur, că ipoteza este corectă).

Sarcina 2. La fel de serii statistice sunt date date grupate privind timpul de funcționare a 400 de dispozitive:

Sunt aceste date în concordanță cu ipoteza că timpul de funcționare al dispozitivului are o funcție de distribuție integrală? ? Luați nivelul de semnificație, de exemplu, egal cu 0,02 .

Soluţie. Să calculăm probabilitățile care, în conformitate cu ipoteza, cad pe intervalele:

p =P(0 ;

p =P(500

p =P(1000

p = P(1500

Calculați c.

n i pi np i n i - np i (n i - np i) 2 (n i -np i) / np i
0,6324 0,2325 0,0852 0,0317 252,96 34,08 12,68 4,04 -15 14,92 3,32 16,32 222,6 11,02 0,06 2,42 6,53 0,87

Numărul de grade de libertate este de trei, deoarece numai o constrângere este impusă pentru 4 valori ale lui n Sn = n (r =4 -1=3). Pentru trei grade de libertate și nivel de semnificație b=0,02 găsim din tabelul de distribuţie c valoarea critică c =9,84. Valoarea c =9,88 este inclusă în regiunea critică. Concluzie: ipoteza contrazice datele experimentale. Respingem ipoteza și probabilitatea ca să greșim este de 0,02.

Sarcina 3. monedă aruncată 50 o singura data. 32 a căzut stema. Cu ajutorul testului de bunăstare a potrivirii „ chi-pătrat” verificați dacă aceste date sunt în concordanță cu ipoteza că moneda era simetrică.

Soluţie. Emitem ipoteza că moneda era simetrică, adică probabilitatea ca stema să cadă este 1/2 . Din experiența noastră, stema a căzut 32 ori şi 18 odată ce o cifră a căzut Calculați valoarea c V .

n i pi np i n i - np i (n i - np i) (n i - np i) / np i
1/2 1/2 1,96 1,96

Numărul de grade de libertate pentru c este r = 2–1=1; întrucât există doi termeni și o legătură este impusă pe n ν + v=50.

Pentru numărul de grade de libertate r=1și nivelul de semnificație, de exemplu, egal cu p=0,05 aflăm din tabelul de distribuţie c că P( c 3,84)=0,05 , adică regiunea valorilor critice c la nivelul de semnificație p=0,05 va fi un interval [ 3.84; ). Valoarea calculată c =3,92 cade în regiunea critică, ipoteza este respinsă. Probabilitatea ca să greșim este 0,05 .

Sarcina 4. Producătorul susține că numai în acest lot mare de produse 10% produse de calitate scăzută. Cinci produse au fost selectate la întâmplare și printre acestea au fost trei produse de calitate scăzută. Folosind lema Neyman-Pearson, construiți un criteriu și testați ipoteza conform căreia procentul produselor de calitate scăzută este într-adevăr egal cu 10 (p=0,1) față de alternativa că procentul de produse nede calitate scăzută este mai mare 10 (p=p>p). Probabilitatea erorii de tip I »0.01, adică include atât de multe puncte în regiunea critică încât probabilitatea de a respinge ipoteza testată, dacă este adevărată, este 0,01 . Această probabilitate este atribuită aproximativ pentru a nu recurge la randomizare, despre care elevii habar nu au. Dacă p=0,6, atunci care este probabilitatea unei erori de tip II?

Soluţie. Conform ipotezei p 0 \u003d 0,1 cu sens alternativ p>p . Conform lemei Neumann-Pearson, regiunea critică ar trebui să includă acele valori k, pentru care

= >C,

Unde CU este o constantă

,

k+ (5-k) ,

.

Deoarece , expresia din paranteză este nenegativă. De aceea

Aceasta înseamnă că regiunea critică ar trebui să includă pe cele ale valorilor {0,2,1,3,4,5} , care sunt mai mari decât unele , în funcție de nivelul de semnificație (de probabilitatea unei erori de primul fel). Pentru a determina în ipoteza că ipoteza este adevărată, calculăm probabilitățile

Dacă regiunea critică include valorile {3,4,5} , atunci probabilitatea unei erori de primul fel va fi egală cu

În condițiile problemei, s-a dovedit că dintre cele cinci au verificat trei produse defecte. Valoarea intră în regiunea critică. Respingem ipoteza în favoarea unei alternative, iar probabilitatea ca o facem în mod eronat este mai mică 0,01 .

Probabilitatea unei erori de tip II este probabilitatea de a accepta o ipoteză atunci când aceasta nu este adevărată. Ipoteza va fi acceptată la . Dacă probabilitatea de a fabrica un produs defect este de fapt egală cu , atunci probabilitatea de a accepta o ipoteză falsă este egală cu

Sarcina 5. Se știe că, odată cu amestecarea temeinică a aluatului, stafidele sunt distribuite în el aproximativ conform legii lui Poisson, adică. probabilitatea de a avea stafide într-o chiflă este de aproximativ , unde este numărul mediu de stafide per chiflă. Când coaceți chifle cu stafide, se bazează standardul 1000 chifle 9000 stafide. Există o suspiciune că s-au adăugat mai puține stafide în aluat decât este cerut de standard. Pentru verificare, se selectează o chiflă și se numără stafidele din ea. Construiți un criteriu de testare a cărui ipoteză este împotriva alternativei. Probabilitatea unei erori de tip I este considerată a fi de aproximativ 0,02.

Soluţie. Pentru a testa ipoteza: față de alternativa din lema Neyman-Pearson, regiunea critică ar trebui să includă acele valori pentru care

unde este o constantă.

Atunci n 1 H 1, întrucât valabilitatea sa înseamnă eficacitatea aplicării noii tehnologii).

Valoarea reală a criteriului statistic

.

Sub ipoteza concurentă H 1 valoarea critică a statisticii se găsește din condiția , i.e. , Unde t cr \u003d t 0,95 \u003d 1,96.

Din moment ce valoarea reală observată t=4,00 peste valoarea critică t cr(pentru oricare dintre ipotezele concurente luate), apoi ipoteza H 0 este respinsă, adică la nivelul de semnificație de 5%, se poate concluziona că noua tehnologie face posibilă creșterea producției medii a lucrătorilor.

Sarcina 2. Au fost efectuate două prelevări ale culturii de grâu: cu recoltare la timp și recoltare cu oarecare întârziere. În primul caz, la observarea a 8 parcele, randamentul mediu al probei a fost de 16,2 c/ha, iar abaterea standard a fost de 3,2 c/ha; în al doilea caz, la observarea a 9 parcele, aceleaşi caracteristici au fost egale cu 13,9 c/ha, respectiv 2,1 c/ha. La un nivel de semnificație de α=0,05, aflați efectul recoltării la timp asupra randamentului mediu.

Soluţie. Ipoteza de testat, de ex. valorile medii ale randamentului pentru recoltarea la timp și cu o oarecare întârziere sunt egale. Ca ipoteză alternativă, luăm ipoteza , a cărei adoptare înseamnă un impact semnificativ asupra randamentului termenilor de recoltare.

Valoarea reală observată a statisticii testului

.

Valoarea critică a statisticilor pentru o regiune unilaterală este determinată de numărul de grade de libertate l=n 1 +n 2 -2=9+8-2= =15 din condiția θ( t,l)=1–2 0,05=0,9, de unde conform tabelului t-distribuții (Anexa 6) găsim, t cr=1,75. Deoarece , apoi ipoteza H 0 admis. Aceasta înseamnă că datele disponibile ale eșantionului la nivelul de semnificație de 5% nu ne permit să presupunem că o anumită întârziere a timpului de recoltare are un impact semnificativ asupra randamentului. Subliniem încă o dată că aceasta nu înseamnă fidelitatea necondiționată a ipotezei H 0. Este posibil ca doar o dimensiune mică a eșantionului să fi făcut posibilă acceptarea acestei ipoteze, iar odată cu creșterea dimensiunilor eșantionului (numărul de locuri selectate), ipoteza H 0 vor fi respinse.

Sarcina 3. Următoarele date sunt disponibile privind randamentul grâului pe 8 parcele experimentale de aceeași dimensiune (c/ha): 26,5; 26,2; 35,9; 30,1; 32,3; 29,3; 26,1; 25,0. Există motive să credem că valoarea productivității a treia parcelă X *=35,9 înregistrat incorect. Este această valoare anormală (outlier) la nivelul de semnificație de 5%?

Soluţie. Excluzând valoarea X *=35,9, găsim pentru observațiile rămase și . Valoarea reală observată mai mare decât tabelar, de unde și valoarea X *=35,9 este anormal și trebuie aruncat.

Sarcina 4. Bucșele sunt prelucrate pe două strunguri. Au fost prelevate două probe: din bucșe realizate la prima mașină n 1=15 bucăți, la a doua mașină - n 2=18 buc. Pe baza acestor eșantioane, au fost calculate variațiile eșantionului (pentru prima mașină) și (pentru a doua mașină). Presupunând că dimensiunile bucșelor respectă legea distribuției normale, la nivelul de semnificație α=0,05, aflați dacă se poate considera că mașinile au precizie diferită.

Soluţie. Avem o ipoteză nulă, adică dispersiile de mărime ale bucșelor prelucrate pe fiecare mașină sunt egale. Luați ca ipoteză concurentă (varianța este mai mare pentru prima mașină).

.

Conform tabelului P.

Soluţie. Ipoteza de testat . Să luăm ipoteza ca alternativă. Deoarece varianța generală σ 2 este necunoscută, folosim t- Criteriul elevului. Statistica testului este . Valoarea critică a statisticilor t cr=1,83.

Din moment ce | t|>t cr(2.25>1.83), apoi ipoteza H 0 este respinsă, adică la nivelul de semnificație de 5%, predicția făcută ar trebui respinsă.

Sarcina 6. Pentru distribuţia empirică

AOD Criteriul de testare a ipotezei despre legea propusă a distribuției necunoscute se numește criteriul de bunătate a potrivirii.

Există mai multe criterii de bunătate a potrivirii: $\chi ^2$ (chi-pătrat) de K. Pearson, Kolmogorov, Smirnov și alții.

De obicei, frecvențele teoretice și cele empirice diferă. Cazul de discrepanță poate să nu fie aleatoriu, ceea ce înseamnă că se explică prin faptul că ipoteza nu este aleasă corect. Criteriul Pearson răspunde la întrebare, dar, ca orice criteriu, nu dovedește nimic, ci doar își stabilește acordul sau dezacordul cu datele observaționale la nivelul de semnificație acceptat.

AOD O probabilitate suficient de mică la care un eveniment poate fi considerat aproape imposibil se numește nivel de semnificație.

În practică este obișnuit să se ia niveluri de semnificație între 0,01 și 0,05, $\alpha =0,05$ fiind nivelul de semnificație $5 ( \% ) $.

Ca criteriu de testare a ipotezei, luăm valoarea \begin(equation) \label ( eq1 ) \chi ^2=\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) \ qquad (1) \ end(ecuație)

aici $n_i -$ frecvente empirice obtinute din proba, $n_i" -$ frecvente teoretice gasite teoretic.

Se dovedește că pentru $n\to \infty $ legea de distribuție a variabilei aleatoare ( 1 ), indiferent de legea de distribuție a populației generale, tinde către legea $\chi ^2$ ( chi-pătrat ) cu $k$ grade de libertate.

AOD Numărul de grade de libertate se găsește prin ecuația $k=S-1-r$ unde $S-$ este numărul de grupuri de intervale, $r-$ este numărul de parametri.

1) distribuție uniformă: $r=2, k=S-3 $

2) distribuție normală: $r=2, k=S-3 $

3) distribuție exponențială: $r=1, k=S-2$.

regulă . Testarea ipotezei prin criteriul lui Pearson.

  1. Pentru a testa ipoteza, calculați frecvențele teoretice și găsiți $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $
  2. Conform tabelului punctelor critice de distribuție $\chi ^2$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$ se găsește după nivelul de semnificație dat $\alpha $ și numărul de grade de libertate $k$.
  3. Dacă $\chi _ ( obs ) ^2<\chi _ { кр } ^2 $ то нет оснований отвергать гипотезу, если не выполняется данное условие - то отвергают.

cometariu Pentru a controla calculele, utilizați formula pentru $\chi ^2$ sub forma $\chi _ ( obs ) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) $

Testarea ipotezei distribuției uniforme

Funcția de densitate a distribuției uniforme a lui $X$ are forma $f(x)=\frac ( 1 ) ( b-a ) x\in \left[ ( a,b )\right]$.

Pentru a testa ipoteza că o variabilă aleatoare continuă este distribuită uniform la un nivel de semnificație de $\alpha $, este necesar:

1) Găsiți media eșantionului $\overline ( x_b ) $ și $\sigma _b =\sqrt ( D_b ) $ din distribuția empirică dată. Luați ca estimare a parametrilor $a$ și $b$ cantitățile

$a = \overline x _b -\sqrt 3 \sigma _b $, $b = \overline x _b +\sqrt 3 \sigma _b $

2) Găsiți probabilitatea ca o variabilă aleatoare $X$ să cadă în intervale parțiale $(( x_i ,x_ ( i+1 ) ))$ folosind formula $ P_i =P(( x_i

3) Găsiți frecvențele teoretice (de egalizare) folosind formula $n_i" =np_i $.

4) Presupunând numărul de grade de libertate $k=S-3$ și nivelul de semnificație $\alpha =0.05$ din tabelele $\chi ^2$, găsim $\chi _ ( cr ) ^2 $ din dat $\alpha $ și $k$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$.

5) Folosind formula $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ unde $n_i sunt $ frecvențe empirice, găsim frecvențele observate valoarea $\ chi _ ( obs ) ^2 $.

6) Dacă $\chi _ ( obs ) ^2<\chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу.

Să testăm ipoteza pe exemplul nostru.

1) $\overline x _b =13,00\,\,\sigma _b =\sqrt ( D_b ) = 6,51$

2) $a=13,00-\sqrt 3 \cdot 6,51=13,00-1,732\cdot 6,51=1,72468$

$b=13,00+1,732\cdot 6,51=24,27532$

$b-a=24,27532-1,72468=22,55064$

3) $P_i =P(( x_i

$P_2 =((3

$P_3 =((7

$P_4 =((11

$P_5 =((15

$P_6 =((19

Într-o distribuție uniformă, dacă lungimea intervalului este aceeași, atunci $P_i -$ sunt aceleași.

4) Găsiți $n_i" =np_i $.

5) Găsiți $\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ și găsiți $\chi _ ( obs ) ^2 $.

Să punem toate valorile obținute în tabel

\begin(array) ( |l|l|l|l|l|l|l| ) \hline i& n_i & n_i" =np_i & n_i -n_i" & (( n_i -n_i"))^2& \frac ( (( n_i -n_i")^2 ) ( n_i" ) & Control~ \frac ( n_i^2 ) ( n_i" ) \\ \hline 1& 1& 4.43438& -3.43438& 11.7950& 2.659898& 0.226& 2& \\ \hline 2& 4.43438 & 1.56562 & 2.45117 & 0.552765 & 8.11838 \\ \ hline 3 & 3 & 4.43438 & -1.43438 & 2.05744 & 0.471463 & 2.0296 \\ \ \ hline 4 & 3 & 4. 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 6& 6& 4.43438& 1.562 45117& 0.552765& 8.11838 \\ \hline 6& 6& 4.43438& 1.562 45117& 0.552765& 8.11838 \\ \hline 6& 6& 4.43438& 1.562 45117& 0.552765& 8.11838 \\ \hline 6& 6& 4.43438& _ 2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) =3,63985 \\ \hline \end(array)

$\chi _ ( cr ) ^2 (( 0,05,3 ))=7,8$

$\chi _ ( obs ) ^2<\chi _ { кр } ^2 =3,26<7,8$

Concluzie nu există niciun motiv pentru a respinge ipoteza.

Anterior, au fost luate în considerare ipoteze în care se presupunea că legea de distribuție a populației generale este cunoscută. Acum să testăm ipotezele despre legea propusă a distribuției necunoscute, adică vom testa ipoteza nulă că populația este distribuită după o lege cunoscută. De obicei, se numesc teste statistice pentru testarea unor astfel de ipoteze criteriile de consimțământ.

Criteriul de concordanță se numeşte criteriul de testare a ipotezei legii propuse a distribuţiei necunoscute. Aceasta este o măsură numerică a discrepanței dintre distribuțiile empirice și teoretice.

Sarcina principală. Este dată distribuția empirică (eșantionul). Faceți o ipoteză (propuneți o ipoteză) despre tipul de distribuție teoretică și testați ipoteza propusă la un nivel de semnificație dat α.

Rezolvarea problemei principale constă din două părți:

1. Emiterea unei ipoteze.

2. Testarea ipotezei la un anumit nivel de semnificație.

Să ne uităm la aceste părți în detaliu.

1. Alegerea unei ipoteze Este convenabil să vorbim despre tipul de distribuție teoretică folosind poligoane sau histograme de frecvență. Poligonul empiric (sau histograma) este comparat cu legile de distribuție cunoscute și se alege cea mai potrivită.

Iată graficele celor mai importante legi de distribuție:

Exemple de legi empirice de distribuție sunt prezentate în figuri:



În cazul (a) se propune ipoteza distribuției normale, în cazul (b) ipoteza distribuției uniforme, în cazul (c) ipoteza distribuției Poisson.

Baza pentru formularea unei ipoteze despre distribuția teoretică poate fi premise teoretice despre natura modificării trăsăturii. De exemplu, îndeplinirea condițiilor teoremei Lyapunov ne permite să facem o ipoteză despre distribuția normală. Egalitatea mediei și a varianței conduce la ipoteza distribuției Poisson.

În practică, cel mai adesea întâlnim o distribuție normală, așa că în problemele noastre trebuie doar să testăm ipoteza unei distribuții normale.

Testarea ipotezelor despre distribuția teoretică răspunde la întrebarea: discrepanța dintre presupusele distribuții teoretice și empirice poate fi considerată aleatorie, nesemnificativă, explicată prin aleatorietatea căderii în eșantionul anumitor obiecte, sau dacă această discrepanță indică o discrepanță semnificativă între distribuții. Există diverse metode de verificare (criterii de fitness) - c 2 (chi-pătrat), Kolmogorov, Romanovsky și alții.

criteriul lui Pearson.

Avantajul criteriului Pearson este universalitatea acestuia: poate fi folosit pentru a testa ipoteze despre diverse legi de distribuție.

1. Testarea ipotezei unei distribuții normale. Să se obțină o probă de o dimensiune suficient de mare P cu o mulțime de valori de variante diferite. Pentru comoditatea procesării sale, împărțim intervalul de la cea mai mică la cea mai mare dintre valorile variantei prin s părți egale și vom presupune că valorile opțiunilor care se încadrează în fiecare interval sunt aproximativ egale cu numărul care specifică mijlocul intervalului. După ce am numărat numărul de opțiuni care au intrat în fiecare interval, vom face așa-numitul eșantion grupat:

Opțiuni……….. X 1 X 2 … x s

frecvențe…………. P 1 P 2 … n s ,

Unde x i sunt valorile punctelor medii ale intervalelor și n i este numărul de opțiuni incluse în i al-lea interval (frecvențe empirice). Pe baza datelor obținute, este posibil să se calculeze media eșantionului și abaterea standard a eșantionului σ B. Să verificăm ipoteza că populația generală este distribuită conform legii normale cu parametri M(X) = , D(X) = . Apoi puteți găsi numărul de numere din eșantionul de volum P, care ar trebui să fie în fiecare interval sub această ipoteză (adică frecvențe teoretice). Pentru a face acest lucru, folosind tabelul de valori al funcției Laplace, găsim probabilitatea de a lovi i- al-lea interval:

,

Unde un iȘi b i- granițe i- al-lea interval. Înmulțind probabilitățile rezultate cu dimensiunea eșantionului n, găsim frecvențele teoretice: p i = n p i.Scopul nostru este să comparăm frecvențele empirice și teoretice, care, desigur, diferă între ele, și să aflăm dacă aceste diferențe sunt nesemnificative, nu infirmă ipoteza distribuției normale a variabilei aleatoare studiate, sau sunt așa. mare că contrazic această ipoteză. Pentru aceasta, se folosește un criteriu sub forma unei variabile aleatoare

. (7)

Sensul ei este evident: se însumează părțile, care sunt pătratele abaterilor frecvențelor empirice de la cele teoretice de la frecvențele teoretice corespunzătoare. Se poate dovedi că, indiferent de legea distribuției reale a populației generale, legea distribuției variabilei aleatoare (7) la tinde către legea distribuției cu numărul de grade de libertate. k = s - 1 – r, Unde r este numărul de parametri ai distribuției estimate estimați din datele eșantionului. Distribuția normală este caracterizată de doi parametri, deci k = s - 3. Pentru criteriul selectat se construiește o regiune critică de dreapta, determinată de condiție

(8)

Unde α - nivelul de semnificație. Prin urmare, regiunea critică este dată de inegalitate iar zona de acceptare a ipotezei este .

Deci, pentru a testa ipoteza nulă H 0: populația este distribuită în mod normal - trebuie să calculați valoarea observată a criteriului din eșantion:

, (7`)

și conform tabelului punctelor critice ale distribuției χ 2 găsiți punctul critic folosind valorile cunoscute ale lui α și k = s - 3. Dacă - se acceptă ipoteza nulă, dacă se respinge.

Exemplu. Rezultatele studiului cererii de bunuri sunt prezentate în tabel:

Propuneți o ipoteză despre tipul de distribuție și testați-o la nivelul de semnificație a=0,01.

I. Ipoteza.

Pentru a indica tipul de distribuție empirică, construim o histogramă


120 160 180 200 220 280

Prin forma histogramei, se poate face o presupunere despre legea normală de distribuție a trăsăturii studiate în populația generală.

II. Să verificăm ipoteza propusă a distribuției normale folosind testul de bunătate a potrivirii lui Pearson.

1. Calculați , s B. Ca opțiune, luați media aritmetică a capetelor intervalelor:

2. Aflați intervalele (Z i ; Z i+1): ; .

Să luăm (-¥) pentru capătul din stânga primului interval și (+¥) pentru capătul din dreapta al ultimului interval. Rezultatele sunt prezentate în tabel. 4.

3. Aflați probabilitățile teoretice P i și frecvențele teoretice (vezi Tabelul 4).

Tabelul 4

i Limită de interval Ф(Z i) Ф(Z i+1) P i \u003d Ф (Z i + 1) - Ф (Z i)
x i x i+1 Z i Zi+1
-1,14 -0,5 -0,3729 0,1271 6,36
-1,14 -0,52 -0,3729 -0,1985 0,1744 8,72
-0,52 0,11 -0,1985 0,0438 0,2423 12,12
0,11 0,73 0,0438 0,2673 0,2235 11,18
0,73 0,2673 0,5 0,2327 11,64

4. Să comparăm frecvențele empirice și teoretice. Pentru aceasta:

a) calculați valoarea observată a criteriului Pearson.

Calculele sunt prezentate în Tabelul 5.

Tabelul 5

i
6,36 -1,36 1,8496 0,291
8,72 1,28 1,6384 0,188
12,12 1,88 3,5344 0,292
11,18 0,82 0,6724 0,060
11,64 -2,64 6,9696 0,599
S

b) conform tabelului punctelor critice de distribuție c 2 la un nivel de semnificație dat a=0,01 și a numărului de grade de libertate k=m–3=5–3=2, găsim punctul critic ; avem .

Compară c . . Prin urmare, nu există niciun motiv pentru a respinge ipoteza distribuției normale a trăsăturii studiate a populației generale. Acestea. discrepanța dintre frecvențele empirice și teoretice este nesemnificativă (aleatorie). ◄

Cometariu. Intervale care conțin puține frecvențe empirice (n i<5), следует объединить, а частоты этих интервалов сложить. Если производилось объединение интервалов, то при определении числа степеней свободы по формуле K=m-3 следует в качестве m принять число оставшихся после объединения интервалов.

Exemplu. Pe baza unui eșantion de 24 de opțiuni, a fost formulată o ipoteză privind distribuția normală a populației generale. Folosind testul Pearson la nivelul semnificației dintre valorile date \u003d (34, 35, 36, 37, 38) indicați: a) cel mai mare pentru care nu există niciun motiv pentru a respinge ipoteza; b) cea mai mică valoare de la care trebuie respinsă ipoteza.

Să aflăm numărul de grade de libertate folosind formula:

unde este numărul de grupuri de mostre (opțiune), este numărul de parametri de distribuție.

Deoarece distribuția normală are 2 parametri ( și ), obținem

Conform tabelului punctelor critice de distribuție, în funcție de nivelul de semnificație dat și de numărul de grade de libertate, determinăm punctul critic.

În cazul a) pentru valori egale cu 34 și 35, nu există niciun motiv pentru a respinge ipoteza unei distribuții normale, deoarece . Și cea mai mare dintre aceste valori.

În cazul b) pentru valorile 36, 37, 38, ipoteza este respinsă, deoarece . Cel mai mic dintre ei .◄

2. Testarea ipotezei distribuţiei uniforme. Când se utilizează testul Pearson pentru a testa ipoteza unei distribuții uniforme a populației generale cu o densitate de probabilitate presupusă

este necesar, după calcularea valorii din eșantionul disponibil, estimarea parametrilor AȘi b dupa formulele:

Unde A*Și b*- estimări AȘi b. Într-adevăr, pentru o distribuție uniformă M(X) = , , de unde puteți obține un sistem de determinare A*Și b*: , a cărui soluție este expresiile (9).

Apoi, presupunând că , puteți găsi frecvențele teoretice folosind formulele

Aici s este numărul de intervale în care este împărțit eșantionul.

Valoarea observată a criteriului Pearson se calculează prin formula (7`), iar valoarea critică se calculează din tabel, ținând cont de faptul că numărul de grade de libertate k = s - 3. După aceea, limitele regiunii critice se determină în același mod ca și pentru testarea ipotezei unei distribuții normale.

3. Testarea ipotezei despre distribuția exponențială.În acest caz, împărțind eșantionul existent în intervale de lungime egală, considerăm o secvență de opțiuni echidistantă între ele (presupunem că toate opțiunile care se încadrează în i--lea interval, ia o valoare care coincide cu mijlocul său) și frecvențele corespunzătoare n i(numărul de opțiuni de eșantion incluse în i– al-lea interval). Calculăm din aceste date și luăm ca estimare a parametrului λ valoare . Apoi frecvențele teoretice sunt calculate prin formula

Apoi, se compară valorile observate și critice ale criteriului Pearson, ținând cont de faptul că numărul de grade de libertate k = s - 2.

Criteriul lui Pearson pentru testarea ipotezei despre forma legii de distribuție a unei variabile aleatoare. Testarea ipotezelor despre distribuțiile normale, exponențiale și uniforme prin criteriul Pearson. criteriul lui Kolmogorov. Metodă aproximativă de verificare a normalității distribuției, asociată cu estimări ale coeficienților de asimetrie și curtoză.

În prelegerea anterioară au fost luate în considerare ipoteze în care se presupunea că legea de distribuție a populației generale este cunoscută. Acum să testăm ipotezele despre legea propusă a distribuției necunoscute, adică vom testa ipoteza nulă că populația este distribuită după o lege cunoscută. De obicei, testele statistice pentru testarea unor astfel de ipoteze se numesc teste de bunătate.

Avantajul criteriului Pearson este universalitatea acestuia: poate fi folosit pentru a testa ipoteze despre diverse legi de distribuție.

1. Testarea ipotezei unei distribuții normale.

Să se obțină o probă de o dimensiune suficient de mare P cu o mulțime de opțiuni de semnificații diferite. Pentru confortul procesării sale, împărțim intervalul de la cea mai mică la cea mai mare dintre valorile variantei la s părți egale și vom presupune că valorile lui vari

furnicile care se încadrează în fiecare interval sunt aproximativ egale cu numărul care specifică mijlocul intervalului. După ce am numărat numărul de opțiuni care au intrat în fiecare interval, vom face așa-numitul eșantion grupat:

Opțiuni X 1 X 2 x s

frecvente P 1 P 2 n s ,

Unde x i sunt valorile punctelor medii ale intervalelor și n i- numărul de opțiuni incluse în i al-lea interval (frecvențe empirice).

Pe baza datelor obținute, este posibil să se calculeze media eșantionului și abaterea standard a eșantionului σ B. Să verificăm ipoteza că populația generală este distribuită conform legii normale cu parametri M(X) = , D(X) = . Apoi puteți găsi numărul de numere din eșantionul de volum P, care ar trebui să fie în fiecare interval sub această ipoteză (adică frecvențe teoretice). Pentru a face acest lucru, folosind tabelul de valori al funcției Laplace, găsim probabilitatea de a lovi i- al-lea interval:

,

Unde un iȘi b i- granițe i- al-lea interval. Înmulțind probabilitățile rezultate cu dimensiunea eșantionului n, găsim frecvențele teoretice: p i \u003d n? p i. Scopul nostru este să comparăm frecvențele empirice și teoretice, care, desigur, diferă unele de altele și să aflăm dacă aceste diferențe sunt nesemnificative, nu infirmă ipoteza distribuției normale a variabilei aleatoare studiate sau sunt atât de mari. că contrazic această ipoteză. Pentru aceasta, se folosește un criteriu sub forma unei variabile aleatoare

. (20.1)

Sensul ei este evident: se însumează părțile, care sunt pătratele abaterilor frecvențelor empirice de la cele teoretice de la frecvențele teoretice corespunzătoare. Se poate dovedi că, indiferent de legea distribuției reale a populației generale, legea distribuției variabilei aleatoare (20.1) la tinde spre legea distribuției (vezi prelegerea 12) cu numărul de grade de libertate. k = s- 1 - r, Unde r- numărul de parametri ai distribuției estimate, estimați din datele eșantionului. Distribuția normală este caracterizată de doi parametri, deci k = s- 3. Pentru criteriul selectat se construiește o regiune critică de dreapta, determinată de condiție


(20.2)

Unde α - nivelul de semnificație. Prin urmare, regiunea critică este dată de inegalitate iar zona de acceptare a ipotezei este .

Deci, pentru a testa ipoteza nulă H 0: populația este distribuită în mod normal - trebuie să calculați valoarea observată a criteriului din eșantion:

, (20.1`)

și conform tabelului punctelor critice ale distribuției χ 2 găsiți punctul critic folosind valorile cunoscute ale lui α și k = s- 3. Dacă - se acceptă ipoteza nulă, dacă se respinge.

2. Testarea ipotezei distribuţiei uniforme.

Când se utilizează criteriul Pearson pentru a testa ipoteza unei distribuții uniforme a populației generale cu densitatea de probabilitate așteptată

este necesar, după calcularea valorii din eșantionul disponibil, estimarea parametrilor AȘi b dupa formulele:

Unde A*Și b*- estimări AȘi b. Într-adevăr, pentru o distribuție uniformă M(X) = , , de unde puteți obține un sistem de determinare A*Și b*: , a cărui soluție sunt expresiile (20.3).

Apoi, presupunând că , puteți găsi frecvențele teoretice folosind formulele

Aici s este numărul de intervale în care este împărțit eșantionul.

Valoarea observată a criteriului Pearson se calculează prin formula (20.1`), iar valoarea critică se calculează din tabel, ținând cont de faptul că numărul de grade de libertate k = s- 3. După aceea, limitele regiunii critice se determină în același mod ca și pentru testarea ipotezei unei distribuții normale.

3. Testarea ipotezei despre distribuția exponențială.

În acest caz, împărțind eșantionul existent în intervale de lungime egală, considerăm o secvență de opțiuni echidistantă între ele (presupunem că toate opțiunile care se încadrează în i--lea interval, ia o valoare care coincide cu mijlocul său) și frecvențele corespunzătoare n i(numărul de opțiuni de eșantion incluse în i--lea interval). Calculăm din aceste date și luăm ca estimare a parametrului λ valoare . Apoi frecvențele teoretice sunt calculate prin formula

Apoi, se compară valorile observate și critice ale criteriului Pearson, ținând cont de faptul că numărul de grade de libertate k = s- 2.



eroare: Conținutul este protejat!!