Odaberite Stranica

Nivo značaja u Pearsonovom testu. Pearsonov test

Svrha χ 2 kriterijuma - Pirsonov kriterijum Kriterijum χ 2 se koristi u dve svrhe: 1) da se uporedi empirijska raspodela karakteristike sa teorijskom - ujednačena, normalna ili neka druga; 2) uporediti dvije, tri ili više empirijskih distribucija iste karakteristike. Opis kriterija Kriterij χ 2 odgovara na pitanje da li se javljaju jednakom učestalošću različita značenja karakterističan u empirijskim i teorijskim distribucijama ili u dvije ili više empirijskih distribucija. Prednost metode je u tome što omogućava da se uporede distribucije predstavljenih karakteristika na bilo kojoj skali, počevši od skale imena. U najjednostavnijem slučaju alternativne distribucije “da – ne”, “dozvoljena greška – nije dozvoljena greška”, “riješen problem – nije riješen problem” itd., već možemo primijeniti χ 2 kriterij.Što je veća nesklad između dvije upoređene distribucije, to je veća empirijska vrijednost χ 2 . Automatski proračun χ 2 - Pearsonov kriterijum Da biste izvršili automatski proračun χ 2 - Pearsonov kriterijum, morate izvršiti dva koraka: Korak 1

. Navedite broj empirijskih distribucija (od 1 do 10);

Korak 2

. Unesite empirijske frekvencije u tabelu; Korak 3. Dobijte odgovor. Prednost Pearsonovog kriterijuma je njegova univerzalnost: može se koristiti za testiranje hipoteza o različitim zakonima distribucije. 1. Testiranje hipoteze normalne distribucije. Neka se dobije dovoljno veliki uzorak n

sa puno različita značenja 1 različita značenja 2 … opcija. Radi praktičnosti obrade, dijelimo interval od najmanje do najveće vrijednosti opcije

s Korak 3 1 Korak 3 2 … jednake dijelove i pretpostavit ćemo da su vrijednosti opcija koje spadaju u svaki interval približno jednake broju koji specificira sredinu intervala. Prebrojavanjem broja opcija koje spadaju u svaki interval, kreiraćemo takozvani grupirani uzorak: ,

opcije……….. X x s frekvencije…………. n s Gdje x i



su vrijednosti središta intervala, i n i. Provjerimo pretpostavku da je populacija raspoređena po normalnom zakonu s parametrima M(X) = , D(X) = . Tada možete pronaći broj brojeva iz veličine uzorka Korak 3, koji bi se trebao pojaviti u svakom intervalu pod ovom pretpostavkom (odnosno, teorijske frekvencije). Da bismo to učinili, koristeći tablicu vrijednosti Laplaceove funkcije, nalazimo vjerojatnost da uđemo Gdje th interval:

,

opcije……….. i ja I b i- granice i-th interval. Množenjem dobijenih vjerovatnoća sa veličinom uzorka n, nalazimo teorijske frekvencije: p i =n·p i Naš cilj je da uporedimo empirijske i teorijske frekvencije, koje se, naravno, međusobno razlikuju, i utvrdimo da li su te razlike beznačajne i ne opovrgavaju hipotezu o normalnoj distribuciji slučajne varijable koja se proučava, ili jesu li toliko velike da su u suprotnosti sa ovom hipotezom. U tu svrhu koristi se kriterij u obliku slučajne varijable

. (20.1)

Njegovo značenje je očigledno: sabiraju se dijelovi koje kvadrati odstupanja empirijskih frekvencija od teorijskih čine od odgovarajućih teorijskih frekvencija. To se može dokazati, bez obzira na stvarni zakon o raspodjeli stanovništva zakon raspodjele slučajne varijable (20.1) at teži zakonu raspodjele (vidi predavanje 12) sa brojem stupnjeva slobode k = s – 1 – r, Gdje r– broj parametara očekivane distribucije procijenjen iz podataka uzorka. Normalna distribucija karakteriziraju dva parametra, dakle k = s – 3. Za odabrani kriterijum, konstruiše se desna kritična oblast, određena uslovom

(20.2)

opcije……….. α – nivo značaja. Prema tome, kritično područje je dato nejednakošću a područje prihvatanja hipoteze je .

Dakle, da testiramo nultu hipotezu N 0: populacija je normalno raspoređena - potrebno je izračunati uočenu vrijednost kriterija iz uzorka:

, (20.1`)

i koristeći tablicu kritičnih tačaka distribucije χ 2, pronađite kritičnu tačku koristeći poznate vrijednosti α i k = s – 3. Ako - nulta hipoteza je prihvaćena, ako se odbacuje.

2. Testiranje hipoteze o uniformnoj raspodjeli.

Kada koristite Pearsonov test za testiranje hipoteze da je populacija ravnomjerno raspoređena s procijenjenom gustinom vjerovatnoće

Potrebno je, nakon izračunavanja vrijednosti iz raspoloživog uzorka, procijeniti parametre A I b prema formulama:

opcije……….. A* I b*- procjene A I b. Zaista, za ujednačenu distribuciju M(X) = , , gdje možete dobiti sistem za određivanje A* I b*: , čije su rješenje izrazi (20.3).

Onda, pod pretpostavkom , možete pronaći teorijske frekvencije pomoću formula

Evo Neka se dobije dovoljno veliki uzorak– broj intervala na koje je uzorak podijeljen.

Uočena vrijednost Pearsonovog kriterija izračunava se po formuli (20.1`), a kritična vrijednost se izračunava pomoću tabele, uzimajući u obzir činjenicu da je broj stupnjeva slobode k = s – 3. Nakon toga, granice kritičnog područja se određuju na isti način kao i za testiranje hipoteze normalne raspodjele.

3. Testiranje hipoteze o eksponencijalnoj raspodjeli.

U ovom slučaju, nakon što smo podijelili postojeći uzorak na intervale jednake dužine, razmatramo niz opcija, jednako udaljenih jedna od druge (pretpostavljamo da sve opcije koje spadaju u Gdje- th interval, uzeti vrijednost koja se poklapa sa njegovom sredinom) i njihove odgovarajuće frekvencije n i(broj opcija uzoraka uključenih u Gdje– ti interval). Izračunajmo iz ovih podataka i uzmimo kao procjenu parametra λ veličina. Zatim se teorijske frekvencije izračunavaju pomoću formule

Zatim se upoređuju posmatrana i kritična vrednost Pearsonovog kriterijuma, uzimajući u obzir činjenicu da je broj stepeni slobode k = s – 2.

Prilikom provjere statističke hipoteze o korespondenciji pojedinih parametara zakona raspodjele slučajnih varijabli, pretpostavljeno je da su zakoni distribucije ovih varijabli poznati. Međutim, prilikom rješavanja praktičnih problema (posebno ekonomskih), model zakona o raspodjeli u opšti slučaj je unaprijed nepoznat, stoga postoji potreba za odabirom modela zakona distribucije koji je u skladu s rezultatima promatranja uzorka.

Neka x 1 , x 2 ,...,x n– uzorak zapažanja slučajne varijable X sa nepoznatom kontinuiranom funkcijom distribucije F(x). Hipoteza se provjerava H 0, koji to navodi X distribuiraju u skladu sa zakonom koji ima funkciju distribucije F(x), jednako funkciji F0(x), tj. testira se nulta hipoteza.

Pozivaju se kriteriji po kojima se testira nulta hipoteza nepoznate distribucije kriterijumi saglasnosti. Razmotrimo Pearsonov test dobrog pristajanja.

Šema testiranja nulte hipoteze :

1. Po uzorku x 1 , x 2 ,..., x n grade varijantne serije; može biti diskretna ili intervalna. Radi određenosti, razmotrimo diskretne varijacijske serije

x i x 1 x 2 ... x k-1 x k
m i m 1 m 2 ... m k-1 m k

2. Na osnovu podataka iz prethodnih studija ili preliminarnih podataka, postavlja se pretpostavka (prihvaćena hipoteza) o modelu zakona distribucije slučajne varijable X.

3. Koristeći podatke uzorka, procjenjuju se parametri odabranog modela zakona distribucije. Pretpostavimo da zakon raspodjele ima r parametara (na primjer, binomni zakon ima jedan parametar str; normalno – dva parametra ( a 0 , σ x) itd.).

4. Zamjenom uzoraka procjena vrijednosti parametara distribucije, nalazimo teorijske vrijednosti vjerovatnoće

, i=1, 2,..., k.

5. Izračunajte teorijske frekvencije, gdje je .

6. Izračunajte vrijednost Pearsonovog testa ispravnosti

.

Ova količina ima tendenciju da se distribuira sa stepenom slobode. Stoga se za proračune koriste tablice distribucije.

7. Postavljanje nivoa značajnosti α, pronalaženje kritične regije (uvijek je desno); vrijednost se određuje iz omjera . Ako numerička vrijednost padne u interval , tada se hipoteza odbacuje i prihvaća alternativna hipoteza da odabrani model zakona distribucije nije potvrđen podacima uzorka, a dopuštena je greška čija je vjerovatnoća jednaka α .

Zadatak 6. Ispitni rad iz matematike sadrži 10 zadataka. Neka Xslučajna varijabla broj zadataka koje kandidati rješavaju na prijemnom ispitu. Rezultati ispita iz matematike za 300 prijavljenih su sljedeći:



Gdje
x i
m i

X.

Rješenje. Izraditi hipotezu o modelu zakona raspodjele slučajne varijable X Hajde da napravimo sljedeće pretpostavke:

· vjerovatnoća rješavanja problema ne zavisi od ishoda rješavanja drugih problema;

· vjerovatnoća rješavanja bilo kojeg pojedinačnog problema je ista i jednaka str, a vjerovatnoća da se problem ne riješi je jednaka q=1-p.

Pod ovim pretpostavkama može se pretpostaviti da X podređeni binomni zakon raspodjela (nulta hipoteza), tj. vjerovatnoća da će aplikant odlučiti x zadaci se mogu izračunati pomoću formule

Nađimo procjenu parametra str uključeno u model (1).

Evo str je vjerovatnoća da će aplikant riješiti problem. Procjena vjerovatnoće str je relativna frekvencija p*, koji se izračunava po formuli

,

gdje je prosječan broj zadataka koje je riješio jedan aplikant;

v– broj zadataka koje je svaki aplikant riješio.

Zatim procjena za str dobijamo u formi

Zamenimo vrednosti p * =0,6 I q * =1-0,6=0,4 u izraz (1) i za različite x i dobijamo teorijske vjerovatnoće i frekvencije (Tabela 1).

Tabela 1

Broj grupe Gdje x i
0,0001 0,03
0,0016 0,48
0,0106 3,18
0,0425 12,75
0,1115 33,45
0,2007 60,21
0,2508 75,24
0,2150 64,50
0,1209 36,27
0,0403 12,09
0,0060 1,80

Tabela pokazuje da je za grupe 1, 2, 3 i 11 teorijska frekvencija . Takve grupe se obično spajaju sa susjednim. Vrijednosti za grupe 1, 2 i 3 mogu se kombinirati sa . Ovo se čini prirodnim, jer zadaci 0, 1, 2 i 3 riješeni na ispitu obično dobijaju nezadovoljavajuću ocjenu. Kombinirajmo i grupu 11 sa grupom 10 i napravimo tabelu. 2.



Tabela 2

Broj grupe Gdje
x i 0-3 9-10
m i

Prema tabeli. 2 izračunavamo vrijednost kriterija sporazuma:

Postavimo nivo značajnosti α=0,05, zatim za stepene slobode .

Magnituda Stoga se nulta hipoteza mora odbaciti.

Zadatak 7. Rezultati vaganja 50 nasumično odabranih paketića čaja prikazani su u nastavku (u gramima):

150, 147, 152, 148, 149, 153,. 151, 150,149, 147, 153, 151, 152, 151, 149, 152, 150, 148, 152, 150, 152, 151, 148, 151, 152, 150, 151, 149, 148, 149, 150, 150, 151, 149, 151, 150, 151, 150, 149, 148, 147, 153, 147, 152, 150, 151, 149, 150, 151, 153.

Procijenite zakon raspodjele slučajne varijable X– masa pakovanja čaja – za nivo značajnosti α=0,05.

Rješenje. Masa pakovanja čaja je kontinuirana slučajna varijabla, ali zbog činjenice da je vaganje vršeno s diskretnošću od 1 g i raspon je 147÷153 g, kontinuirana vrijednost mogu se diskretno predstaviti varijantne serije:

Tabela 1.

Kao model zakona distribucije biramo normalni zakon čiji broj parametara r=2: a 0matematičko očekivanje, σ x– standardna devijacija.

Koristeći podatke uzorka, dobijamo procjene parametara zakona normalne distribucije:

;

, s=1,68.

Za izračunavanje teoretskih frekvencija koristit ćemo tabelarne vrijednosti Laplaceove funkcije F( z). Algoritam proračuna je sljedeći:

Pronalazimo iz normaliziranih vrijednosti slučajne varijable Z vrijednosti F( z), a zatim F N(x):

, .

na primjer,

x 1=147; z 1=(147–150,14)/1,68= –1,87; F(–1,87)= –0,46926; F N(147)=0,03074;

Nalazimo ;

Nalazimo , I ako su neki , Tada se odgovarajuće grupe kombiniraju.

Rezultati proračuna , i dati su u tabeli. 2.

Koristeći tabelu, nalazimo prema šemi: za nivo značaja i broj stepeni slobode. Stoga kritična regija.

Količina nije uključena u kritično područje, pa je hipoteza da je slučajna varijabla X– masa pakiranja čaja podliježe normalnom zakonu raspodjele i u skladu je s podacima uzorka.

Tabela 2

Gdje x i +x i +1 m i F( z i) F N(x i) F N(x i+1) =F N(x i+1)– –F N(x i)
–∞÷147 –0,50000 0,00000 0,03074 0,03074 1,537 -
147÷148 –0,46926 0,03074 0,10204 0,07130 3,563 0,237
148÷149 –0,39796 0,10204 0,24825 0,14621 7,31 0,730
149÷150 –0,25175 0,24825 0,46812 0,21987 10,99 0,813
150÷151 –0,03188 0,46812 0,69497 0,22685 11,34 0,010
151÷152 0,19497 0,69497 0,86650 0,17153 8,58 0,683
152÷153 0,36650 0,86650 0,95543 0,08893 4,45 2,794
153÷∞ 0,45543 0,95543 1,00000 0,04457 2,23 -
Σ=50 Σ=1,00000 Σ=5,267

Svrha lekcije: Usaditi studentima vještinu testiranja statističkih hipoteza. Pretvori posebnu pažnju savladati koncepte vezane za testiranje hipoteza (statistički test, greške 1 I 2 vrsta, itd.). Nakon rješavanja svakog problema, razgovarajte o drugim mogućim zaključcima s različitim i različitim nivoima značaja.

Za lekciju na ovu temu treba pripremiti odgovore na sljedeća pitanja:

1. Kako se mijenjaju vjerovatnoće greške prvog i drugog tipa kako se veličina uzorka povećava?

2. Da li vjerovatnoće počinjenja grešaka prvog i drugog tipa zavise od tipa alternativne hipoteze i od korišćenog kriterijuma?

3. Koja je jednostranost efekta statističkih testova značajnosti?

4. Da li je moguće, koristeći statistički test značajnosti, zaključiti: “Nulta hipoteza koja se testira je tačna”?

5. Koja je razlika između konstruisanja dvosmjerne kritične regije i konstruiranja interval poverenja za isti parametar?

Zadatak 1. Istraženi su 200 gotovih dijelova za odstupanje prave veličine od izračunate. Grupirani podaci iz studija prikazani su u tabeli 5.

Tabela 5

Konstruirajte histogram na osnovu ove statističke serije. Na osnovu izgleda histograma, postavite hipotezu o vrsti zakona distribucije (na primjer, sugerirajte da vrijednost koja se proučava ima normalan zakon distribucije). Odaberite parametre zakona raspodjele (jednake njihovim procjenama na osnovu eksperimentalnih podataka). Na istom grafikonu nacrtajte funkciju gustoće vjerovatnoće koja odgovara postavljenoj hipotezi. Koristeći test dobrobiti, provjerite da li se hipoteza slaže s eksperimentalnim podacima. Uzmite nivo značajnosti, na primjer, jednak 0,05 .

Rješenje. Da bismo dobili ideju o obliku zakona distribucije vrijednosti koja se proučava, gradimo histogram. Da bismo to učinili, preko svakog intervala ćemo konstruirati pravougaonik čija je površina numerički jednaka učestalosti pada u interval


(Sl. 8.)

Na osnovu izgleda histograma može se pretpostaviti da proučavana vrijednost ima normalan zakon raspodjele. Procijenićemo parametre zakona normalne distribucije (matematičko očekivanje i disperziju) na osnovu eksperimentalnih podataka, uzimajući u obzir njegovu sredinu kao predstavnika svakog intervala:

.

Dakle, postavljamo hipotezu da vrijednost koja se proučava ima normalan zakon raspodjele N(5;111.6), tj. ima funkciju gustoće vjerovatnoće

.

Pogodnije je iscrtati ga pomoću funkcijskih tabela

.

Na primjer, maksimalna tačka i tačke pregiba imaju ordinate, respektivno

Izračunajmo mjeru neslaganja između postavljene hipoteze i eksperimentalnih podataka, tj. . Da bismo to učinili, prvo izračunamo vjerovatnoće koje se mogu pripisati svakom intervalu u skladu s hipotezom

Isto tako,

Pogodno je izvršiti izračun tako što ćete ga napisati na sljedeći način:

0,069 0,242 0,362 0,242 0,069 13,8 48,4 72,4 48,4 23,8 5,2 -6,4 -1,4 7,5 -1,8 -27,04 40,96 1,96 57,76 3,24 1,96 0,85 0,02 1,19 0,23

Dakle, vrijednost je izračunata. Konstruirajmo kritičnu regiju za nivo značaja. Broj stupnjeva slobode za je 2 (broj intervala i tri veze su nametnute na: , i . Kao rezultat). Za dati nivo značajnosti i broj stepena slobode iz tabele raspodele nalazimo takvu vrednost da .

U našem slučaju, kritično područje će biti interval [ 5,99; ¥). Vrijednost nije uključena u kritično područje. Zaključak: hipoteza nije u suprotnosti sa eksperimentalnim podacima (što, naravno, ne znači da je hipoteza tačna).

Zadatak 2. U formi statističke serije Slijede grupirani podaci o vremenu rada 400 uređaja:

Jesu li ovi podaci u skladu s pretpostavkom da vrijeme rada uređaja bez kvara ima kumulativnu funkciju distribucije ? Uzmite, na primjer, nivo značajnosti jednak 0,02 .

Rješenje. Izračunajmo vjerovatnoće koje se mogu pripisati intervalima prema hipotezi:

p =P(0 ;

p =P(500

p =P(1000

p = P(1500

Računamo c.

n i p i np i n i - n p i (n i - np i) 2 (n i -np i) / np i
0,6324 0,2325 0,0852 0,0317 252,96 34,08 12,68 4,04 -15 14,92 3,32 16,32 222,6 11,02 0,06 2,42 6,53 0,87

Broj stepena slobode je tri, jer je samo jedno ograničenje nametnuto na 4 veličine n Sn = n (r =4 -1=3). Za tri stepena slobode i nivo značaja b=0,02 iz tabele distribucije c nalazimo kritičnu vrijednost c = 9,84. Vrijednost c =9,88 je unutar kritičnog područja. Zaključak: hipoteza je u suprotnosti s eksperimentalnim podacima. Odbacujemo hipotezu i vjerovatnoća da nismo u pravu je 0,02.

Problem 3. Novčić je bačen 50 jednom. 32 grb je jednom ispao. Koristeći kriterijum dogovora “ hi-kvadrat” kako bi provjerili jesu li ovi podaci u skladu s pretpostavkom da je novčić bio simetričan.

Rješenje. Pretpostavljamo da je novčić bio simetričan, odnosno da je vjerovatnoća da grb ispadne jednaka 1/2 . Prema našem iskustvu, grb je ispao 32 puta i 18 kada se cifra ispusti, izračunajte vrijednost c V .

n i p i np i n i - n p i (n i - np i) (n i - np i) / np i
1/2 1/2 1,96 1,96

Broj stepeni slobode za c je jednak r = 2–1=1; pošto postoje dva člana, a jedno ograničenje je nametnuto na n ν + ν =50.

Za broj stepeni slobode r =1 a nivo značajnosti, na primjer, jednak β=0,05 nalazimo iz tabele distribucije c da P( c 3,84)=0,05 , tj. područje kritičnih vrijednosti c na nivou značajnosti β=0,05 bit će interval [ 3.84; ). Izračunata vrijednost c =3,92 pada u kritično područje, hipoteza se odbacuje. Verovatnoća da grešimo je jednaka 0,05 .

Zadatak 4. Proizvođač tvrdi da samo u ovoj velikoj seriji proizvoda 10% proizvodi niskog kvaliteta odabrano je nasumično pet proizvoda, a među njima su bila tri proizvoda niskog kvaliteta. Koristeći Neyman-Pearsonovu lemu, konstruirajte kriterij i testirajte hipotezu da je postotak proizvoda niskog kvaliteta zaista jednak 10 (p =0,1) naspram alternative da je veći procenat proizvoda nelošeg kvaliteta 10 (p=p >p). Vjerovatnoća odabira greške tipa I »0.01, tj. uključiti toliko mnogo tačaka u kritičnom području da je vjerovatnoća odbacivanja hipoteze koja se testira, ako je tačna, 0,01 . Ova vjerovatnoća je dodijeljena približno kako se ne bi pribjeglo randomizaciji, o kojoj učenici nemaju pojma. Ako p =0,6, kolika je onda vjerovatnoća greške tipa II?

Rješenje. Prema hipotezi p 0 =0,1 sa alternativnim značenjem p>p. Prema Neyman-Pearsonovoj lemi, kritična regija bi trebala uključivati ​​te vrijednosti k, za koje

= >C,

opcije……….. WITH- neka konstanta,

,

k+ (5 -k) ,

.

Budući da je , izraz u zagradi nije negativan. Zato

To znači da kritična regija treba da uključi te vrijednosti {0,2,1,3,4,5} , koji su veći od nekih, u zavisnosti od nivoa značajnosti (od verovatnoće greške tipa I). Da bismo utvrdili, pod pretpostavkom da je hipoteza tačna, izračunavamo vjerovatnoće

Ako kritična regija uključuje vrijednosti {3,4,5} , tada će vjerovatnoća greške tipa I biti jednaka

U uslovima zadatka, pokazalo se da su među pet testiranih tri neispravna. Vrijednost ulazi u kritično područje. Odbacujemo hipotezu u korist alternative i vjerovatnoća da ćemo to učiniti pogrešno je manja 0,01 .

Vjerovatnoća greške tipa II je vjerovatnoća prihvatanja hipoteze kada je netačna. Hipoteza će biti prihvaćena u . Ako je vjerovatnoća proizvodnje neispravnog proizvoda zapravo jednaka , tada je vjerovatnoća prihvaćanja lažne hipoteze jednaka

Zadatak 5. Poznato je da kada se tijesto dobro izmijesi, grožđice se u njemu rasporede otprilike prema Poissonovom zakonu, tj. vjerovatnoća da ćete imati grožđice u lepinji je približno , gdje je prosječan broj grožđica po lepinji. Prilikom pečenja lepinja sa suvim grožđem, standard se oslanja na 1000 buns 9000 highlight Postoji sumnja da je u testo dodato manje grožđica nego što je propisano standardom. Za provjeru odabire se jedna lepinja i broje se grožđice u njoj. Konstruirajte kriterij za testiranje hipoteze koja je protiv alternative. Vjerovatnoća greške tipa I je približno 0,02.

Rješenje. Za testiranje hipoteze: protiv alternative, prema Neyman-Pearsonovoj lemi, kritično područje treba uključivati ​​one vrijednosti za koje

gdje je neka konstanta.

Ondan 1 H 1, pošto njegova valjanost znači efikasnost korišćenja nove tehnologije).

Stvarna vrijednost statistike kriterija

.

Pod konkurentskom hipotezom H 1 kritična vrijednost statistike se nalazi iz uslova, tj. , gdje t cr =t 0,95 =1,96.

Budući da je stvarna uočena vrijednost t=4,00 više od kritične vrijednosti t cr(za bilo koju od uzetih konkurentskih hipoteza), zatim hipotezu H 0 je odbijena, tj. Na nivou značajnosti od 5% možemo zaključiti da nova tehnologija omogućava povećanje prosječne proizvodnje radnika.

Zadatak 2. Urađena su dva uzorka žetve pšenice: sa blagovremenom žetvom i žetvom sa određenim zakašnjenjem. U prvom slučaju, pri posmatranju 8 parcela, prosječan prinos uzorka bio je 16,2 c/ha, a standardna devijacija 3,2 c/ha; u drugom slučaju, kod posmatranja 9 parcela, iste karakteristike su bile jednake 13,9 c/ha i 2,1 c/ha, respektivno. Na nivou značajnosti α=0,05 utvrditi uticaj pravovremene žetve na prosječan prinos.

Rješenje. Provjerljiva hipoteza, tj. prosječne vrijednosti prinosa za pravovremenu berbu i sa određenim zakašnjenjem su jednake. Kao alternativnu hipotezu uzimamo hipotezu čije prihvatanje znači značajan uticaj na prinos vremena žetve.

Stvarna posmatrana vrijednost statistike kriterija

.

Kritična vrijednost statistike za jednostrano područje određena je brojem stupnjeva slobode l=n 1 +n 2 -2=9+8-2= =15 iz uslova θ( t,l)=1–2·0,05=0,9, odakle prema tabeli t-distribucija (Prilog 6) nalazimo, t cr=1,75. Jer , zatim hipoteza H 0 prihvaćeno. To znači da nam dostupni podaci uzorka na nivou značajnosti od 5% ne dozvoljavaju da smatramo da neko kašnjenje u vremenu berbe ima značajan uticaj na veličinu žetve. Još jednom naglasimo da to ne znači da je hipoteza bezuslovno tačna. H 0. Sasvim je moguće da nam je samo mala veličina uzorka omogućila da prihvatimo ovu hipotezu, a sa povećanjem veličine uzorka (broja odabranih lokacija) hipoteza H 0će biti odbijena.

Zadatak 3. Dostupni su sljedeći podaci o prinosu pšenice na 8 oglednih parcela iste veličine (c/ha): 26,5; 26.2; 35.9; 30.1; 32.3; 29.3; 26.1; 25.0. Postoji razlog za vjerovanje da je vrijednost prinosa treće parcele x*=35,9 je pogrešno registrovano. Da li je ova vrijednost van granica (outlier) na nivou značajnosti od 5%?

Rješenje. Isključivanjem vrijednosti x*=35,9, nalazimo za preostala zapažanja i . Stvarna uočena vrijednost veća od vrijednosti u tabeli, dakle, vrijednost x*=35,9 je anomalan i treba ga odbaciti.

Zadatak 4.Čaure se obrađuju na dva struga. Uzeta su dva uzorka: iz čaura napravljenih na prvoj mašini n 1=15 kom., na drugoj mašini – n 2=18 kom. Na osnovu ovih uzoraka izračunate su varijanse uzorka (za prvu mašinu) i (za drugu mašinu). Uz pretpostavku da se dimenzije čaura pridržavaju normalnog zakona distribucije, na nivou značajnosti α = 0,05, utvrditi da li se može smatrati da mašine imaju različitu tačnost.

Rješenje. Imamo nultu hipotezu, tj. varijacije veličine čaura obrađenih na svakoj mašini su jednake. Uzmimo kao konkurentnu hipotezu (disperzija je veća za prvu mašinu).

.

Prema tabeli P.

Rješenje. Proverljiva hipoteza . Kao alternativu, uzmimo hipotezu. Pošto je opća varijansa σ 2 nepoznata, koristimo se t- Studentov t-test. Kriterijumska statistika je . Kritična statistička vrijednost t cr=1,83.

Od | t|>t cr(2.25>1.83), zatim hipoteza H 0 je odbijen, tj. na nivou značajnosti od 5%, predviđanje treba odbaciti.

Zadatak 6. Za empirijsku distribuciju

ODA Kriterijum za testiranje hipoteze o pretpostavljenom zakonu nepoznate distribucije naziva se kriterij dobrote uklapanja.

Postoji nekoliko testova ispravnosti: $\chi ^2$ (hi-kvadrat) K. Pearson, Kolmogorov, Smirnov, itd.

Tipično, teorijske i empirijske frekvencije se razlikuju. Slučaj neslaganja možda nije slučajan, što znači da se objašnjava činjenicom da hipoteza nije pravilno odabrana. Pirsonov kriterijum odgovara na postavljeno pitanje, ali kao i svaki kriterijum ne dokazuje ništa, već samo utvrđuje njegovo slaganje ili neslaganje sa podacima posmatranja na prihvaćenom nivou značaja.

ODA Dovoljno mala vjerovatnoća pri kojoj se događaj može smatrati praktično nemogućim naziva se nivoom značajnosti.

U praksi, nivoi značajnosti se obično uzimaju između 0,01 i 0,05, $\alpha =0,05$ je nivo značajnosti $5 ( \% ) $.

Kao kriterijum za testiranje hipoteze, uzet ćemo vrijednost \begin(equation) \label (eq1) \chi ^2=\sum ( \frac ((( n_i -n_i" ))^2 ) (n_i" ) ) \qquad (1) \ end (jednačina)

ovdje $n_i -$ empirijske frekvencije dobijene iz uzorka, $n_i" -$ teorijske frekvencije pronađene teoretski.

Dokazano je da za $n\to \infty $ zakon raspodjele slučajne varijable (1), bez obzira na zakon po kojem je populacija raspoređena, teži zakonu $\chi ^2$ (hi-kvadrat) sa $k$ stepenima slobode.

ODA Broj stupnjeva slobode se nalazi jednakošću $k=S-1-r$ gdje je $S-$ broj intervalnih grupa, $r-$ broj parametara.

1) ravnomerna raspodela: $r=2, k=S-3 $

2) normalna raspodjela: $r=2, k=S-3 $

3) eksponencijalna raspodjela: $r=1, k=S-2$.

Pravilo . Testiranje hipoteze korištenjem Pearsonovog testa.

  1. Da biste testirali hipotezu, izračunajte teorijske frekvencije i pronađite $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $
  2. Korišćenje tabele kritičnih tačaka distribucije $\chi ^2$ za dati nivo značajnosti $\alpha $ i broj stepeni slobode $k$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$ su pronađeni.
  3. Ako je $\chi _ ( obs ) ^2<\chi _ { кр } ^2 $ то нет оснований отвергать гипотезу, если не выполняется данное условие - то отвергают.

Komentar Za kontrolu proračuna, koristite formulu za $\chi ^2$ u obliku $\chi _ (uočeno) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) $

Testiranje hipoteze o uniformnoj distribuciji

Funkcija gustine uniformne distribucije veličine $X$ ima oblik $f(x)=\frac ( 1 ) ( b-a ) x\in \left[ ( a,b )\right]$.

Da bi se testirala hipoteza da je kontinuirana slučajna varijabla distribuirana prema uniformnom zakonu na nivou značajnosti $\alpha $, potrebno je:

1) Pronađite srednju vrijednost uzorka $\overline (x_b) $ i $\sigma _b =\sqrt (D_b) $ iz date empirijske distribucije. Uzmite kao procjenu parametara $a$ i $b$ količine

$a = \overline x _b -\sqrt 3 \sigma _b $, $b = \overline x _b +\sqrt 3 \sigma _b $

2) Pronađite vjerovatnoću da slučajna varijabla $X$ pada u parcijalne intervale $(( x_i ,x_ ( i+1 ) ))$ koristeći formulu $ P_i =P(( x_i

3) Pronađite teorijske (nivelacijske) frekvencije koristeći formulu $n_i" =np_i $.

4) Uzimajući broj stepeni slobode $k=S-3$ i nivo značajnosti $\alpha =0.05$ iz tabela $\chi ^2$ nalazimo $\chi _ ( cr ) ^2 $ za datu $\alpha $ i $k$, $\chi _ ( kr ) ^2 (( \alpha ,k ))$.

5) Koristeći formulu $\chi _ (opaženo) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ gdje su $n_i -$ empirijske frekvencije, nalazimo uočena vrijednost $\ chi _ ( obs ) ^2 $.

6) Ako je $\chi _ ( obs ) ^2<\chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу.

Testirajmo hipotezu koristeći naš primjer.

1) $\overline x _b =13,00\,\,\sigma _b =\sqrt (D_b) = 6,51$

2) $a=13,00-\sqrt 3 \cdot 6,51=13,00-1,732\cdot 6,51=1,72468$

$b=13,00+1,732\cdot 6,51=24,27532$

$b-a=24,27532-1,72468=22,55064$

3) $P_i =P(( x_i

$P_2 =(( 3

$P_3 =(( 7

$P_4 =(( 11

$P_5 =(( 15

$P_6 =(( 19

U uniformnoj distribuciji, ako je dužina intervala ista, onda su $P_i -$ isti.

4) Pronađite $n_i" =np_i $.

5) Pronađite $\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ i pronađite $\chi _ ( obs ) ^2 $.

Unesimo sve dobijene vrijednosti u tabelu

\begin(niz) ( |l|l|l|l|l|l|l| ) \hline i& n_i & n_i" =np_i & n_i -n_i" & (( n_i -n_i" ))^2& \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) & Control~ \frac ( n_i^2 ) ( n_i" ) \\ \hline 1& 1& 4.43438& -3.43438& 11.7950& 2.65988& 2.65989 \line \\ h& 5 \\ 6& 4.43438& 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 3& 3& 4.43438& -1.43438& 2.05744& 0.471463& 4 \\ 4\ 4 & -1,43438& 2,05744& 0,471463& 2,0296 \\ \hline 5& 6& 4,43438 & 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 6& 6& 4.43438& 1.56562& 2, 45117& 0.552765& 8.11838 & um = \\ h. 261119& \chi _ ( obs ) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) =3,63985 \\ \hline \end(niz)

$\chi _ ( cr ) ^2 (( 0.05.3 ))=7.8$

$\chi _ ( obs ) ^2<\chi _ { кр } ^2 =3,26<7,8$

Zaključak nema razloga da se hipoteza odbaci.

Ranije su razmatrane hipoteze u kojima se pretpostavljalo da je poznat zakon raspodjele populacije. Sada ćemo početi testirati hipoteze o navodnom zakonu nepoznate raspodjele, odnosno testiraćemo nultu hipotezu da je populacija raspoređena prema nekom poznatom zakonu. Obično se nazivaju statistički testovi za testiranje takvih hipoteza kriterijumi saglasnosti.

Kriterijum sporazuma naziva se kriterijem za testiranje hipoteze o pretpostavljenom zakonu nepoznate raspodjele. To je numerička mjera neslaganja između empirijske i teorijske distribucije.

Glavni zadatak. Navedena je empirijska distribucija (uzorak). Napravite pretpostavku (iznesite hipotezu) o vrsti teorijske distribucije i testirajte hipotezu na datom nivou značajnosti α.

Rješenje glavnog problema sastoji se od dva dijela:

1. Predlaganje hipoteze.

2. Testiranje hipoteze na datom nivou značajnosti.

Pogledajmo ove dijelove detaljno.

1. Odabir hipoteze Pogodno je odrediti tip teorijske distribucije pomoću poligona ili histograma frekvencije. Usporedite empirijski poligon (ili histogram) sa poznatim zakonima raspodjele i odaberite najprikladniji.

Evo grafikona najvažnijih zakona distribucije:

Primjeri empirijskih zakona distribucije prikazani su na slikama:



U slučaju (a) postavlja se hipoteza normalne raspodjele, u slučaju (b) - hipoteza uniformne distribucije, u slučaju (c) - hipoteza Poissonove raspodjele.

Osnova za postavljanje hipoteze o teorijskoj distribuciji mogu biti teorijske premise o prirodi promjene karakteristike. Na primjer, ispunjavanje uslova Ljapunovljeve teoreme omogućava nam da postavimo hipotezu o normalnoj raspodjeli. Jednakost srednje vrijednosti i varijanse sugerira Poissonovu distribuciju.

U praksi se najčešće susrećemo s normalnom distribucijom, pa u našim zadacima trebamo samo provjeriti hipotezu o normalnoj distribuciji.

Testiranje hipoteza o teorijskoj distribuciji odgovara na pitanje: može li se neslaganje između pretpostavljenih teoretskih i empirijskih distribucija smatrati slučajnim, beznačajnim, objasniti slučajnošću određenih objekata koji su uključeni u uzorak, ili to neslaganje ukazuje na značajno odstupanje između distribucija. Postoje različite metode za verifikaciju (kriterijumi dobrote) - c 2 (hi-kvadrat), Kolmogorov, Romanovski, itd.

Pearsonov kriterijum.

. Navedite broj empirijskih distribucija (od 1 do 10);

1. Testiranje hipoteze normalne distribucije.. Unesite empirijske frekvencije u tabelu; Korak 3 sa puno različitih značenja opcija. Radi praktičnosti obrade, dijelimo interval od najmanje do najveće vrijednosti opcije Neka se dobije dovoljno veliki uzorak n

sa puno različita značenja 1 različita značenja 2 … opcija. Radi praktičnosti obrade, dijelimo interval od najmanje do najveće vrijednosti opcije

s Korak 3 1 Korak 3 2 … jednake dijelove i pretpostavit ćemo da su vrijednosti opcija koje spadaju u svaki interval približno jednake broju koji specificira sredinu intervala. Prebrojavanjem broja opcija koje spadaju u svaki interval, kreiraćemo takozvani grupirani uzorak: ,

opcije……….. X x s frekvencije…………. n s Gdje-interval (empirijske frekvencije). Iz dobijenih podataka možete izračunati srednju vrijednost uzorka i standardnu ​​devijaciju uzorka n i. Provjerimo pretpostavku da je populacija raspoređena po normalnom zakonu s parametrima M(X) = , D(X) = . Tada možete pronaći broj brojeva iz veličine uzorka Korak 3, koji bi se trebao pojaviti u svakom intervalu pod ovom pretpostavkom (odnosno, teorijske frekvencije). Da bismo to učinili, koristeći tablicu vrijednosti Laplaceove funkcije, nalazimo vjerojatnost da uđemo Gdje th interval:

,

opcije……….. i ja I b i- granice i-th interval. Množenjem dobijenih vjerovatnoća sa veličinom uzorka n, nalazimo teorijske frekvencije: p i =n·p i Naš cilj je da uporedimo empirijske i teorijske frekvencije, koje se, naravno, međusobno razlikuju, i utvrdimo da li su te razlike beznačajne i ne opovrgavaju hipotezu o normalnoj distribuciji slučajne varijable koja se proučava, ili jesu li toliko velike da su u suprotnosti sa ovom hipotezom. U tu svrhu koristi se kriterij u obliku slučajne varijable

. (7)

Njegovo značenje je očigledno: sabiraju se dijelovi koje kvadrati odstupanja empirijskih frekvencija od teorijskih čine od odgovarajućih teorijskih frekvencija. Može se dokazati da, bez obzira na stvarni zakon raspodjele opće populacije, zakon raspodjele slučajne varijable (7) teži zakonu raspodjele sa brojem stupnjeva slobode k = s – 1 – r, Gdje r– broj parametara očekivane distribucije procijenjen iz podataka uzorka. Dakle, normalnu distribuciju karakterišu dva parametra k = s – 3. Za odabrani kriterijum, konstruiše se desna kritična oblast, određena uslovom

(8)

opcije……….. α – nivo značaja. Prema tome, kritično područje je dato nejednakošću a područje prihvatanja hipoteze je .

Dakle, da testiramo nultu hipotezu N 0: populacija je normalno raspoređena - potrebno je izračunati uočenu vrijednost kriterija iz uzorka:

, (7`)

i koristeći tablicu kritičnih tačaka distribucije χ 2, pronađite kritičnu tačku koristeći poznate vrijednosti α i k = s – 3. Ako - nulta hipoteza je prihvaćena, ako se odbacuje.

Primjer. Rezultati studije potražnje za proizvodom prikazani su u tabeli:

Postavite hipotezu o vrsti distribucije i testirajte je na nivou značajnosti a=0,01.

I. Predlaganje hipoteze.

Da bismo naznačili vrstu empirijske distribucije, konstruisaćemo histogram


120 160 180 200 220 280

Na osnovu izgleda histograma može se napraviti pretpostavka o normalnoj distribuciji karakteristike koja se proučava u opštoj populaciji.

II. Provjerimo hipotezu o normalnoj distribuciji koristeći Pearsonov test dobrog uklapanja.

1. Izračunajte , s B. Kao opciju, uzmite aritmetičku sredinu krajeva intervala:

2. Pronađite intervale (Z i ; Z i+1): ; .

Uzmimo (-¥) kao lijevi kraj prvog intervala, a (+¥) kao desni kraj posljednjeg intervala. Rezultati su prikazani u tabeli. 4.

3. Nađimo teorijske vjerovatnoće R i i teorijske frekvencije (vidi tabelu 4).

Tabela 4

i Granica intervala F(Zi) F(Z i+1) P i = F(Z i+1)-F(Z i)
x i x i+1 Z i Z i+1
-1,14 -0,5 -0,3729 0,1271 6,36
-1,14 -0,52 -0,3729 -0,1985 0,1744 8,72
-0,52 0,11 -0,1985 0,0438 0,2423 12,12
0,11 0,73 0,0438 0,2673 0,2235 11,18
0,73 0,2673 0,5 0,2327 11,64

4. Uporedimo empirijske i teorijske frekvencije. Da biste to učinili:

a) izračunati uočenu vrijednost Pearsonovog kriterija.

Proračuni su prikazani u tabeli 5.

Tabela 5

i
6,36 -1,36 1,8496 0,291
8,72 1,28 1,6384 0,188
12,12 1,88 3,5344 0,292
11,18 0,82 0,6724 0,060
11,64 -2,64 6,9696 0,599
S

b) pomoću tabele kritičnih tačaka distribucije c 2 na datom nivou značajnosti a=0,01 i broju stepena slobode k=m–3=5–3=2, nalazimo kritičnu tačku; imamo .

Uporediti c. . Shodno tome, nema razloga da se odbaci hipoteza o normalnom zakonu distribucije proučavane karakteristike opće populacije. One. razlika između empirijske i teorijske frekvencije je beznačajna (slučajna). ◄

Komentar. Intervali koji sadrže male empirijske frekvencije (n i<5), следует объединить, а частоты этих интервалов сложить. Если производилось объединение интервалов, то при определении числа степеней свободы по формуле K=m-3 следует в качестве m принять число оставшихся после объединения интервалов.

Primjer. Na osnovu uzorka od 24 varijante postavljena je hipoteza o normalnoj distribuciji populacije. Koristeći Pearsonov kriterijum na nivou značajnosti među datim vrednostima = (34, 35, 36, 37, 38) označavaju: a) najveću za koju nema razloga da se hipoteza odbaci; b) najmanja vrijednost, polazeći od koje hipotezu treba odbaciti.

Nađimo broj stupnjeva slobode koristeći formulu:

gdje je broj grupa uzoraka (opcija), broj parametara distribucije.

Pošto normalna distribucija ima 2 parametra ( i ), dobijamo

Koristeći tabelu kritičnih tačaka distribucije, koristeći dati nivo značajnosti i broj stepena slobode, određujemo kritičnu tačku.

U slučaju a) za vrijednosti jednake 34 i 35, nema razloga da se odbaci hipoteza o normalnoj distribuciji, jer . A najveća među ovim vrijednostima je .

U slučaju b) za vrijednosti 36, 37, 38, hipoteza se odbacuje, jer . Najmanji među njima .◄

2. Testiranje hipoteze o uniformnoj raspodjeli. Kada koristite Pearsonov test za testiranje hipoteze da je populacija ravnomjerno raspoređena s procijenjenom gustinom vjerovatnoće

Potrebno je, nakon izračunavanja vrijednosti iz raspoloživog uzorka, procijeniti parametre A I b prema formulama:

opcije……….. A* I b*- procjene A I b. Zaista, za ujednačenu distribuciju M(X) = , , gdje možete dobiti sistem za određivanje A* I b*: , čije su rješenje izrazi (9).

Onda, pod pretpostavkom , možete pronaći teorijske frekvencije pomoću formula

Evo Neka se dobije dovoljno veliki uzorak– broj intervala na koje je uzorak podijeljen.

Uočena vrijednost Pearsonovog kriterija izračunava se po formuli (7`), a kritična vrijednost se izračunava pomoću tabele, uzimajući u obzir činjenicu da je broj stupnjeva slobode k = s – 3. Nakon toga, granice kritičnog područja se određuju na isti način kao i za testiranje hipoteze normalne raspodjele.

3. Testiranje hipoteze o eksponencijalnoj raspodjeli. U ovom slučaju, nakon što smo podijelili postojeći uzorak na intervale jednake dužine, razmatramo niz opcija, jednako udaljenih jedna od druge (pretpostavljamo da sve opcije koje spadaju u Gdje- th interval, uzeti vrijednost koja se poklapa sa njegovom sredinom) i njihove odgovarajuće frekvencije n i(broj opcija uzoraka uključenih u Gdje– ti interval). Izračunajmo iz ovih podataka i uzmimo kao procjenu parametra λ veličina. Zatim se teorijske frekvencije izračunavaju pomoću formule

Zatim se upoređuju posmatrana i kritična vrednost Pearsonovog kriterijuma, uzimajući u obzir činjenicu da je broj stepeni slobode k = s – 2.

Pearsonov kriterijum za testiranje hipoteze o obliku zakona distribucije slučajne varijable. Testiranje hipoteza o normalnim, eksponencijalnim i uniformnim raspodjelama korištenjem Pearsonovog kriterija. Kolmogorov kriterijum. Približna metoda za provjeru normalnosti distribucije, povezana s procjenama koeficijenata asimetrije i kurtozisa.

U prethodnom predavanju razmatrane su hipoteze u kojima se pretpostavlja da je poznat zakon raspodjele stanovništva. Sada ćemo početi testirati hipoteze o navodnom zakonu nepoznate raspodjele, odnosno testiraćemo nultu hipotezu da je populacija raspoređena prema nekom poznatom zakonu. Tipično, statistički testovi za testiranje takvih hipoteza se nazivaju testovi dobrosti.

. Navedite broj empirijskih distribucija (od 1 do 10);

Korak 2

. Unesite empirijske frekvencije u tabelu; Korak 3 sa velikim brojem opcija za različita značenja. Radi praktičnosti njegove obrade, dijelimo interval od najmanje do najveće vrijednosti opcije Neka se dobije dovoljno veliki uzorak jednake dijelove i pretpostavit ćemo da vrijednosti variraju

mravi koji padaju u svaki interval približno su jednaki broju koji definira sredinu intervala. Prebrojavanjem broja opcija koje spadaju u svaki interval, kreiraćemo takozvani grupirani uzorak:

opcije različita značenja 1 različita značenja 2 opcija. Radi praktičnosti obrade, dijelimo interval od najmanje do najveće vrijednosti opcije

frekvencije Korak 3 1 Korak 3 2 jednake dijelove i pretpostavit ćemo da su vrijednosti opcija koje spadaju u svaki interval približno jednake broju koji specificira sredinu intervala. Prebrojavanjem broja opcija koje spadaju u svaki interval, kreiraćemo takozvani grupirani uzorak: ,

opcije……….. X- vrijednosti sredina intervala, i frekvencije………….- broj uključenih opcija Gdje-interval (empirijske frekvencije).

su vrijednosti središta intervala, i n i. Provjerimo pretpostavku da je populacija raspoređena po normalnom zakonu s parametrima M(X) = , D(X) = . Tada možete pronaći broj brojeva iz veličine uzorka Korak 3, koji bi trebao biti u svakom intervalu pod ovom pretpostavkom (odnosno, teorijske frekvencije). Da bismo to učinili, koristeći tablicu vrijednosti Laplaceove funkcije, nalazimo vjerojatnost da uđemo Gdje th interval:

,

opcije……….. i ja I b i- granice i-th interval. Množenjem dobijenih vjerovatnoća sa veličinom uzorka n, nalazimo teorijske frekvencije: p i =n?p i. Naš cilj je da uporedimo empirijske i teorijske frekvencije, koje se, naravno, međusobno razlikuju i da utvrdimo da li su te razlike beznačajne, ne opovrgavaju hipotezu o normalnoj distribuciji slučajne varijable koja se proučava, ili su toliko velike da su u suprotnosti sa ovom hipotezom. U tu svrhu koristi se kriterij u obliku slučajne varijable

. (20.1)

Njegovo značenje je očigledno: sabiraju se dijelovi koje kvadrati odstupanja empirijskih frekvencija od teorijskih čine od odgovarajućih teorijskih frekvencija. Može se dokazati da, bez obzira na stvarni zakon raspodjele opće populacije, zakon raspodjele slučajne varijable (20.1) teži zakonu raspodjele (vidi predavanje 12) sa brojem stupnjeva slobode k = s - 1 - r, Gdje r- broj parametara očekivane distribucije procijenjen iz podataka uzorka. Dakle, normalnu distribuciju karakterišu dva parametra k = s - 3. Za odabrani kriterijum, konstruiše se desna kritična oblast, određena uslovom


(20.2)

opcije……….. α - nivo značaja. Prema tome, kritično područje je dato nejednakošću a područje prihvatanja hipoteze je .

Dakle, da testiramo nultu hipotezu N 0: populacija je normalno raspoređena - potrebno je izračunati uočenu vrijednost kriterija iz uzorka:

, (20.1`)

i koristeći tablicu kritičnih tačaka distribucije χ 2, pronađite kritičnu tačku koristeći poznate vrijednosti α i k = s - 3. Ako - nulta hipoteza je prihvaćena, ako se odbacuje.

2. Testiranje hipoteze o uniformnoj raspodjeli.

Kada koristite Pearsonov kriterijum za testiranje hipoteze o ravnomernoj raspodeli populacije sa procenjenom gustinom verovatnoće

Potrebno je, nakon izračunavanja vrijednosti iz raspoloživog uzorka, procijeniti parametre A I b prema formulama:

opcije……….. A* I b*- procjene A I b. Zaista, za ujednačenu distribuciju M(X) = , , gdje možete dobiti sistem za određivanje A* I b*: , čije su rješenje izrazi (20.3).

Onda, pod pretpostavkom , možete pronaći teorijske frekvencije pomoću formula

Evo Neka se dobije dovoljno veliki uzorak- broj intervala na koje je uzorak podijeljen.

Uočena vrijednost Pearsonovog kriterija izračunava se po formuli (20.1`), a kritična vrijednost se izračunava pomoću tabele, uzimajući u obzir činjenicu da je broj stupnjeva slobode k = s - 3. Nakon toga, granice kritičnog područja se određuju na isti način kao i za testiranje hipoteze normalne raspodjele.

3. Testiranje hipoteze o eksponencijalnoj raspodjeli.

U ovom slučaju, nakon što smo podijelili postojeći uzorak na intervale jednake dužine, razmatramo niz opcija, jednako udaljenih jedna od druge (pretpostavljamo da sve opcije koje spadaju u Gdje th interval, uzeti vrijednost koja se poklapa sa njegovom sredinom) i njihove odgovarajuće frekvencije n i(broj opcija uzoraka uključenih u Gdje-ti interval). Izračunajmo iz ovih podataka i uzmimo kao procjenu parametra λ veličina. Zatim se teorijske frekvencije izračunavaju pomoću formule

Zatim se upoređuju posmatrana i kritična vrednost Pearsonovog kriterijuma, uzimajući u obzir činjenicu da je broj stepeni slobode k = s - 2.





greška: Sadržaj zaštićen!!