Odaberite Stranica

Procjene matematičkog očekivanja i varijanse, njihova svojstva. Primjeri

CILJ PREDAVANJA: uvesti koncept procjene nepoznatog parametra distribucije i dati klasifikaciju takvih estimatora; dobiti procjene bodova i intervala matematičko očekivanje i disperzija.

U praksi, u većini slučajeva, zakon raspodjele slučajne varijable je nepoznat, a prema rezultatima opservacija
potrebno je procijeniti numeričke karakteristike (na primjer, matematičko očekivanje, varijansu ili drugi momenti) ili nepoznati parametar , koji definira zakon distribucije (gustina distribucije)
slučajna varijabla koja se proučava. Dakle, za eksponencijalnu ili Poissonovu distribuciju dovoljno je procijeniti jedan parametar, a za normalnu distribuciju već treba procijeniti dva parametra – matematičko očekivanje i varijansu.

Vrste ocjenjivanja

Slučajna vrijednost
ima gustinu vjerovatnoće
, Gdje je nepoznat parametar distribucije. Kao rezultat eksperimenta, dobijene su vrijednosti ove slučajne varijable:
. Da bi se izvršila procjena u suštini znači da vrijednosti uzorka slučajne varijable moraju biti povezane s određenom vrijednošću parametra , tj. stvoriti neku funkciju rezultata posmatranja
, čija se vrijednost uzima kao procjena parametar . Indeks označava broj izvedenih eksperimenata.

Poziva se svaka funkcija koja ovisi o rezultatima promatranja statistika. Pošto su rezultati posmatranja slučajne varijable, onda će i statistika biti slučajna varijabla. Dakle, procjena
nepoznati parametar treba posmatrati kao slučajnu varijablu, a njenu vrijednost izračunati iz eksperimentalnih podataka po zapremini , – kao jedna od mogućih vrijednosti ove slučajne varijable.

Procjene parametara distribucije (numeričke karakteristike slučajne varijable) dijele se na tačke i intervale. Point Estimation parametar određena jednim brojem , a njegovu tačnost karakterizira varijansa procjene. intervalna procjena naziva se procjena, koja je određena sa dva broja, I – po krajevima intervala koji pokriva procijenjeni parametar sa datim nivoom samopouzdanja.

Klasifikacija bodovnih procjena

Da se napravi tačkasta procjena nepoznatog parametra
je najbolji u smislu tačnosti, mora biti dosljedan, nepristrasan i efikasan.

Bogati zove rezultat
parametar , ako konvergira po vjerovatnoći procijenjenom parametru, tj.

. (8.8)

Na osnovu Čebiševljeve nejednakosti, može se pokazati da je dovoljan uslov da relacija (8.8) važi jeste jednakost

.

Konzistentnost je asimptotska karakteristika procjene za
.

nepristrasan zove rezultat
(procjena bez sistematske greške), čije je matematičko očekivanje jednako procijenjenom parametru, tj.

. (8.9)

Ako jednakost (8.9) nije zadovoljena, onda se procjena naziva pristrasna. Razlika
naziva se pristrasnost ili pristrasnost procjene. Ako je jednakost (8.9) zadovoljena samo za
, tada se odgovarajuća procjena naziva asimptotski nepristrasna.

Treba napomenuti da ako je konzistentnost gotovo obavezan uslov za sve procjene koje se koriste u praksi (nekonzistentne procjene se koriste izuzetno rijetko), onda je svojstvo nepristrasnosti samo poželjno. Mnogi često korišteni procjenitelji nemaju svojstvo nepristrasnosti.

U opštem slučaju, tačnost procene određenog parametra dobijene na osnovu eksperimentalnih podataka
, karakterizira srednja kvadratna greška

,

koji se može dovesti u formu

,

gdje je disperzija,
je kvadrat pristranosti procjene.

Ako je procjena nepristrasna, onda

U finalu procjene se mogu razlikovati za srednji kvadrat greške . Naravno, što je manja ova greška, to su vrijednosti evaluacije bliže grupisane oko procijenjenog parametra. Stoga je uvijek poželjno da greška procjene bude što manja, tj.

. (8.10)

Procjena zadovoljavajući uslov (8.10) naziva se procjena sa minimalnom greškom na kvadrat.

efikasan zove rezultat
, za koje srednja kvadratna greška nije veća od srednje kvadratne greške bilo koje druge procjene, tj.

Gdje – bilo koja druga procjena parametara .

Poznato je da je varijansa bilo koje nepristrasne procjene jednog parametra zadovoljava Cramer–Rao nejednakost

,

Gdje
– gustina distribucije uslovne verovatnoće dobijenih vrednosti slučajne varijable sa pravom vrednošću parametra .

Dakle, nepristrasni procjenitelj
, za koji Cramer-Rao nejednakost postaje jednakost, bit će efektivna, tj. takva procjena ima minimalnu varijansu.

Tačkaste procjene matematičkog očekivanja i varijanse

Ako se uzme u obzir slučajna vrijednost
, koji ima matematičko očekivanje i disperzija , pretpostavlja se da su oba ova parametra nepoznata. Dakle, preko slučajne varijable
proizvedeno nezavisni eksperimenti koji daju rezultate:
. Potrebno je pronaći konzistentne i nepristrasne procjene nepoznatih parametara I .

Prema procjenama I obično se biraju statistička (uzorkova) sredina i statistička (uzorkova) varijansa:

; (8.11)

. (8.12)

Procjena očekivanja (8.11) je konzistentna prema zakonu velikih brojeva (Čebiševljev teorem):

.

Matematičko očekivanje slučajne varijable

.

Dakle, procjena je nepristrasan.

Disperzija procjene matematičkog očekivanja:

Ako je slučajna varijabla
raspoređeni prema normalnom zakonu, zatim procjena je takođe efikasan.

Matematičko očekivanje procjene varijanse

U isto vrijeme

.

Jer
, A
, onda dobijamo

. (8.13)

dakle,
je pristrasna procjena, iako je konzistentna i efikasna.

Iz formule (8.13) slijedi da bi se dobila nepristrasna procjena
varijansu uzorka (8.12) treba modificirati na sljedeći način:

što se smatra "boljim" od procjene (8.12), iako za velike ove procjene su skoro jednake jedna drugoj.

Metode za dobijanje procjena parametara distribucije

Često se u praksi zasniva na analizi fizičkog mehanizma koji generiše slučajnu varijablu
, možemo zaključiti o zakonu raspodjele ove slučajne varijable. Međutim, parametri ove distribucije su nepoznati i moraju se procijeniti iz rezultata eksperimenta, koji se obično predstavljaju kao konačni uzorak.
. Za rješavanje takvog problema najčešće se koriste dvije metode: metoda momenata i metoda maksimalne vjerovatnoće.

Metoda momenata. Metoda se sastoji u izjednačavanju teorijskih momenata sa odgovarajućim empirijskim momentima istog reda.

Empirijski početni momenti red se određuju formulama:

,

i odgovarajućih teorijskih početnih momenata th red - formule:

za diskretne slučajne varijable,

za kontinuirane slučajne varijable,

Gdje je procijenjeni parametar distribucije.

Dobiti procjene parametara distribucije koja sadrži dva nepoznata parametra I , sistem se sastoji od dvije jednačine

Gdje I su teorijski i empirijski centralni momenti drugog reda.

Rješenje sistema jednačina su procjene I nepoznati parametri distribucije I .

Izjednačavajući teorijske empirijske početne momente prvog reda, dobijamo da procjenom matematičkog očekivanja slučajne varijable
, koji ima proizvoljnu distribuciju, bit će srednja vrijednost uzorka, tj.
. Zatim, izjednačavajući teorijske i empirijske centralne momente drugog reda, dobijamo da je procjena varijanse slučajne varijable
, koji ima proizvoljnu distribuciju, određuje se formulom

.

Na sličan način se mogu pronaći procjene teorijskih momenata bilo kojeg reda.

Metoda momenata je jednostavna i ne zahtijeva složene proračune, ali su procjene dobivene ovom metodom često neefikasne.

Metoda maksimalne vjerovatnoće. Metoda maksimalne vjerovatnoće tačkaste procjene nepoznatih parametara distribucije svodi se na pronalaženje maksimalne funkcije jednog ili više procijenjenih parametara.

Neka
je kontinuirana slučajna varijabla, koja kao rezultat testovi su uzimali vrijednosti
. Da biste dobili procjenu nepoznatog parametra potrebno je pronaći vrijednost , pri čemu bi vjerovatnoća realizacije dobijenog uzorka bila maksimalna. Jer
su međusobno nezavisne veličine sa istom gustinom verovatnoće
, To funkcija vjerovatnoće pozvati funkciju argumenta :

Procjena maksimalne vjerovatnoće parametra ova vrijednost se zove , pri kojoj funkcija vjerovatnoće dostiže svoj maksimum, tj. rješenje je jednadžbe

,

što očigledno zavisi od rezultata testa
.

Pošto funkcije
I
dostići maksimum pri istim vrijednostima
, onda često, da pojednostave proračune, koriste logaritamsku funkciju vjerovatnoće i traže korijen odgovarajuće jednadžbe

,

koji se zove jednadžba vjerovatnoće.

Ako trebate procijeniti nekoliko parametara
distribucija
, tada će funkcija vjerovatnoće ovisiti o ovim parametrima. Da biste pronašli procjene
distributivnih parametara, potrebno je riješiti sistem jednačine vjerovatnoće

.

Metoda maksimalne vjerovatnoće daje konzistentne i asimptotski efikasne procjene. Međutim, procjene dobijene metodom maksimalne vjerovatnoće su ponekad pristrasne, a osim toga, da bi se pronašle procjene, često se moraju riješiti prilično složeni sistemi jednačina.

Intervalne procjene parametara

Preciznost bodovnih procjena karakterizira njihova disperzija. Istovremeno, nema informacija o tome koliko su dobijene procjene bliske pravim vrijednostima parametara. U nizu zadataka potrebno je ne samo pronaći parametar odgovarajuću numeričku vrijednost, ali i ocijeniti njegovu tačnost i pouzdanost. Potrebno je otkriti do kojih grešaka može dovesti zamjena parametara. svoju tačku procenu i sa kojim stepenom pouzdanosti možemo očekivati ​​da ove greške neće preći poznate granice.

Takvi problemi su posebno relevantni za mali broj eksperimenata. kada je tačka procena uglavnom slučajna i približna zamjena on može dovesti do značajnih grešaka.

Potpuniji i pouzdaniji način za procjenu parametara distribucija je da se odredi ne vrijednost jedne tačke, već interval koji, sa datom vjerovatnoćom, pokriva pravu vrijednost procijenjenog parametra.

Pusti rezultate eksperimentima, dobija se nepristrasna procjena
parametar . Potrebno je procijeniti moguću grešku. Odabrana je neka dovoljno velika vjerovatnoća
(na primjer), takav da se događaj sa ovom vjerovatnoćom može smatrati praktički sigurnim događajem i takva vrijednost je pronađena , za koji

. (8.15)

U ovom slučaju, raspon praktički mogućih vrijednosti greške koja se javlja prilikom zamjene on , će
, a velike apsolutne greške će se pojaviti samo s malom vjerovatnoćom .

Izraz (8.15) znači da sa vjerovatnoćom
nepoznata vrijednost parametra pada u interval

. (8.16)

Vjerovatnoća
pozvao nivo samopouzdanja, i interval pokrivanje sa verovatnoćom poziva se prava vrijednost parametra interval povjerenja. Imajte na umu da je netačno reći da vrijednost parametra leži unutar intervala povjerenja s vjerovatnoćom . Korišteni izraz (pokriva) znači da iako je procijenjeni parametar nepoznat, on ima konstantnu vrijednost i stoga nema širenje, budući da nije slučajna varijabla.

Najvažnije numeričke karakteristike slučajne varijable X su ona matematičko očekivanje m x =M i disperzijaσ 2 x = D[x] = M[(X – m x) 2 ] = M –. Broj mx je srednja vrijednost slučajne varijable oko koje su vrijednosti veličina raspršene X, mjera ovog širenja je disperzija D[x] I standardna devijacija:

s x =(1.11)

Dalje ćemo razmotriti važan problem za proučavanje posmatrane slučajne varijable. Neka postoji neki uzorak (označit ćemo ga S) slučajna varijabla X. Potrebno je procijeniti nepoznate vrijednosti iz raspoloživog uzorka mx i .

Teorija procjena različitih parametara zauzima značajno mjesto u matematičkoj statistici. Stoga, hajde da prvo razmotrimo opšti problem. Neka je potrebno procijeniti neki parametar a po uzorku S. Svaka takva evaluacija a* je neka funkcija a*=a*(S) iz vrijednosti uzorka. Vrijednosti uzorka su nasumične, dakle i sama procjena a* je slučajna varijabla. Možete napraviti mnogo različitih procjena (tj. funkcija) a*, ali je istovremeno poželjno imati „dobru“ ili čak „najbolju“, u nekom smislu, ocjenu. Procjene obično podliježu sljedeća tri prirodna zahtjeva.

1. Nepristrasan. Matematičko očekivanje procjene a* mora biti jednaka tačnoj vrijednosti parametra: M = a. Drugim riječima, rezultat a* ne bi trebalo imati sistematsku grešku.

2. Dosljednost. Uz beskonačno povećanje veličine uzorka, procjena a* treba konvergirati na tačnu vrijednost, odnosno, kako se broj opservacija povećava, greška procjene teži nuli.

3. Efikasnost. Ocjena a* naziva se efikasnim ako je nepristrasan i ima najmanju moguću varijansu greške. U ovom slučaju, raspršivanje procjena je minimalno. a* u odnosu na tačnu vrijednost, a procjena je, u određenom smislu, "najtačnija".

Nažalost, nije uvijek moguće napraviti procjenu koja istovremeno zadovoljava sva tri zahtjeva.

Za procjenu matematičkog očekivanja najčešće se koristi procjena.

= , (1.12)

odnosno aritmetička sredina uzorka. Ako je slučajna varijabla X ima konačan mx I s x, tada je procjena (1.12) nepristrasna i konzistentna. Ova procjena je efektivna, na primjer, ako X Ima normalna distribucija(sl.p.1.4, dodatak 1). Za druge distribucije, možda neće biti efektivno. Na primjer, u slučaju uniformne distribucije (Slika 1.1, Dodatak 1), nepristrasna, dosljedna procjena će biti

(1.13)

Istovremeno, procjena (1.13) za normalnu distribuciju neće biti ni konzistentna ni efikasna, a čak će se i pogoršavati s povećanjem veličine uzorka.

Dakle, za svaki tip distribucije slučajne varijable X trebali biste koristiti svoju procjenu matematičkog očekivanja. Međutim, u našoj situaciji, tip distribucije može biti poznat samo hipotetički. Stoga ćemo koristiti procjenu (1.12), koja je prilično jednostavna i ima najvažnija svojstva nepristrasnosti i konzistentnosti.

Za procjenu matematičkog očekivanja za grupirani uzorak koristi se sljedeća formula:

= , (1.14)

koji se može dobiti iz prethodnog, ako uzmemo u obzir sve m i vrijednosti uzorka koje spadaju i-ti interval jednak reprezentativnom z i ovaj interval. Ova procjena je, naravno, grublja, ali zahtijeva mnogo manje izračunavanja, posebno sa velikom veličinom uzorka.

Za procjenu varijanse, najčešće korištena procjena je:

= , (1.15)

Ova procjena nije pristrasna i konzistentna je za bilo koju slučajnu varijablu X, koji ima konačne momente do četvrtog reda uključujući.

U slučaju grupiranog uzorka, koristi se procjena:

= (1.16)

Procjene (1.14) i (1.16) su, po pravilu, pristrasne i neodržive, jer se njihova matematička očekivanja i granice do kojih konvergiraju razlikuju od mx i zbog zamjene svih vrijednosti uzorka koje spadaju i–th interval, po reprezentativnom intervalu z i.

Imajte na umu da za velike n, koeficijent n/(n – 1) u izrazima (1.15) i (1.16) je blizu jedinice, pa se može izostaviti.

Intervalne procjene.

Neka je tačna vrijednost nekog parametra a i pronašao svoju procjenu a*(S) po uzorku S. Procijenite a* odgovara tački na numeričkoj osi (slika 1.5), pa se ova procjena naziva tačka. Sve procjene razmatrane u prethodnom odjeljku su bodovne procjene. Gotovo uvijek, slučajno

a* ¹ a, i možemo se samo nadati da je poenta a* je negde blizu a. Ali koliko blizu? Svaka druga procjena bodova imat će isti nedostatak - nepostojanje mjere pouzdanosti rezultata.


Sl.1.5. Point Estimation parametar.

Konkretnije u ovom pogledu su intervalne procjene. Rezultat intervala je interval I b \u003d (a, b), u kojem se nalazi tačna vrijednost procijenjenog parametra sa datom vjerovatnoćom b. Interval Ib pozvao interval povjerenja, i vjerovatnoća b pozvao nivo samopouzdanja i može se smatrati kao pouzdanost procjene.

Interval pouzdanosti će se zasnivati ​​na dostupnom uzorku S, slučajan je u smislu da su njegove granice nasumične a(S) I b(S), koje ćemo izračunati iz (slučajnog) uzorka. Zbog toga b postoji vjerovatnoća da će slučajni interval Ibće pokriti neslučajnu tačku a. Na sl. 1.6. interval Ib pokrio poentu a, A Ib*- Ne. Stoga nije sasvim ispravno to reći a" spada u interval.

Ako nivo samopouzdanja b veliki (npr. b = 0,999), tada gotovo uvijek tačna vrijednost a je u konstruisanom intervalu.


Sl.1.6. Intervali pouzdanosti parametara a za različite uzorke.

Razmotrimo metodu za konstruiranje intervala povjerenja za matematičko očekivanje slučajne varijable X, na osnovu centralna granična teorema.

Neka je slučajna varijabla X ima nepoznato matematičko očekivanje mx I poznata varijansa. Zatim, na osnovu središnje granične teoreme, aritmetička sredina je:

= , (1.17)

rezultate n nezavisni testovi količine X je slučajna varijabla čija je distribucija za velike n, blizu normalne distribucije sa srednjom mx i standardnu ​​devijaciju. Dakle, slučajna varijabla

(1.18)

ima distribuciju vjerovatnoće koja se može uzeti u obzir standardno normalno sa gustinom distribucije j(t), čiji je grafikon prikazan na slici 1.7 (kao i na slici str. 1.4, Dodatak 1).



Sl.1.7. Gustoća vjerovatnoće slučajne varijable t.

Neka je data pouzdana vjerovatnoća b I tb- broj koji zadovoljava jednačinu

b \u003d F 0 (t b) - F 0 (-t b) \u003d 2 F 0 (t b),(1.19)

Gdje - Laplaceova funkcija. Zatim vjerovatnoća pada u interval (-t b , t b) biće jednaka osenčenom na slici 1.7. površina, i, na osnovu izraza (1.19), jednaka je b. Dakle

b = P(-t b< < t b) = P( – tb< m x < + t b ) =

=P( – tb< m x < + t b) .(1.20)

Dakle, kao interval pouzdanosti možemo uzeti interval

I b = ( – t b ; + tb ) , (1.21)

budući da izraz (1.20) znači da je nepoznata tačna vrijednost mx je u Ib sa datom verovatnoćom poverenja b. Za gradnju Ib potrebno prema b nađi tb iz jednačine (1.19). Evo nekih vrijednosti tb potrebno u budućnosti :

t 0,9 = 1,645; t 0,95 = 1,96; t 0,99 = 2,58; t 0,999 = 3,3.

Prilikom izvođenja izraza (1.21) pretpostavljalo se da je poznata tačna vrijednost srednje kvadratne devijacije s x. Međutim, to nije uvijek poznato. Stoga koristimo njegovu procjenu (1.15) i dobijamo:

I b = ( – t b ; + t b). (1.22)

U skladu s tim, procjene i dobivene iz grupisanog uzorka daju sljedeću formulu za interval pouzdanosti:

I b = ( – t b ; + t b). (1.23)

Neka slučajni uzorak bude generisan posmatranom slučajnom varijablom ξ, matematičkim očekivanjem i varijansom koji su nepoznati. Kao procjene za ove karakteristike, predloženo je korištenje srednje vrijednosti uzorka

i varijansu uzorka

. (3.14)

Razmotrimo neka svojstva procjena matematičkog očekivanja i varijanse.

1. Izračunajte matematičko očekivanje srednje vrijednosti uzorka:

Stoga je srednja vrijednost uzorka nepristrasna procjena za .

2. Podsjetimo da su rezultati zapažanja su nezavisne slučajne varijable, od kojih svaka ima isti zakon raspodjele kao i vrijednost , što znači da , , . Pretpostavićemo da je varijansa konačna. Tada, prema Čebiševljevom teoremu o zakonu velikih brojeva, za bilo koje ε > 0 imamo jednakost ,

što se može napisati ovako: . (3.16) Upoređujući (3.16) sa definicijom svojstva konzistentnosti (3.11), vidimo da je procjena konzistentna procjena očekivanja.

3. Pronađite varijansu srednje vrijednosti uzorka:

. (3.17)

Dakle, varijansa procjene očekivanja opada obrnuto s veličinom uzorka.

Može se dokazati da ako je slučajna varijabla ξ normalno raspoređena, onda je srednja vrijednost uzorka efektivna procjena matematičkog očekivanja, odnosno varijansa uzima najmanju vrijednost u poređenju sa bilo kojom drugom procjenom matematičkog očekivanja. Za druge zakone distribucije ξ, to možda nije slučaj.

Varijanca uzorka je pristrasna procjena varijanse, jer . (3.18)

Zaista, koristeći svojstva matematičkog očekivanja i formule (3.17), nalazimo

.

Da bi se dobila nepristrasna procjena varijanse, procjena (3.14) se mora ispraviti, odnosno pomnožiti sa . Tada dobijamo nepristrasnu varijansu uzorka

. (3.19)

Imajte na umu da se formule (3.14) i (3.19) razlikuju samo u nazivniku, a za velike vrijednosti uzorkovane i nepristrasne varijanse se malo razlikuju. Međutim, za malu veličinu uzorka treba koristiti relaciju (3.19).

Za procjenu standardne devijacije slučajne varijable koristi se takozvana “ispravljena” standardna devijacija, koja je jednaka kvadratni korijen iz nepristrasne varijanse: .

Interval Estimates

U statistici postoje dva pristupa procjeni nepoznatih parametara distribucija: tačka i interval. U skladu sa procjenom tačaka, o kojoj je bilo riječi u prethodnom dijelu, naznačena je samo tačka blizu koje se nalazi procijenjeni parametar. Međutim, poželjno je znati koliko ovaj parametar zapravo može stajati od moguće implementacije procjena u različitim serijama opservacija.

Odgovor na ovo pitanje - također približan - daje drugi način procjene parametara - interval. U skladu sa ovom metodom procjene, pronađen je interval koji, s vjerovatnoćom bliskom jedinici, pokriva nepoznatu numeričku vrijednost parametra.

Koncept intervalne procjene

Point Estimation je slučajna varijabla i za moguće implementacije uzorak uzima vrijednosti samo približno jednake pravoj vrijednosti parametra. Što je razlika manja, to je tačnija procjena. Dakle, pozitivan broj za koji , karakterizira tačnost procjene i naziva se greška procjene (ili marginalna greška).

Vjerojatnost povjerenja(ili pouzdanost) naziva se verovatnoća β , sa kojim je nejednakost , tj.

. (3.20)

Zamjena nejednakosti njegova ekvivalentna dvostruka nejednakost , ili , dobijamo

Interval pokrivanje sa verovatnoćom β , , nepoznati parametar , se poziva interval povjerenja (ili intervalna procjena), odgovara nivou poverenja β .

Slučajna varijabla nije samo procjena, već i greška: njena vrijednost zavisi od vjerovatnoće β i, po pravilu, iz uzorka. Stoga je interval pouzdanosti nasumičan i izraz (3.21) treba čitati na sljedeći način: „Interval će pokriti parametar sa vjerovatnoćom β “, a ne ovako: “Parametar će s vjerovatnoćom pasti u interval β ”.

Značenje intervala pouzdanosti je da sa ponovljenim ponavljanjem volumena uzorka u relativnom udjelu slučajeva jednakom β , interval pouzdanosti koji odgovara nivou pouzdanosti β , pokriva pravu vrijednost procijenjenog parametra. Dakle, nivo samopouzdanja β karakteriše pouzdanost procjena povjerenja: što više β , veća je vjerovatnoća da implementacija intervala povjerenja sadrži nepoznati parametar.

Procjene matematičkog očekivanja i varijanse.

Upoznali smo se sa konceptom parametara distribucije u teoriji vjerovatnoće. Na primjer, u zakonu normalne distribucije koji je dat funkcijom gustoće vjerovatnoće

parametri su A– matematičko očekivanje i A je standardna devijacija. U Poissonovoj distribuciji, parametar je broj a = pr.

Definicija. Statistička procjena nepoznatog parametra teorijske distribucije je njegova približna vrijednost, koja ovisi o podacima uzorka(x 1, x 2, x 3,..., x k ; str 1, str 2, str 3,..., p k), tj. neka funkcija ovih veličina.

Evo x 1, x 2, x 3,..., x k– vrijednosti karakteristika, str 1, str 2, str 3,..., p k su odgovarajuće frekvencije. Statistička procjena je slučajna varijabla.

Označiti sa θ je procijenjeni parametar, i kroz θ * - njegov statistička evaluacija. Vrijednost | θ *–θ | pozvao tačnost procjene.Što manje | θ *–θ |, što bolje, nepoznati parametar je preciznije definisan.

Za pogodak θ * je od praktične važnosti, ne bi trebalo da sadrži sistematsku grešku i da istovremeno ima najmanju moguću varijaciju. Osim toga, sa povećanjem veličine uzorka, vjerovatnoća proizvoljno malih odstupanja | θ *–θ | treba da bude blizu 1.

Hajde da formulišemo sledeće definicije.

1. Procjena parametra se naziva nepristrasna ako je njeno matematičko očekivanje M(θ *) jednako procijenjenom parametru θ, tj.

M(θ *) = θ, (1)

i offset if

M(θ *) ≠ θ, (2)

2. Procjena θ* se naziva konzistentnom ako je za bilo koje δ > 0

(3)

Jednakost (3) glasi: procjena θ * konvergira u vjerovatnoći da θ .

3. Procjena θ* se naziva efektivnom ako, za dato n, ima najmanju varijansu.

Teorema 1.Srednja vrijednost uzorka H V je nepristrasna i konzistentna procjena matematičkog očekivanja.

Dokaz. Neka uzorak bude reprezentativan, odnosno svi elementi stanovništva imaju iste šanse da budu uključeni u uzorak. Vrijednosti karakteristika x 1 , x 2 , x 3 ,..., x n mogu se uzeti kao nezavisne slučajne varijable X 1, X 2, X 3, ..., X n sa istim distribucijama i numeričkim karakteristikama, uključujući i one sa jednakim matematičkim očekivanjima A,

Budući da svaka od količina X 1, X 2, X 3, ..., X str onda ima distribuciju koja se poklapa sa distribucijom opšte populacije M(X)= a. Zbog toga

odakle slijedi da je to konzistentna procjena M(X).

Koristeći pravilo istraživanja ekstremuma, možemo dokazati da je i to efikasna procjena M(X).

Potreba za procjenom matematičkog očekivanja na osnovu rezultata testa javlja se u problemima gdje je rezultat eksperimenta opisan slučajnom varijablom, a indikatorom kvaliteta objekta koji se proučava pretpostavlja se matematičko očekivanje ove slučajne varijable. Na primjer, matematičko očekivanje radnog vremena sistema može se uzeti kao pokazatelj pouzdanosti, a pri ocjeni efikasnosti proizvodnje matematičko očekivanje broja dobrih proizvoda itd.

Problem procjene matematičkog očekivanja je formuliran na sljedeći način. Pretpostavimo da za određivanje nepoznate vrijednosti slučajne varijable X treba učiniti n nezavisnih i bez sistematskih grešaka mjerenja X v X 2 ,..., X str. Potrebno je odabrati najbolju procjenu matematičkog očekivanja.

Najbolja i najčešća procjena matematičkog očekivanja u praksi je aritmetička sredina rezultata testa

takođe pozvan statistički ili srednja vrijednost uzorka.

Pokažimo da je procjena t x zadovoljava sve zahtjeve za evaluaciju bilo kojeg parametra.

1. Iz izraza (5.10) slijedi da

tj. rezultat t "x- nepristrasna procjena.

2. Prema Čebiševovoj teoremi, aritmetička sredina rezultata testa konvergira po vjerovatnoći matematičkom očekivanju, tj.

Prema tome, procjena (5.10) je konzistentna procjena očekivanja.

3. Varijanca procjene t x, jednaka

Kako se veličina uzorka povećava, n se neograničeno smanjuje. Dokazano je da ako slučajna varijabla X podliježe zakonu normalne distribucije, onda za bilo koju P varijansa (5.11) će biti najmanja moguća, a procjena t x- efektivna procjena matematičkog očekivanja. Poznavanje varijanse procjene omogućava da se donese sud o tačnosti određivanja nepoznate vrijednosti matematičkog očekivanja koristeći ovu procjenu.

Kao procena matematičkog očekivanja koristi se aritmetička sredina ako su rezultati merenja podjednako tačni (varijanse D, i = 1, 2, ..., P isti su u svakoj dimenziji). Međutim, u praksi se mora nositi sa zadacima u kojima rezultati mjerenja nisu jednaki (npr. tokom testiranja mjerenja se vrše različitim instrumentima). U ovom slučaju, procjena za matematičko očekivanje ima oblik

Gdje je težina i-tog mjerenja.

U formuli (5.12), rezultat svakog mjerenja je uključen s vlastitom težinom WITH.. Dakle, evaluacija rezultata mjerenja t x pozvao prosjećna težina.

Može se pokazati da je procjena (5.12) nepristrasna, konzistentna i efikasna procjena očekivanja. Minimalna varijansa procjene je data sa


Prilikom provođenja eksperimenata s kompjuterskim modelima, slični problemi nastaju kada se procjene pronađu iz rezultata nekoliko serija testova i broj testova u svakoj seriji je različit. Na primjer, obavljene su dvije serije testova sa zapreminom p 1 i n 2 , prema čijim rezultatima su procjene T xi i t x _. Kako bi se poboljšala tačnost i pouzdanost određivanja matematičkog očekivanja, rezultati ovih serija testova su kombinovani. Da biste to učinili, koristite izraz (5.12)

Prilikom izračunavanja koeficijenata C, umjesto varijansi D, zamjenjuju se njihove procjene dobivene iz rezultata ispitivanja u svakoj seriji.

Sličan pristup se također koristi u određivanju vjerovatnoće slučajnog događaja na osnovu rezultata serije testova.

Za procjenu matematičkog očekivanja slučajne varijable X, pored srednje vrijednosti uzorka, mogu se koristiti i druge statistike. U tu svrhu najčešće se koriste članovi. varijantne serije, odnosno statistike reda, na osnovu kojih se grade procjene,

zadovoljavanje glavnih zahtjeva, odnosno dosljednost i nepristrasnost.

Pretpostavimo da serija varijacija sadrži n = 2kčlanovi. Tada se bilo koji od prosjeka može uzeti kao procjena matematičkog očekivanja:

Gde to-e prosjek

nije ništa drugo do statistički medijan distribucije slučajne varijable X, budući da postoji očigledna jednakost

Prednost statističke medijane je u tome što je oslobođena uticaja anomalnih rezultata opservacije, što je neizbježno kada se koristi prvi prosjek, odnosno prosjek najmanjeg i najvećeg broja varijacionih serija.

Sa čudnom veličinom uzorka P = 2k- 1 statistička medijana je njegov srednji element, tj. To-ti član varijacionog niza Me = x k.

Postoje distribucije za koje aritmetička sredina nije efektivna procjena matematičkog očekivanja, na primjer, Laplaceova raspodjela. Može se pokazati da je za Laplaceovu distribuciju efektivna procjena srednje vrijednosti medijan uzorka.

Dokazano je da ako slučajna varijabla X ima normalnu distribuciju, onda je uz dovoljno veliku veličinu uzorka zakon distribucije statističke medijane blizak normalnom s numeričkim karakteristikama

Iz poređenja formula (5.11) i (5.14) proizilazi da je varijansa statističke medijane 1,57 puta veća od varijanse aritmetičke sredine. Stoga je aritmetička sredina kao procjena matematičkog očekivanja mnogo efikasnija od statističke medijane. Međutim, zbog jednostavnosti proračuna, neosjetljivosti na anomalne rezultate mjerenja („kontaminacija“ uzorka), u praksi se statistički medijan ipak koristi kao procjena matematičkog očekivanja.

Treba napomenuti da su za kontinuirane simetrične distribucije srednja vrijednost i medijan isti. Stoga statistička medijana može poslužiti kao dobra procjena matematičkog očekivanja samo za simetričnu distribuciju slučajne varijable.

Za iskrivljene distribucije, statistički medijan Ja ima značajnu pristrasnost u odnosu na matematičko očekivanje, stoga je neprikladan za njegovu procjenu.



greška: Sadržaj je zaštićen!!