Vyberte možnost Stránka

Odhady matematického očekávání a rozptylu, jejich vlastnosti. Příklady

CÍL PŘEDNÁŠKY: představit koncept odhadu neznámého distribučního parametru a podat klasifikaci těchto odhadů; získat bodové a intervalové odhady matematického očekávání a rozptylu.

V praxi je ve většině případů zákon rozdělení náhodné veličiny neznámý a podle výsledků pozorování
je nutné vyhodnotit číselné charakteristiky (například matematické očekávání, rozptyl nebo jiné momenty) nebo neznámý parametr , který definuje distribuční zákon (hustota distribuce)
studovaná náhodná proměnná. Takže pro exponenciální nebo Poissonovo rozdělení stačí vyhodnotit jeden parametr a pro normální rozdělení se už mají vyhodnotit parametry dva - matematické očekávání a rozptyl.

Typy hodnocení

Náhodná hodnota
má hustotu pravděpodobnosti
, kde je neznámý distribuční parametr. V důsledku experimentu byly získány hodnoty této náhodné proměnné:
. Provést hodnocení v podstatě znamená, že vzorové hodnoty náhodné proměnné musí být spojeny s určitou hodnotou parametru , tedy vytvořit nějakou funkci výsledků pozorování
, jehož hodnota je brána jako odhad parametr . Index udává počet provedených experimentů.

Zavolá se jakákoli funkce, která závisí na výsledcích pozorování statistika. Vzhledem k tomu, že výsledky pozorování jsou náhodné veličiny, bude náhodnou veličinou i statistika. Proto ten odhad
neznámý parametr by měla být považována za náhodnou veličinu a její hodnota se vypočítá z experimentálních dat objemově , – jako jedna z možných hodnot této náhodné veličiny.

Odhady distribučních parametrů (číselné charakteristiky náhodné veličiny) se dělí na bodové a intervalové. Bodový odhad parametr určeno jedním číslem a jeho přesnost je charakterizována rozptylem odhadu. intervalový odhad tzv. odhad, který je určen dvěma čísly, a – podle konců intervalu pokrývajícího odhadovaný parametr s danou úrovní spolehlivosti.

Klasifikace bodových odhadů

Chcete-li provést bodový odhad neznámého parametru
je nejlepší z hlediska přesnosti, musí být konzistentní, nezaujatý a efektivní.

Bohatý tzv. skóre
parametr , pokud konverguje v pravděpodobnosti k odhadovanému parametru, tzn.

. (8.8)

Na základě Čebyševovy nerovnosti lze ukázat, že postačující podmínkou pro platnost vztahu (8.8) je rovnost

.

Konzistence je asymptotická charakteristika odhadu pro
.

objektivní tzv. skóre
(odhad bez systematické chyby), jehož matematické očekávání se rovná odhadovanému parametru, tzn.

. (8.9)

Pokud rovnost (8.9) není splněna, pak se odhad nazývá vychýlený. Rozdíl
nazývané zkreslení nebo zkreslení odhadu. Je-li rovnost (8.9) splněna pouze pro
, pak se odpovídající odhad nazývá asymptoticky nestranný.

Je třeba poznamenat, že pokud je konzistence téměř povinnou podmínkou pro všechny v praxi používané odhady (nekonzistentní odhady se používají extrémně zřídka), pak je vlastnost nestrannosti pouze žádoucí. Mnoho běžně používaných odhadů nemá nezaujatou vlastnost.

V obecném případě přesnost odhadu určitého parametru získané na základě experimentálních dat
, je charakterizována střední čtvercovou chybou

,

které lze přivést do formuláře

,

kde je rozptyl,
je druhá mocnina zkreslení odhadu.

Pokud je odhad nestranný, pak

Ve finále odhady se mohou lišit o střední čtverec chyby . Přirozeně, čím menší je tato chyba, tím přesněji jsou hodnoty vyhodnocení seskupeny kolem odhadovaného parametru. Proto je vždy žádoucí, aby chyba odhadu byla co nejmenší, tedy podmínka

. (8.10)

Odhad splnění podmínky (8.10) se nazývá odhad s minimální čtvercovou chybou.

účinný tzv. skóre
, u kterého střední kvadratická chyba není větší než střední kvadratická chyba jakéhokoli jiného odhadu, tzn.

kde – jakýkoli odhad dalšího parametru .

Je známo, že rozptyl jakéhokoli nestranného odhadu jednoho parametru splňuje Cramer-Raoovu nerovnost

,

kde
– podmíněná hustota rozdělení pravděpodobnosti získaných hodnot náhodné veličiny se skutečnou hodnotou parametru .

Tedy nezaujatý odhadce
, pro které se Cramer-Rao nerovnost stane rovností, bude efektivní, tj. takový odhad má minimální rozptyl.

Bodové odhady matematického očekávání a rozptylu

Pokud se uvažuje náhodná hodnota
, která má matematické očekávání a disperze , předpokládá se, že oba tyto parametry jsou neznámé. Proto nad náhodnou veličinou
vyrobeno nezávislé experimenty, které dávají výsledky:
. Je nutné najít konzistentní a nezkreslené odhady neznámých parametrů a .

Podle odhadů a obvykle se volí statistický (výběrový) průměr a statistický (výběrový) rozptyl:

; (8.11)

. (8.12)

Odhad očekávání (8.11) je konzistentní podle zákona velkých čísel (Čebyševova věta):

.

Matematické očekávání náhodné veličiny

.

Proto ten odhad je nezaujatý.

Rozptyl odhadu matematického očekávání:

Pokud náhodná veličina
rozděleno podle normálního zákona, pak odhad je také účinný.

Matematické očekávání odhadu rozptylu

Ve stejný čas

.

Tak jako
, a
, pak dostaneme

. (8.13)

Takto,
je zkreslený odhad, i když je konzistentní a účinný.

Ze vzorce (8.13) vyplývá, že pro získání nezkresleného odhadu
výběrový rozptyl (8.12) by měl být upraven takto:

což je považováno za „lepší“ než odhad (8.12), i když pro velké tyto odhady jsou téměř stejné.

Metody získávání odhadů distribučních parametrů

V praxi často na základě analýzy fyzikálního mechanismu, který generuje náhodnou veličinu
, můžeme dojít k závěru o zákonu rozdělení této náhodné veličiny. Parametry tohoto rozdělení jsou však neznámé a je třeba je odhadnout z výsledků experimentu, obvykle prezentovaného jako konečný vzorek.
. K řešení takového problému se nejčastěji používají dvě metody: metoda momentů a metoda maximální věrohodnosti.

Metoda momentů. Metoda spočívá ve zrovnoprávnění teoretických momentů s odpovídajícími empirickými momenty stejného řádu.

Empirické počáteční momenty pořadí jsou určeny vzorcem:

,

a odpovídající teoretické počáteční momenty řád - vzorce:

pro diskrétní náhodné proměnné,

pro spojité náhodné proměnné,

kde je odhadovaný distribuční parametr.

Získat odhady parametrů rozdělení obsahující dva neznámé parametry a , systém se skládá ze dvou rovnic

kde a jsou teoretické a empirické ústřední momenty druhého řádu.

Řešením soustavy rovnic jsou odhady a neznámé distribuční parametry a .

Porovnáním teoretických empirických počátečních momentů prvního řádu získáme, že odhadem matematického očekávání náhodné veličiny
, který má libovolné rozdělení, bude výběrový průměr, tzn.
. Poté, když přirovnáme teoretické a empirické centrální momenty druhého řádu, získáme, že odhad rozptylu náhodné veličiny
, který má libovolné rozdělení, je určen vzorcem

.

Podobným způsobem lze nalézt odhady teoretických momentů libovolného řádu.

Metoda momentů je jednoduchá a nevyžaduje složité výpočty, ale odhady získané touto metodou jsou často neefektivní.

Metoda maximální pravděpodobnosti. Metoda maximální věrohodnosti bodového odhadu neznámých distribučních parametrů je redukována na nalezení maximální funkce jednoho nebo více odhadovaných parametrů.

Nechat
je spojitá náhodná veličina, která jako výsledek testy nabraly hodnoty
. Chcete-li získat odhad neznámého parametru je potřeba najít hodnotu , při kterém by pravděpodobnost realizace získaného vzorku byla maximální. Tak jako
jsou vzájemně nezávislé veličiny se stejnou hustotou pravděpodobnosti
, pak pravděpodobnostní funkce zavolejte funkci argument :

Odhad maximální pravděpodobnosti parametru tato hodnota se nazývá , při kterém věrohodnostní funkce dosáhne svého maxima, tj. je řešením rovnice

,

což samozřejmě závisí na výsledcích testů
.

Vzhledem k tomu, funkce
a
dosáhnout maxima při stejných hodnotách
, pak často pro zjednodušení výpočtů používají funkci logaritmické pravděpodobnosti a hledají kořen odpovídající rovnice

,

který se nazývá pravděpodobnostní rovnice.

Pokud potřebujete vyhodnotit několik parametrů
rozdělení
, pak bude pravděpodobnostní funkce záviset na těchto parametrech. Chcete-li najít odhady
distribuční parametry, je nutné systém vyřešit pravděpodobnostní rovnice

.

Metoda maximální věrohodnosti poskytuje konzistentní a asymptoticky účinné odhady. Odhady získané metodou maximální věrohodnosti jsou však někdy vychýlené a k nalezení odhadů je navíc často nutné řešit poměrně složité soustavy rovnic.

Intervalové odhady parametrů

Přesnost bodových odhadů je charakterizována jejich rozptylem. Zároveň neexistují žádné informace o tom, jak blízko jsou získané odhady skutečným hodnotám parametrů. V řadě úloh je potřeba nejen najít pro parametr vhodnou číselnou hodnotu, ale také vyhodnotit její přesnost a spolehlivost. Je třeba zjistit, k jakým chybám může výměna parametrů vést. jeho bodový odhad as jakou mírou jistoty můžeme očekávat, že tyto chyby nepřekročí známé meze.

Takové problémy jsou zvláště důležité pro malý počet experimentů. kdy bodový odhad do značné míry náhodná a přibližná substituce na může vést k významným chybám.

Úplnějším a spolehlivějším způsobem odhadu parametrů rozdělení je stanovení nikoli jedné bodové hodnoty, ale intervalu, který s danou pravděpodobností pokrývá skutečnou hodnotu odhadovaného parametru.

Nechte výsledky experimentů se získá nezkreslený odhad
parametr . Je třeba vyhodnotit možnou chybu. Je zvolena nějaká dostatečně velká pravděpodobnost
(například), že událost s touto pravděpodobností lze považovat za prakticky jistou událost a taková hodnota se najde , pro který

. (8.15)

V tomto případě je rozsah prakticky možných hodnot chyby, ke které dochází při výměně na , bude
a velké absolutní chyby se objeví jen s malou pravděpodobností .

Výraz (8.15) znamená, že s pravděpodobností
neznámá hodnota parametru spadá do intervalu

. (8.16)

Pravděpodobnost
volala úroveň důvěry a interval pokrytí s pravděpodobností je volána skutečná hodnota parametru interval spolehlivosti. Všimněte si, že je nesprávné říkat, že hodnota parametru leží v intervalu spolehlivosti s pravděpodobností . Použité znění (kryty) znamená, že ačkoli je odhadovaný parametr neznámý, má konstantní hodnotu, a proto nemá rozptyl, protože se nejedná o náhodnou veličinu.

Nejdůležitější číselné charakteristiky náhodné veličiny X jsou ona matematické očekávání m x =M a disperzeσ 2 x = D[x] = M[(X – m x) 2 ] = M –. Číslo mx je střední hodnota náhodné veličiny, kolem které jsou rozptýleny hodnoty veličin X, měřítkem tohoto šíření je rozptyl D[x] a standardní odchylka:

s x =(1.11)

Dále se budeme zabývat důležitým problémem pro studium pozorované náhodné veličiny. Nechť je nějaký vzorek (označíme ho S) náhodná proměnná X. Je nutné odhadnout neznámé hodnoty z dostupného vzorku mx a .

Teorie odhadů různých parametrů zaujímá v matematické statistice významné místo. Podívejme se proto nejprve na obecný problém. Nechť je požadováno odhadnout nějaký parametr A podle vzorku S. Každé takové hodnocení A* je nějaká funkce a*=a*(S) z hodnot vzorku. Hodnoty vzorku jsou náhodné, takže samotný odhad A* je náhodná veličina. Můžete vytvořit mnoho různých odhadů (tj. funkcí) A*, ale zároveň je žádoucí mít „dobré“ nebo dokonce „nejlepší“ v určitém smyslu hodnocení. Odhady obvykle podléhají následujícím třem přirozeným požadavkům.

1. Nezaujatý. Matematické očekávání odhadu A* se musí rovnat přesné hodnotě parametru: M = a. Jinými slovy, skóre A* nemělo by docházet k systematické chybě.

2. Konzistence. S nekonečným nárůstem velikosti vzorku se odhad A* by měla konvergovat k přesné hodnotě, to znamená, že s rostoucím počtem pozorování má chyba odhadu tendenci k nule.

3. Účinnost.Školní známka A* se nazývá efektivní, pokud je nezaujatý a má nejmenší možný rozptyl chyb. V tomto případě je rozptyl odhadů minimální. A* vzhledem k přesné hodnotě a odhad je v jistém smyslu „nejpřesnější“.

Bohužel není vždy možné sestavit odhad, který splňuje všechny tři požadavky současně.

Pro odhad matematického očekávání se nejčastěji používá odhad.

= , (1.12)

tedy aritmetický průměr vzorku. Pokud náhodná veličina X má konečný mx a s x, pak je odhad (1.12) nestranný a konzistentní. Tento odhad je účinný např X Má to normální distribuce(obr.p.1.4, příloha 1). U jiných distribucí nemusí být efektivní. Například v případě rovnoměrného rozdělení (obrázek 1.1, příloha 1) bude nestranný, konzistentní odhad

(1.13)

Odhad (1.13) pro normální rozdělení přitom nebude konzistentní ani efektivní a bude se s rostoucí velikostí vzorku dokonce zhoršovat.

Tedy pro každý typ rozdělení náhodné veličiny X měli byste použít svůj odhad matematického očekávání. V naší situaci však lze typ distribuce znát pouze hypoteticky. Proto použijeme odhad (1.12), který je poměrně jednoduchý a má nejdůležitější vlastnosti nestrannosti a konzistence.

K odhadu matematického očekávání pro seskupený vzorek se používá následující vzorec:

= , (1.14)

které lze získat z předchozího, uvážíme-li všechny m i vzorové hodnoty, do kterých spadají i-tý interval rovný zástupce z i tento interval. Tento odhad je samozřejmě hrubší, ale vyžaduje mnohem méně výpočtů, zejména u velkého vzorku.

Pro odhad rozptylu se nejčastěji používá odhad:

= , (1.15)

Tento odhad není zkreslený a je konzistentní pro jakoukoli náhodnou veličinu X, který má konečné momenty až do čtvrtého řádu včetně.

V případě seskupeného vzorku se použije odhad:

= (1.16)

Odhady (1.14) a (1.16) jsou zpravidla zkreslené a neudržitelné, protože jejich matematická očekávání a limity, ke kterým konvergují, se liší od mx a kvůli nahrazení všech vzorových hodnot, do kterých spadají i-tý interval, na zástupce intervalu z i.

Všimněte si, že pro velké n, součinitel n/(n – 1) ve výrazech (1.15) a (1.16) se blíží jednotě, lze jej tedy vynechat.

Intervalové odhady.

Nechť je přesná hodnota nějakého parametru A a našel svůj odhad tak jako) podle vzorku S. Posoudit A* odpovídá bodu na číselné ose (obr. 1.5), proto se toto posouzení nazývá směřovat. Všechny odhady uvedené v předchozí části jsou bodové odhady. Téměř vždy, náhodou

a* ¹ a, a můžeme jen doufat, že bod A* je někde poblíž A. Ale jak blízko? Jakýkoli jiný bodový odhad bude mít stejnou nevýhodu – absenci míry spolehlivosti výsledku.


Obr.1.5. Bodový odhad parametr.

Konkrétnější jsou v tomto ohledu intervalové odhady. Intervalové skóre je interval I b \u003d (a, b), ve kterém se s danou pravděpodobností nachází přesná hodnota odhadovaného parametru b. Časový úsek Ib volala interval spolehlivosti a pravděpodobnost b volala úroveň důvěry a lze je považovat za spolehlivost odhadu.

Interval spolehlivosti bude založen na dostupném vzorku S, je náhodný v tom smyslu, že jeho hranice jsou náhodné tak jako) a b(S), kterou vypočítáme z (náhodného) vzorku. proto b existuje pravděpodobnost, že náhodný interval Ib bude pokrývat nenáhodný bod A. Na Obr. 1.6. časový úsek Ib pokryl bod A, a Ib*- Ne. Není proto zcela správné to říkat A" spadá do intervalu.

Li úroveň důvěry b velký (např. b = 0,999), pak téměř vždy přesnou hodnotu A je ve zkonstruovaném intervalu.


Obr.1.6. Intervaly spolehlivosti parametrů A pro různé vzorky.

Zvažte způsob výstavby interval spolehlivosti pro matematické očekávání náhodné veličiny X, na základě teorém centrálního limitu.

Nechť náhodnou veličinu X má neznámá matematická očekávání mx a známý rozptyl. Pak na základě centrální limitní věty je aritmetický průměr:

= , (1.17)

Výsledek n nezávislé testy množství X je náhodná veličina, jejíž rozdělení pro velké n, blízko normálního rozdělení s průměrem mx a standardní odchylka. Takže náhodná veličina

(1.18)

má rozdělení pravděpodobnosti, které lze uvažovat standardní normální s hustotou distribuce j(t), jehož graf je na obr. 1.7 (stejně jako na obr. str. 1.4, příloha 1).



Obr.1.7. Hustota pravděpodobnosti náhodné veličiny t.

Nechť je dána pravděpodobnost spolehlivosti b a tb-číslo, které odpovídá rovnici

b \u003d F 0 (t b) - F 0 (-t b) \u003d 2 F 0 (t b),(1.19)

kde - Laplaceova funkce. Pak pravděpodobnost pádu do intervalu (-t b, t b) se bude rovnat stínovanému na obr. 1.7. plocha a na základě výrazu (1.19) se rovná b. tudíž

b = P(-tb< < t b) = P( – tb< m x < + tb) =

=P( – tb< m x < + t b).(1.20)

Jako interval spolehlivosti tedy můžeme brát interval

I b = ( – t b; + tb ) , (1.21)

protože výraz (1.20) znamená, že neznámá přesná hodnota mx je v Ib s danou pravděpodobností spolehlivosti b. Na stavbu Ib potřebné podle b nalézt tb z rovnice (1.19). Zde jsou některé hodnoty tb v budoucnu potřebné :

t 0,9 = 1,645; t 0,95 = 1,96; t 0,99 = 2,58; t 0,999 = 3,3.

Při odvozování výrazu (1.21) se předpokládalo, že je známa přesná hodnota střední kvadratické odchylky s x. Ne vždy se to však pozná. Proto použijeme jeho odhad (1.15) a získáme:

I b = ( – t b; + t b). (1.22)

V souladu s tím odhady a získané ze seskupeného vzorku poskytují následující vzorec pro interval spolehlivosti:

I b = ( – t b; + t b). (1.23)

Nechť náhodný výběr generuje pozorovaná náhodná veličina ξ, matematické očekávání a rozptyl které jsou neznámé. Pro odhady těchto charakteristik bylo navrženo použít výběrový průměr

a rozptyl vzorku

. (3.14)

Uvažujme některé vlastnosti odhadů matematického očekávání a rozptylu.

1. Vypočítejte matematické očekávání výběrového průměru:

Proto je výběrový průměr nestranným odhadem pro .

2. Připomeňme, že výsledky pozorování jsou nezávislé náhodné proměnné, z nichž každá má stejný distribuční zákon jako hodnota , což znamená, že , , . Budeme předpokládat, že rozptyl je konečný. Pak podle Čebyševovy věty o zákonu velkých čísel pro každé ε > 0 máme rovnost ,

což lze napsat takto: . (3.16) Porovnáním (3.16) s definicí vlastnosti konzistence (3.11) vidíme, že odhad je konzistentním odhadem očekávání .

3. Najděte rozptyl střední hodnoty vzorku:

. (3.17)

Rozptyl odhadu očekávání se tedy snižuje nepřímo s velikostí vzorku.

Lze dokázat, že pokud je náhodná veličina ξ normálně rozdělena, pak výběrový průměr je efektivním odhadem matematického očekávání, to znamená, že rozptyl nejmenší hodnotu ve srovnání s jakýmkoli jiným odhadem matematického očekávání. Pro jiné distribuční zákony ξ to nemusí platit.

Výběrový rozptyl je zkreslený odhad rozptylu, protože . (3.18)

Pomocí vlastností matematického očekávání a vzorce (3.17) skutečně najdeme

.

Pro získání nezkresleného odhadu rozptylu je třeba odhad (3.14) opravit, tedy vynásobit . Pak dostaneme nestranný výběrový rozptyl

. (3.19)

Všimli jsme si, že vzorce (3.14) a (3.19) se liší pouze ve jmenovateli a pro velké hodnoty se výběrové a nestranné rozptyly liší jen málo. Pro malou velikost vzorku by se však měl použít vztah (3.19).

K odhadu směrodatné odchylky náhodné veličiny se používá tzv. „korigovaná“ směrodatná odchylka, která se rovná odmocnina z nezaujatého rozptylu: .

Intervalové odhady

Ve statistice existují dva přístupy k odhadu neznámých parametrů rozdělení: bodový a intervalový. V souladu s bodovým odhadem, který byl diskutován v předchozí části, je uveden pouze bod, v jehož blízkosti se nachází odhadovaný parametr. Je však žádoucí vědět, jak daleko může tento parametr skutečně stát od možné implementace odhadů v různých sériích pozorování.

Odpověď na tuto otázku – rovněž přibližná – dává jiný způsob odhadu parametrů – interval. V souladu s touto metodou odhadu je nalezen interval, který s pravděpodobností blízkou jedné pokrývá neznámou číselnou hodnotu parametru.

Pojem intervalového odhadu

Bodový odhad je náhodná veličina a pro případné implementace vzorku nabývá hodnoty pouze přibližně rovné skutečné hodnotě parametru. Čím je rozdíl menší, tím je odhad přesnější. Tedy kladné číslo, pro které , charakterizuje přesnost odhadu a je tzv chyba odhadu (nebo mezní chyba).

Spolehlivost Pravděpodobnost(nebo spolehlivost) se nazývá pravděpodobnost β , s nímž je nerovnost , tj.

. (3.20)

Nahrazení nerovnosti její ekvivalentní dvojitá nerovnost nebo , dostaneme

Časový úsek pokrytí s pravděpodobností β volá se , , neznámý parametr interval spolehlivosti (nebo intervalový odhad), odpovídající úrovni spolehlivosti β .

Náhodná veličina není jen odhad, ale také chyba: její hodnota závisí na pravděpodobnosti β a zpravidla ze vzorku. Interval spolehlivosti je tedy náhodný a výraz (3.21) je třeba číst následovně: „Interval pokryje parametr s pravděpodobností β “, a ne takto: „Parametr s pravděpodobností spadne do intervalu β ”.

Význam intervalu spolehlivosti je ten, že při opakovaném opakování objemu vzorku v relativním podílu případů rovný β , interval spolehlivosti odpovídající úrovni spolehlivosti β , pokrývá skutečnou hodnotu odhadovaného parametru. Takže úroveň důvěry β charakterizuje spolehlivost hodnocení důvěry: tím více β , tím je pravděpodobnější, že implementace intervalu spolehlivosti obsahuje neznámý parametr.

Odhady matematického očekávání a rozptylu.

Seznámili jsme se s pojmem distribuční parametry v teorii pravděpodobnosti. Například v zákoně normálního rozdělení dané funkcí hustoty pravděpodobnosti

parametry jsou A– matematické očekávání a A je standardní odchylka. V Poissonově rozdělení je parametrem číslo a = ex.

Definice. Statistickým odhadem neznámého parametru teoretického rozdělení je jeho přibližná hodnota, která závisí na vzorových datech(x 1, x 2, x 3,..., xk; p 1, p 2, p 3,..., p k), tedy nějaká funkce těchto veličin.

Tady x 1, x 2, x 3,..., x k– hodnoty vlastností, p 1, p 2, p 3,..., p k jsou odpovídající frekvence. Statistický odhad je náhodná veličina.

Označit podle θ je odhadovaný parametr a přes θ * - jeho statistické vyhodnocení. Hodnota | θ *–θ | volala přesnost hodnocení.Čím méně | θ *–θ |, tím lépe, neznámý parametr je přesněji definován.

Skórovat θ * mělo praktický význam, nemělo by obsahovat systematickou chybu a zároveň mít co nejmenší rozptyl. Navíc, s nárůstem velikosti vzorku, pravděpodobnost libovolně malých odchylek | θ *–θ | by měl být blízko 1.

Formulujme následující definice.

1. Odhad parametru se nazývá nestranný, pokud jeho matematické očekávání je M(θ *) rovna odhadnutému parametru θ, tj.

M(θ *) = θ, (1)

a offset, pokud

M(θ *) ≠ θ, (2)

2. Odhad θ* se nazývá konzistentní, pokud pro jakékoli δ > 0

(3)

Rovnost (3) zní takto: odhad θ * konverguje v pravděpodobnosti k θ .

3. Odhad θ* se nazývá efektivní, pokud má pro dané n nejmenší rozptyl.

Věta 1.Výběrový průměr Х В je nestranný a konzistentní odhad matematického očekávání.

Důkaz. Vzorek nechť je reprezentativní, tj. všechny prvky populace mají stejnou šanci být zařazeni do vzorku. Hodnoty funkcí x 1, x 2, x 3,..., x n lze brát jako nezávislé náhodné proměnné X 1, X 2, X 3, ..., X n se stejnými distribucemi a numerickými charakteristikami, včetně těch se stejnými matematickými očekáváními rovnými A,

Od každého z množství X 1, X 2, X 3, ..., X p má distribuci shodující se s distribucí obecné populace, pak M(X)= a. proto

z toho vyplývá, že jde o konzistentní odhad M(X).

Pomocí pravidla extrémního výzkumu můžeme dokázat, že je to také efektivní odhad M(X).

Potřeba odhadnout matematické očekávání na základě výsledků testů se objevuje v úlohách, kde je výsledek experimentu popsán náhodnou veličinou a jako indikátor kvality studovaného objektu se předpokládá matematické očekávání této náhodné veličiny. Například matematické očekávání doby provozuschopnosti systému lze brát jako ukazatel spolehlivosti a při hodnocení efektivity výroby matematické očekávání počtu dobrých výrobků atd.

Problém odhadu matematického očekávání je formulován následovně. Předpokládejme, že k určení neznámé hodnoty náhodné veličiny X se předpokládá, že n bude nezávislých a bez systematických chyb měření. X v X 2 ,..., X str. Je třeba zvolit nejlepší odhad matematického očekávání.

Nejlepším a nejběžnějším odhadem matematického očekávání v praxi je aritmetický průměr výsledků testu

také zvaný statistický nebo průměr vzorku.

Ukažme, že odhad t x splňuje všechny požadavky na hodnocení jakéhokoli parametru.

1. Z výrazu (5.10) vyplývá, že

tj. skóre t "x- nezkreslený odhad.

2. Podle Čebyševovy věty aritmetický průměr výsledků testu konverguje v pravděpodobnosti k matematickému očekávání, tzn.

V důsledku toho je odhad (5.10) konzistentním odhadem očekávání.

3. Odhad rozptylu t x, rovnat se

S rostoucí velikostí vzorku se n neomezeně zmenšuje. Je dokázáno, že pokud náhodná veličina X podléhá zákonu normálního rozdělení, pak pro jakoukoli P rozptyl (5.11) bude minimální možné a odhad t x- efektivní odhad matematického očekávání. Znalost rozptylu odhadu umožňuje učinit úsudek o přesnosti určení neznámé hodnoty matematického očekávání pomocí tohoto odhadu.

Jako odhad matematického očekávání se použije aritmetický průměr, pokud jsou výsledky měření stejně přesné (varianty D, i = 1, 2, ..., P jsou stejné v každé dimenzi). V praxi se však musíme vypořádat s úlohami, ve kterých se výsledky měření neshodují (např. při testování jsou měření prováděna různými přístroji). V tomto případě má odhad pro matematické očekávání tvar

kde je hmotnost i-tého měření.

Ve vzorci (5.12) je výsledek každého měření zahrnut s vlastní hmotností Z.. Proto vyhodnocení výsledků měření t x volala vážený průměr.

Lze ukázat, že odhad (5.12) je nezaujatý, konzistentní a efektivní odhad očekávání. Minimální rozptyl odhadu je dán o


Při provádění experimentů s počítačovými modely nastávají podobné problémy, když jsou odhady zjištěny z výsledků několika sérií testů a počet testů v každé sérii je odlišný. Například byly provedeny dvě série testů s objemem p 1 a n 2, podle jejichž výsledků jsou odhady t xi a t x _. Aby se zlepšila přesnost a spolehlivost stanovení matematického očekávání, jsou výsledky těchto sérií testů kombinovány. K tomu použijte výraz (5.12)

Při výpočtu koeficientů C se místo rozptylů D dosadí jejich odhady získané z výsledků testů v každé sérii.

Podobný přístup se také používá při určování pravděpodobnosti výskytu náhodné události na základě výsledků série testů.

K odhadu matematického očekávání náhodné veličiny X lze kromě výběrového průměru použít i další statistiky. Nejčastěji se k tomuto účelu používají členové. variační série, tedy statistiky objednávek , na základě kterých se sestavují odhady,

splňují hlavní požadavky, a to důslednost a nestrannost.

Předpokládejme, že variační řada obsahuje n = 2kčlenů. Poté lze kterýkoli z průměrů považovat za odhad matematického očekávání:

V čem prst průměrný

není nic jiného než statistický medián distribuce náhodné veličiny X, protože nastává zřejmá rovnost

Výhodou statistického mediánu je, že není ovlivněn anomálními výsledky pozorování, což je nevyhnutelné při použití prvního průměru, tedy průměru nejmenšího a největšího počtu variačních řad.

S lichou velikostí vzorku P = 2k- 1 statistický medián je jeho středním prvkem, tzn. na-tý člen variační řady Já = x k.

Existují rozdělení, pro která aritmetický průměr není efektivním odhadem matematického očekávání, například Laplaceovo rozdělení. Lze ukázat, že pro Laplaceovo rozdělení je efektivním odhadem průměru střední hodnota vzorku.

Je dokázáno, že pokud má náhodná veličina X normální rozdělení, pak při dostatečně velké velikosti vzorku je distribuční zákon statistického mediánu blízký normálnímu s numerickými charakteristikami.

Z porovnání vzorců (5.11) a (5.14) vyplývá, že rozptyl statistického mediánu je 1,57krát větší než rozptyl aritmetického průměru. Proto je aritmetický průměr jako odhad matematického očekávání mnohem efektivnější než statistický medián. Vzhledem k jednoduchosti výpočtů, necitlivosti k anomálním výsledkům měření („kontaminace“ vzorku) se však v praxi přesto statistický medián používá jako odhad matematického očekávání.

Je třeba poznamenat, že pro spojitá symetrická rozdělení jsou průměr a medián stejné. Statistický medián tedy může sloužit jako dobrý odhad matematického očekávání pouze pro symetrické rozdělení náhodné veličiny.

U zkreslených distribucí statistický medián má významné zkreslení vzhledem k matematickému očekávání, proto je pro jeho odhad nevhodný.



chyba: Obsah je chráněn!!