Válassza az Oldal lehetőséget

Matematikai elvárás és diszperzió becslései, tulajdonságaik. Példák

AZ ELŐADÁS CÉLJA: Ismertesse meg az ismeretlen eloszlási paraméterek becslésének fogalmát, és adja meg az ilyen becslések osztályozását; pont- és intervallumbecsléseket kapni matematikai elvárásés diszperzió.

A gyakorlatban a legtöbb esetben egy valószínűségi változó eloszlási törvénye ismeretlen, és a megfigyelések eredményei szerint
numerikus jellemzők (például matematikai elvárás, diszperzió vagy egyéb momentumok) vagy ismeretlen paraméter becslése szükséges , amely meghatározza az eloszlási törvényt (eloszlási sűrűséget)
valószínűségi változót tanulmányoznak. Így exponenciális vagy Poisson-eloszlás esetén elég egy paramétert becsülni, normál eloszlásnál viszont két paramétert kell becsülni - a matematikai elvárást és a variancia.

Az értékelések típusai

Véletlen változó
valószínűségi sűrűséggel rendelkezik
, Hol – ismeretlen eloszlási paraméter. A kísérlet eredményeként ennek a valószínűségi változónak az értékeit kaptuk:
. Az értékelés lényegében azt jelenti, hogy egy valószínűségi változó mintaértékeit egy bizonyos paraméterértékhez kell társítani , azaz létrehozza a megfigyelési eredmények valamilyen függvényét
, melynek értékét becslésnek vesszük paraméter . Index az elvégzett kísérletek számát jelzi.

Minden olyan függvényt hívunk, amely a megfigyelések eredményétől függ statisztika. Mivel a megfigyelések eredményei véletlen változók, a statisztika is véletlen változó lesz. Ezért az értékelés
ismeretlen paraméter valószínűségi változónak kell tekinteni, és értékét a kísérleti adatok mennyiségéből kell kiszámítani , – ennek a valószínűségi változónak az egyik lehetséges értéke.

Az eloszlási paraméterek (egy valószínűségi változó numerikus jellemzői) becslései pontokra és intervallumokra vannak osztva. Pontbecslés paraméter egy szám határozza meg , pontosságát pedig a becslés szórása jellemzi. Intervallumbecslés pontnak nevezzük, amelyet két szám határoz meg, És – a becsült paramétert lefedő intervallum végei adott megbízhatósági valószínűséggel.

A pontbecslések osztályozása

Egy ismeretlen paraméter pontbecsléséhez
A pontosság szempontjából a legjobb, következetesnek, elfogulatlannak és hatékonynak kell lennie.

Gazdagértékelésnek nevezik
paraméter , ha valószínűségében konvergál a becsült paraméterhez, azaz.

. (8.8)

Csebisev egyenlőtlensége alapján kimutatható, hogy a (8.8) összefüggés teljesülésének elégséges feltétele az egyenlőség

.

A konzisztencia az at becslés aszimptotikus jellemzője
.

Elfogulatlanértékelésnek nevezik
(szisztematikus hiba nélküli becslés), amelynek matematikai elvárása megegyezik a becsült paraméterrel, azaz.

. (8.9)

Ha a (8.9) egyenlőség nem teljesül, akkor a becslést torzítottnak nevezzük. Különbség
torzításnak vagy szisztematikus hibának nevezzük a becslésben. Ha a (8.9) egyenlőség csak akkor teljesül
, akkor a megfelelő becslést aszimptotikusan torzítatlannak nevezzük.

Megjegyzendő, hogy ha a konzisztencia szinte kötelező feltétele minden gyakorlatban használt becslésnek (inkonzisztens becsléseket rendkívül ritkán használnak), akkor az elfogulatlanság tulajdonsága csak kívánatos. Sok gyakran használt becslés nem rendelkezik az elfogulatlan tulajdonsággal.

Általában valamely paraméter becslésének pontossága , amelyet kísérleti adatok alapján kaptunk
, amelyet az átlagos négyzetes hiba jellemez

,

amely formára redukálható

,

hol a szórás,
– négyzetes becslési torzítás.

Ha a becslés elfogulatlan, akkor

Végesben a becslések eltérhetnek az átlagos négyzetes hibától . Természetesen minél kisebb ez a hiba, annál szorosabban csoportosulnak az értékelési értékek a becsült paraméter köré. Ezért mindig kívánatos, hogy a becslési hiba a lehető legkisebb legyen, azaz a feltétel teljesüljön

. (8.10)

Értékelés , kielégítő (8.10) feltételt minimum négyzetes hibájú becslésnek nevezünk.

Hatékonyértékelésnek nevezik
, amelynél az átlagos négyzetes hiba nem nagyobb, mint bármely más becslés átlagos négyzetes hibája, pl.

Ahol – bármely egyéb paraméterbecslés .

Ismeretes, hogy egy paraméter bármely torzítatlan becslésének varianciája kielégíti a Cramer–Rao egyenlőtlenséget

,

Ahol
– a valószínűségi változó kapott értékeinek feltételes valószínűségi sűrűségeloszlása ​​a paraméter valódi értékén .

Így az elfogulatlan becslés
, amelyre a Cramer–Rao egyenlőtlenség egyenlővé válik, hatékony lesz, azaz egy ilyen becslés minimális szórással rendelkezik.

Pontos becslések a várakozásokról és az eltérésekről

Ha figyelembe vesszük valószínűségi változó
, amelynek matematikai elvárása van és variancia , akkor mindkét paraméter ismeretlennek minősül. Ezért egy valószínűségi változó felett
előállított független kísérletek, amelyek eredményt adnak:
. Konzisztens és elfogulatlan becsléseket kell találni ismeretlen paraméterekre És .

Becslések szerint És Általában a statisztikai (minta) átlagot és a statisztikai (minta) varanciát választják ki:

; (8.11)

. (8.12)

A matematikai elvárás (8.11) becslése konzisztens a nagy számok törvénye szerint (Csebisev-tétel):

.

Valószínűségi változó elvárása

.

Ezért a becslés elfogulatlan.

A matematikai várható becslés szórása:

Ha a valószínűségi változó
normál törvény szerint oszlik el, akkor a becslés is hatásos.

Varianciabecslés elvárása

Egy időben

.

Mert
, A
, akkor megkapjuk

. (8.13)

Így,
– elfogult értékelés, bár következetes és hatékony.

A (8.13) képletből az következik, hogy torzítatlan becsléshez
a minta szórását (8.12) a következőképpen kell módosítani:

amely a becsléshez (8,12) képest „jobbnak” tekinthető, bár nagyban ezek a becslések majdnem megegyeznek egymással.

Módszerek az eloszlási paraméterek becslésére

A gyakorlatban gyakran a valószínűségi változót generáló fizikai mechanizmus elemzése alapján
, következtetést vonhatunk le ennek a valószínűségi változónak az eloszlási törvényére. Ennek az eloszlásnak a paraméterei azonban ismeretlenek, és a kísérleti eredményekből kell megbecsülni, általában véges minta formájában.
. A probléma megoldására leggyakrabban két módszert alkalmaznak: a pillanatok módszerét és a maximális valószínűség módszerét.

A pillanatok módszere. A módszer abból áll, hogy az elméleti mozzanatokat azonos sorrendű empirikus momentumokkal azonosítjuk.

Empirikus kiindulópontok -a sorrendet a következő képletek határozzák meg:

,

és a megfelelő elméleti kezdeti mozzanatokat -rendű képletek:

diszkrét valószínűségi változók esetén,

folytonos valószínűségi változók esetén,

Ahol – becsült eloszlási paraméter.

Két ismeretlen paramétert tartalmazó eloszlás paramétereinek becslése És , két egyenletrendszert állítunk össze

Ahol És – másodrendű elméleti és empirikus központi mozzanatai.

Az egyenletrendszer megoldása a becslések És ismeretlen eloszlási paraméterek És .

Az elsőrendű elméleti és empirikus kezdeti momentumot egyenlővé téve azt kapjuk, hogy egy valószínűségi változó matematikai elvárásának becslésével
, amelynek tetszőleges eloszlása ​​van, lesz a minta átlaga, azaz.
. Ekkor a másodrendű elméleti és empirikus központi momentumokat egyenlővé téve azt kapjuk, hogy a valószínűségi változó varianciájának becslése
, amelynek tetszőleges eloszlása ​​van, a képlet határozza meg

.

Hasonló módon tetszőleges sorrendű elméleti mozzanatokra vonatkozó becsléseket találhatunk.

A momentumok módszere egyszerű és nem igényel bonyolult számításokat, de az ezzel a módszerrel kapott becslések gyakran hatástalanok.

Maximális valószínűség módszere. Az ismeretlen eloszlási paraméterek pontbecslésének maximum likelihood módszere egy vagy több becsült paraméter függvényének maximumának megtalálásában rejlik.

Hadd
folytonos valószínűségi változó, ami ennek eredményeként a tesztek értékeket vettek fel
. Ismeretlen paraméter becsléséhez olyan értéket kell találni , amelynél a kapott minta megvalósításának valószínűsége maximális lenne. Mert
egymástól független mennyiségeket képviselnek azonos valószínűségi sűrűséggel
, Azt valószínűségi függvény hívja meg az argumentumfüggvényt :

A paraméter maximális valószínűségének becslésével ezt az értéket hívják , amelynél a likelihood függvény eléri a maximumot, azaz az egyenlet megoldása

,

ami egyértelműen a vizsgálati eredményektől függ
.

Mivel a funkciók
És
ugyanazon az értékeken eléri a maximumot
, akkor a számítások egyszerűsítése érdekében gyakran használják a logaritmikus likelihood függvényt, és megkeresik a megfelelő egyenlet gyökerét

,

amelyet úgy hívnak valószínűségi egyenlet.

Ha több paramétert kell értékelnie
elosztás
, akkor a likelihood függvény ezektől a paraméterektől függ. Becslések megtalálásához
eloszlási paramétereket szükséges megoldani a rendszert valószínűségi egyenletek

.

A maximum likelihood módszer következetes és aszimptotikusan hatékony becsléseket ad. A maximum likelihood módszerrel kapott becslések azonban torzítottak, ráadásul a becslések megtalálásához gyakran meglehetősen bonyolult egyenletrendszerek megoldására van szükség.

Intervallumparaméter-becslések

A pontbecslések pontosságát azok szórása jellemzi. Arról azonban nincs információ, hogy a kapott becslések milyen közel állnak a paraméterek valódi értékéhez. Számos feladatnál nem csak a paramétert kell megkeresnie megfelelő számérték, hanem annak pontosságának és megbízhatóságának értékelése is. Meg kell találnia, hogy egy paraméter cseréje milyen hibákhoz vezethet pontbecslését és milyen fokú biztonsággal számíthatunk arra, hogy ezek a hibák nem lépik túl az ismert határokat.

Az ilyen feladatok különösen akkor fontosak, ha kevés kísérlet van. , amikor a pontbecslés nagyrészt véletlenszerű és hozzávetőleges csere -on jelentős hibákhoz vezethet.

Az eloszlási paraméterek becslésének teljesebb és megbízhatóbb módja, ha nem egyetlen pontértéket határozunk meg, hanem egy olyan intervallumot, amely adott valószínűséggel fedi a becsült paraméter valódi értékét.

Legyen az eredmények szerint kísérletek során elfogulatlan becslést kaptunk
paraméter . Fel kell mérni a lehetséges hibát. Valami elég nagy valószínűség van kiválasztva
(például), hogy egy ilyen valószínűségű esemény gyakorlatilag biztos eseménynek tekinthető, és ilyen értéket találunk , amihez

. (8.15)

Ebben az esetben a csere során fellépő hiba gyakorlatilag lehetséges értékeinek tartománya -on , lesz
, és az abszolút értékben nagy hibák csak kis valószínűséggel jelennek meg .

A (8.15) kifejezés azt jelenti, hogy valószínűséggel
ismeretlen paraméterérték intervallumba esik

. (8.16)

Valószínűség
hívott megbízhatósági valószínűség, és az intervallum , valószínûséggel borító a paraméter valódi értékét hívjuk konfidencia intervallum. Megjegyzendő, hogy helytelen azt állítani, hogy a paraméter értéke valószínűséggel a konfidencia intervallumon belül van . Az alkalmazott megfogalmazás (borítók) azt jelenti, hogy bár a becsült paraméter ismeretlen, de állandó értéke van, ezért nincs szórása, mivel nem véletlenszerű változó.

Egy valószínűségi változó legfontosabb numerikus jellemzői Xő van matematikai elvárás m x =M és diszperzióσ 2 x = D[x] = M[(X – m x) 2 ] = M –. Szám m x egy valószínűségi változó átlagértéke, amely körül a mennyiségek értékei szétszórva vannak X, ennek a szórásnak a mértéke a diszperzió D[x]És szórás:

s x =(1.11)

A továbbiakban megvizsgálunk egy megfigyelhető valószínűségi változó tanulmányozásának fontos problémáját. Legyen néhány minta (jelöljük S) valószínűségi változó X. Ismeretlen értékeket kell becsülni a meglévő mintából. m xÉs .

A különféle paraméterek becslésének elmélete jelentős helyet foglal el a matematikai statisztikában. Ezért először nézzük meg az általános problémát. Legyen szükséges valamilyen paraméter becslése a minta alapján S. Minden ilyen értékelés a* valami funkció a*=a*(S) mintaértékekből. A mintaértékek véletlenszerűek, ezért maga a becslés a* egy valószínűségi változó. Sok különböző becslés (azaz függvény) készíthető a*, de ugyanakkor kívánatos egy bizonyos értelemben „jó” vagy akár „legjobb” értékelés. Általában a következő három természetes követelményt támasztják az értékelésekkel szemben.

1. Kitelepítetlen. Az értékelés matematikai elvárása a* meg kell egyeznie a paraméter pontos értékével: M = a. Más szóval a pontszám a* nem lehet szisztematikus hiba.

2. Gazdagság. A minta méretének végtelen növekedésével a becslés a* pontos értékhez kell konvergálnia, azaz a megfigyelések számának növekedésével a becslési hiba nullára hajlik.

3. Hatékonyság. Fokozat a* Akkor mondjuk hatékonynak, ha elfogulatlan és a lehető legkisebb hibavarianciával rendelkezik. Ebben az esetben a becslések terjedése minimális a* a pontos értékhez képest és a becslés bizonyos értelemben „a legpontosabb”.

Sajnos nem mindig lehet olyan értékelést készíteni, amely mindhárom követelménynek egyszerre megfelel.

A matematikai várakozás becsléséhez leggyakrabban becslést használnak.

= , (1.12)

vagyis a minta számtani átlaga. Ha a valószínűségi változó X véges m xÉs s x, akkor az (1.12) becslés nem torz és konzisztens. Ez a becslés például akkor hatásos, ha X rendelkezik normál eloszlás(1.4. ábra, 1. függelék). Más disztribúciók esetében előfordulhat, hogy nem hatékony. Például egyenletes eloszlás esetén (1.1. ábra, 1. függelék) elfogulatlan, konzisztens becslés lesz

(1.13)

Ugyanakkor a normál eloszlásra vonatkozó becslés (1.13) nem lesz sem konzisztens, sem nem hatékony, sőt a mintaszám növekedésével még romlik is.

Így egy valószínűségi változó minden eloszlási típusára X használja a matematikai elvárás becslését. A mi helyzetünkben azonban az eloszlás típusa csak feltételesen ismert. Ezért az (1.12) becslést fogjuk használni, amely meglehetősen egyszerű, és rendelkezik a torzítatlanság és a konzisztencia legfontosabb tulajdonságaival.

A csoportosított minta matematikai elvárásainak becsléséhez a következő képletet használjuk:

= , (1.14)

amit az előzőből kaphatunk, ha mindent figyelembe vesszük m i a mintaértékeket tartalmazza én-edik intervallum egyenlő a képviselővel z i ezt az intervallumot. Ez a becslés természetesen durvább, de lényegesen kevesebb számítást igényel, különösen nagy mintaméret esetén.

A variancia becslésére leggyakrabban használt becslés a következő:

= , (1.15)

Ez a becslés nem torzított, és bármely valószínűségi változóra érvényes X, amelynek véges pillanatai vannak a negyedik rendig bezárólag.

Csoportosított minta esetén a következő becslést alkalmazzuk:

= (1.16)

Az (1,14) és (1,16) becslések általában torzak és tarthatatlanok, mivel matematikai elvárásaik és határai, amelyekhez közelednek, eltérnek m xés a benne foglalt összes mintaérték cseréje miatt én-edik intervallum, intervallumonként reprezentatív z i.

Vegye figyelembe, hogy nagy n, együttható n/(n – 1) az (1.15) és (1.16) kifejezésekben közel áll az egységhez, ezért elhagyható.

Intervallumbecslések.

Legyen valamelyik paraméter pontos értéke aés a becslését megtalálták mint) minta alapján S. Értékelés a* a numerikus tengely egy pontjának felel meg (1.5. ábra), ezért ezt a becslést nevezzük pont. Az előző bekezdésben tárgyalt valamennyi becslés pontbecslés. Szinte mindig, a véletlennek köszönhetően

a* ¹ a, és csak remélni tudjuk, hogy a lényeg a* van valahol a közelben a. De milyen közel? Minden más pontbecslésnek ugyanaz a hátránya - az eredmény megbízhatóságának mértékének hiánya.


1.5. Pontbecslés paraméter.

E tekintetben konkrétabbak intervallumbecslések. Az intervallum pontszám egy intervallumot jelöl I b = (a , b), amelyben a becsült paraméter pontos értéke adott valószínűséggel megtalálható b. Intervallum Ib hívott konfidencia intervallum, és a valószínűség b hívott megbízhatósági valószínűségés annak tekinthető az értékelés megbízhatósága.

A megbízhatósági intervallum a rendelkezésre álló mintán alapul S, véletlenszerű abban az értelemben, hogy a határai véletlenszerűek mint)És b(S), amit egy (véletlen) mintából fogunk kiszámolni. azért b fennáll annak a lehetősége, hogy a véletlenszerű intervallum Ib nem véletlenszerű pontot fog lefedni a. ábrán. 1.6. intervallum Ib fedte a lényeget a, A Ib*- Nem. Ezért nem teljesen helyes ezt állítani egy " esik" az intervallumba.

Ha megbízhatósági valószínűség b nagy (pl. b = 0,999), akkor szinte mindig a pontos érték a a konstruált intervallumon belül van.


1.6. A paraméter konfidencia intervallumai a különböző mintákhoz.

Tekintsünk egy módszert egy valószínűségi változó matematikai elvárásának konfidenciaintervallumának felépítésére X, alapján központi határérték tétel.

Legyen a valószínűségi változó X ismeretlen matematikai elvárása van m xÉs ismert variancia. Ekkor a centrális határértéktétel alapján a számtani átlag:

= , (1.17)

eredményeket n független tesztek mennyiségeket X egy valószínűségi változó, amelynek teljes eloszlása n, közel a normális eloszláshoz átlaggal m xés szórás. Ezért a valószínűségi változó

(1.18)

figyelembe vehető valószínűségi eloszlása ​​van standard normál eloszlási sűrűséggel j(t), melynek grafikonja az 1.7. ábrán (valamint az 1. függelék 1.4. ábráján) látható.



1.7. ábra. Valószínűségi változó valószínűségi sűrűség-eloszlása t.

Legyen adott a megbízhatósági valószínűség bÉs t b - az egyenletet kielégítő szám

b = Ф 0 (t b) – Ф 0 (-t b) = 2 Ф 0 (t b),(1.19)

Ahol - Laplace függvény. Majd az intervallumba esés valószínűsége (-t b , t b) egyenlő lesz az 1.7. ábra árnyékoltjával. terület, és az (1.19) kifejezés alapján egyenlő b. Ezért

b = P(-t b< < t b) = P( – tb< m x < + t b ) =

= P( – tb< m x < + t b) .(1.20)

Így konfidenciaintervallumnak vehetjük az intervallumot

I b = ( – t b ; + tb ) , (1.21)

mivel az (1.20) kifejezés azt jelenti, hogy az ismeretlen pontos érték m x bent van Ib adott megbízhatósági valószínűséggel b. Építeni Ib szükséges a megadott módon b lelet t b az (1.19) egyenletből. Adjunk meg néhány értéket t b szükséges a jövőben :

t 0,9 = 1,645; t 0,95 = 1,96; t 0,99 = 2,58; t 0,999 = 3,3.

Az (1.21) kifejezés származtatása során azt feltételeztük, hogy a szórás pontos értéke ismert s x. Ez azonban nem mindig ismert. Használjuk tehát az ő becslését (1.15), és kapjuk meg:

I b = ( – t b ; +tb). (1.22)

Ennek megfelelően a csoportosított minta becslései és az abból nyert adatok a következő képletet adják a konfidenciaintervallumra:

I b = ( – t b ; +tb). (1.23)

A véletlenszerű mintát állítsa elő a megfigyelt ξ valószínűségi változó, a matematikai elvárás és variancia amelyek ismeretlenek. Javasoltuk, hogy ezekre a jellemzőkre a mintaátlagot használják becslésként

és a minta variancia

. (3.14)

Tekintsük a matematikai elvárások és a diszperzió becsléseinek néhány tulajdonságát.

1. Számítsa ki a minta átlagának matematikai elvárását:

Ezért a minta átlaga egy torzítatlan becslés a számára.

2. Emlékezzen arra, hogy az eredményeket A megfigyelések független valószínűségi változók, amelyek mindegyikének ugyanaz az eloszlási törvénye, mint az érték, ami azt jelenti , , . Feltételezzük, hogy a szórás véges. Ekkor a nagy számok törvényéről szóló Csebisev-tétel szerint bármely ε > 0 esetén fennáll az egyenlőség ,

ami így írható: . (3.16) Összehasonlítva (3.16) a konzisztencia tulajdonság (3.11) definíciójával, azt látjuk, hogy a becslés a matematikai várakozás konzisztens becslése.

3. Határozza meg a mintaátlag szórását:

. (3.17)

Így a matematikai várakozási becslés szórása a minta méretével fordított arányban csökken.

Bizonyítható, hogy ha a ξ valószínűségi változó normális eloszlású, akkor a minta átlaga a matematikai elvárás effektív becslése, azaz a variancia legkisebb érték a matematikai várakozás bármely más becsléséhez képest. Más eloszlási törvények esetében ξ ez nem biztos, hogy így van.

A minta variancia a variancia torzított becslése, mert . (3.18)

Valójában a matematikai elvárás és a (3.17) képlet tulajdonságait felhasználva azt találjuk

.

A variancia torzítatlan becsléséhez a (3.14) becslést korrigálni kell, azaz meg kell szorozni -val. Ekkor megkapjuk az elfogulatlan mintavarianciát

. (3.19)

Vegye figyelembe, hogy a (3.14) és (3.19) képletek csak a nevezőben térnek el egymástól, és nagy értékek esetén a minta és a torzítatlan szórások alig térnek el. Kis mintaméret esetén azonban a (3.19) összefüggést kell használni.

Egy valószínűségi változó szórásának becslésére az úgynevezett „korrigált” szórást használjuk, amely egyenlő négyzetgyök torzítatlan varianciából: .

Intervallumbecslések

A statisztikákban két megközelítés létezik az eloszlások ismeretlen paramétereinek becslésére: pont és intervallum. Az előző részben tárgyalt pontbecslésnek megfelelően csak az a pont van feltüntetve, amely körül a becsült paraméter található. Kívánatos azonban tudni, hogy ez a paraméter valójában milyen messze lehet a becslések lehetséges realizálásától a különböző megfigyelési sorozatokban.

Erre a kérdésre – szintén közelítőleg – a választ egy másik paraméterbecslési módszer – intervallum – adja meg. Ezzel a becslési módszerrel találunk egy intervallumot, amely egyhez közeli valószínűséggel lefedi a paraméter ismeretlen számértékét.

Az intervallumbecslés fogalma

Pontbecslés egy valószínűségi változó, és a lehetséges mintamegvalósításokhoz csak megközelítőleg egyenlő értékeket vesz fel a paraméter valódi értékével. Minél kisebb a különbség, annál pontosabb a becslés. Így egy pozitív szám, amelyre , a becslés pontosságát jellemzi és ún becslési hiba (vagy határhiba).

Bizalom valószínűsége(vagy megbízhatóság) valószínűségnek nevezzük β , amellyel az egyenlőtlenség megvalósul , azaz

. (3.20)

Az egyenlőtlenség felváltása ekvivalens kettős egyenlőtlenség , vagy , megkapjuk

Intervallum , valószínûséggel borító β , , ismeretlen paraméter, meghívásra kerül konfidencia intervallum (vagy intervallumbecslés), megfelelő megbízhatósági valószínűség β .

A valószínűségi változó nemcsak becslés, hanem hiba is: értéke a valószínűségtől függ β és általában a mintából. Ezért a konfidenciaintervallum véletlenszerű, és a (3.21) kifejezést a következőképpen kell értelmezni: „Az intervallum valószínűséggel fedi le a paramétert β ”, és nem így: „A paraméter nagy valószínűséggel beleesik az intervallumba β ”.

A konfidenciaintervallum jelentése az, hogy egy mintamennyiség többszöri megismétlésekor az esetek relatív arányában egyenlő β , a konfidenciavalószínűségnek megfelelő konfidencia intervallum β , fedi a becsült paraméter valódi értékét. Így a megbízhatósági valószínűség β jellemzi megbízhatóság bizalomértékelés: annál több β , annál valószínűbb, hogy a konfidenciaintervallum implementációja ismeretlen paramétert tartalmaz.

A matematikai elvárások és variancia becslései.

Megismerkedtünk az eloszlási paraméterek valószínűségszámítási fogalmával. Például a normális eloszlási törvényben, amelyet a valószínűségi sűrűségfüggvény határoz meg

paraméterként szolgálnak A– matematikai elvárás és A– szórás. A Poisson-eloszlásban a paraméter a szám a = pl.

Meghatározás. Egy elméleti eloszlás ismeretlen paraméterének statisztikai becslése annak közelítő értéke, a mintaadatoktól függően(x 1, x 2, x 3,..., xk; n 1, n 2, n 3,..., n k), azaz ezeknek a mennyiségeknek valamilyen függvénye.

Itt x 1, x 2, x 3,..., x k- jellemző értékek, n 1, n 2, n 3,..., n k– a megfelelő frekvenciák. A statisztikai becslés egy valószínűségi változó.

Jelöljük azzal θ a becsült paraméter, és azon keresztül θ * - az övé statisztikai értékelés. Nagyságrend | θ *–θ | hívott értékelési pontosság. Minél kevesebb | θ *–θ |, minél jobb, az ismeretlen paraméter pontosabban definiált.

Pontozni θ * gyakorlati jelentősége volt, nem tartalmazhat szisztematikus hibát, és ugyanakkor a lehető legkisebb szórással rendelkezhet. Ezenkívül a minta méretének növekedésével az önkényesen kis eltérések valószínűsége | θ *–θ | közel kell lennie az 1-hez.

Fogalmazzuk meg a következő definíciókat.

1. A paraméterbecslést torzítatlannak nevezzük, ha a matematikai elvárása M(θ *) egyenlő a becsült θ paraméterrel, azaz

M(θ *) = θ, (1)

és kiszorított, ha

M(θ *) ≠ θ, (2)

2. A θ* becslést konzisztensnek mondjuk, ha bármely δ > 0 esetén

(3)

A (3) egyenlőség így hangzik: becslés θ * valószínűség szerint konvergál θ .

3. Egy θ* becslést akkor nevezünk effektívnek, ha adott n esetén a legkisebb szórása van.

1. tétel.A minta átlaga X B a matematikai elvárás torzítatlan és következetes becslése.

Bizonyíték. Legyen a minta reprezentatív, azaz minden elem lakosság ugyanolyan lehetőségük van a mintába kerülni. Jellemző értékek x 1, x 2, x 3,..., x n független valószínűségi változóknak tekinthetők X 1, X 2, X 3, ..., X n azonos eloszlásokkal és numerikus jellemzőkkel, beleértve az egyenlő matematikai elvárásokat, egyenlő A,

Mivel a mennyiségek mindegyike X 1, X 2, X 3, ..., X p olyan eloszlása ​​van, amely megegyezik a sokaság eloszlásával, akkor M(X)= a. azért

amiből az következik, hogy egy következetes becslés M(X).

Az extrémum kutatásának szabályával bebizonyítható, hogy ez is egy hatékony becslés M(X).

A matematikai elvárás teszteredmények alapján történő becslésének szükségessége akkor jelenik meg problémákban, ha egy kísérlet eredményét egy valószínűségi változóval írjuk le, és ennek a valószínűségi változónak a matematikai elvárását tekintjük a vizsgált objektum minőségének mutatójának. A megbízhatóság mutatójaként például felvehető egy rendszer hibamentes működési idejének matematikai elvárása, a termékgyártás hatékonyságának megítélésekor pedig a felhasználható termékek számának matematikai elvárása stb.

A matematikai elvárás becslésének problémáját a következőképpen fogalmazzuk meg. Tegyük fel, hogy az X valószínűségi változó ismeretlen értékének meghatározásához n független és szisztematikus hibáktól mentes mérést kell végezni. X v X 2 ,..., X o. Ki kell választania a matematikai elvárás legjobb becslését.

A gyakorlatban a matematikai elvárás legjobb és legáltalánosabb becslése a teszteredmények számtani átlaga

is hívják statisztikai vagy minta átlag.

Mutassuk meg, hogy a becslés t x megfelel bármely paraméter értékeléséhez szükséges összes követelménynek.

1. Az (5.10) kifejezésből az következik

azaz értékelés t" x- elfogulatlan becslés.

2. Csebisev tétele szerint a teszteredmények számtani átlaga valószínűségben konvergál a matematikai elváráshoz, azaz.

Következésképpen az (5.10) becslés a matematikai várakozás következetes becslése.

3. Becslési variancia t x, egyenlő

A minta méretének növekedésével n korlátlanul csökken. Bebizonyosodott, hogy ha egy X valószínűségi változóra vonatkozik a normális eloszlási törvény, akkor bármelyikre n szórás (5.11) minimális lesz, és a becslés t x- a matematikai elvárás hatékony becslése. A becslés szórásának ismerete lehetővé teszi a matematikai elvárás ismeretlen értékének e becslés segítségével történő meghatározásának pontosságát illetően.

A számtani átlagot a matematikai elvárás becsléseként használjuk, ha a mérési eredmények ugyanolyan pontosak (D szórás, én = 1, 2, ..., n minden dimenzióban ugyanaz). A gyakorlatban azonban meg kell küzdeni olyan problémákkal, amelyekben a mérési eredmények nem egyenlőek (például a tesztelés során különböző műszerekkel végeznek méréseket). Ebben az esetben a matematikai elvárás becslésének formája van

Ahol - a z-edik méret súlya.

Az (5.12) képletben minden mérés eredménye a saját súlyával együtt szerepel VEL.. Ezért a mérési eredmények értékelése t x hívott súlyozott átlag.

Kimutatható, hogy a becslés (5.12) a matematikai elvárás torzítatlan, konzisztens és hatékony becslése. A becslés minimális szórását a


Számítógépen végzett modellekkel végzett kísérletek során hasonló problémák merülnek fel, ha több tesztsorozat eredményeiből becsléseket találunk, és az egyes sorozatokban eltérő a tesztek száma. Például két tesztsorozatot végeztek egy kötettel n 1és p 2, amelyek eredményei alapján becsléseket kaptunk T xi és t x_. A matematikai elvárás meghatározásának pontosságának és megbízhatóságának növelése érdekében ezen tesztsorozatok eredményeit kombinálják. Ehhez használja az (5.12) kifejezést.

A C együtthatók számításakor a D varianciák helyett az egyes sorozatok vizsgálati eredményeiből kapott becsléseiket helyettesítjük.

Hasonló megközelítést alkalmaznak egy véletlenszerű esemény bekövetkezésének valószínűségének meghatározásakor egy tesztsorozat eredményei alapján.

Az X valószínűségi változó matematikai elvárásainak becsléséhez a mintaátlagon kívül más statisztikák is használhatók. A tagokat leggyakrabban erre a célra használják. variációs sorozat, azaz a becslések alapjául szolgáló ordinális statisztika,

megfelelnek a fő követelményeknek, nevezetesen a következetességnek és az elfogulatlanságnak.

Tegyük fel, hogy a variációs sorozat tartalmaz n = 2k tagjai. Ekkor bármelyik átlagot fel lehet venni a matematikai elvárás becsléseként:

Egy időben k-eátlagos

nem más, mint az X valószínűségi változó eloszlásának statisztikai mediánja, mivel nyilvánvaló az egyenlőség

A statisztikai medián előnye, hogy mentes az anomális megfigyelési eredmények befolyásától, ami elkerülhetetlen az első átlag, azaz a legkisebb és legnagyobb számú variációs sorozat átlaga esetén.

Páratlan mintamérethez n = 2k- 1 statisztikai medián a középső eleme, azaz. To variációs sorozat tagja Én = x k.

Vannak olyan eloszlások, amelyeknél a számtani átlag nem hatékony becslése a matematikai elvárásoknak, ilyen például a Laplace-eloszlás. Kimutatható, hogy a Laplace-eloszlás esetén a matematikai elvárás hatékony becslése a minta mediánja.

Bebizonyosodott, hogy ha az X valószínűségi változó normális eloszlású, akkor kellően nagy mintaméret mellett a statisztikai medián eloszlási törvénye numerikus jellemzőkkel közeli a normálishoz.

Az (5.11) és (5.14) képletek összehasonlításából az következik, hogy a statisztikai medián szórása 1,57-szer nagyobb, mint a számtani átlag szórása. Következésképpen a számtani átlag a matematikai elvárás becsléseként annyiszor hatékonyabb, mint a statisztikai medián. A számítások egyszerűsége és az anomális mérési eredményekkel szembeni érzéketlenség (a minta „szennyeződése”) miatt azonban a gyakorlatban a statisztikai mediánt mégis a matematikai várakozás becsléseként használják.

Megjegyzendő, hogy folytonos szimmetrikus eloszlások esetén a matematikai elvárás és a medián megegyezik. Ezért a statisztikai medián csak akkor szolgálhat jó becslésként a matematikai várakozásra, ha a valószínűségi változó eloszlása ​​szimmetrikus.

Aszimmetrikus eloszlások esetén a statisztikai medián Nekem jelentős torzítással rendelkezik a matematikai elváráshoz képest, ezért értékelésére alkalmatlan.





hiba: A tartalom védett!!