Vyberte možnost Stránka

Intervaly spolehlivosti pro odhad matematického očekávání. Matematika a informatika

Nechť náhodnou veličinu X populace je distribuován normálně, vzhledem k tomu, že rozptyl a směrodatná odchylka s tohoto rozdělení jsou známé. Je nutné odhadnout neznámé matematické očekávání pomocí výběrového průměru. V tomto případě je problém najít interval spolehlivosti Pro matematické očekávání se spolehlivostí b. Pokud zadáte hodnotu pravděpodobnosti spolehlivosti (reliability) b, pak pravděpodobnost pádu do intervalu pro neznámé matematické očekávání zjistíte pomocí vzorce (6.9a):

kde Ф(t) je Laplaceova funkce (5.17a).

V důsledku toho můžeme formulovat algoritmus pro nalezení hranic intervalu spolehlivosti pro matematické očekávání, pokud je znám rozptyl D = s 2:

  1. Nastavte hodnotu spolehlivosti – b.
  2. Z (6.14) vyjádřete Ф(t) = 0,5× b. Vyberte hodnotu t z tabulky pro Laplaceovu funkci na základě hodnoty Ф(t) (viz Příloha 1).
  3. Odchylku e vypočítejte pomocí vzorce (6.10).
  4. Zapište pomocí vzorce (6.12) interval spolehlivosti tak, aby s pravděpodobností b platila nerovnost:

.

Příklad 5.

Náhodná veličina X má normální rozdělení. Najděte intervaly spolehlivosti pro odhad se spolehlivostí b = 0,96 neznámého matematického očekávání a, je-li dáno:

1) obecná směrodatná odchylka s = 5;

2) průměr vzorku;

3) velikost vzorku n = 49.

Ve vzorci (6.15) intervalového odhadu matematického očekávání A se spolehlivostí b jsou známy všechny veličiny kromě t. Hodnotu t lze zjistit pomocí (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

Pomocí tabulky v Příloze 1 pro Laplaceovu funkci Ф(t) = 0,48 najděte odpovídající hodnotu t = 2,06. Proto, . Dosazením vypočítané hodnoty e do vzorce (6.12) získáte interval spolehlivosti: 30-1,47< a < 30+1,47.

Požadovaný interval spolehlivosti pro odhad se spolehlivostí b = 0,96 neznámého matematického očekávání je roven: 28,53< a < 31,47.

Pro začátek si připomeňme následující definici:

Zvažme následující situaci. Nechť varianty populace mají normální rozdělení s matematickým očekáváním $a$ a směrodatnou odchylkou $\sigma$. Výběrový průměr bude v tomto případě považován za náhodnou veličinu. Když je množství $X$ normálně rozděleno, průměr vzorku bude také normálně rozdělen s parametry

Najdeme interval spolehlivosti, který pokryje hodnotu $a$ se spolehlivostí $\gamma $.

K tomu potřebujeme rovnost

Z toho dostáváme

Odtud můžeme snadno najít $t$ z tabulky funkčních hodnot ​​$Ф\left(t\right)$ a v důsledku toho najít $\delta $.

Připomeňme si tabulku hodnot funkce $Ф\left(t\right)$:

Obrázek 1. Tabulka hodnot funkcí $Ф\left(t\right).$

Integrál spolehlivosti pro odhad matematického očekávání pro neznámou $(\mathbf \sigma )$

V tomto případě použijeme opravenou hodnotu rozptylu $S^2$. Nahrazením $\sigma $ $S$ ve výše uvedeném vzorci dostaneme:

Příklady úloh pro nalezení intervalu spolehlivosti

Příklad 1

Nechť má veličina $X$ normální rozdělení s rozptylem $\sigma =4$. Nechť je velikost vzorku $n=64$ a spolehlivost $\gamma =0,95$. Najděte interval spolehlivosti pro odhad matematického očekávání tohoto rozdělení.

Musíme najít interval ($\overline(x)-\delta ,\overline(x)+\delta)$.

Jak jsme viděli výše

\[\delta =\frac(\sigma t)(\sqrt(n))=\frac(4t)(\sqrt(64))=\frac(\t)(2)\]

Parametr $t$ lze zjistit ze vzorce

\[Ф\left(t\right)=\frac(\gamma )(2)=\frac(0,95)(2)=0,475\]

Z tabulky 1 zjistíme, že $t=1,96$.

Interval spolehlivosti– limitní hodnoty statistická hodnota, která s danou pravděpodobností γ bude v tomto intervalu při vzorkování většího objemu. Označuje se jako P(θ - ε. V praxi vyberte pravděpodobnost spolehlivostiγ z hodnot poměrně blízkých jednotě: γ = 0,9, γ = 0,95, γ = 0,99.

Účel služby. Pomocí této služby můžete určit:

  • interval spolehlivosti pro obecný průměr, interval spolehlivosti pro rozptyl;
  • interval spolehlivosti pro směrodatnou odchylku, interval spolehlivosti pro obecný podíl;
Výsledné řešení se uloží do souboru aplikace Word (viz příklad). Níže je video návod, jak vyplnit počáteční údaje.

Příklad č. 1. Na JZD bylo z celkového stáda 1000 ovcí 100 ovcí podrobeno selektivnímu kontrolnímu stříhání. V důsledku toho byl stanoven průměrný odstřižek vlny 4,2 kg na ovci. Určete s pravděpodobností 0,99 průměr čtvercová chyba vzorky při určování průměrného střihu vlny na ovci a mezí, ve kterých je hodnota střihu obsažena, pokud je rozptyl 2,5. Vzorek se neopakuje.
Příklad č. 2. Ze šarže dovezených výrobků na poště Moskevské severní celnice bylo náhodným opakovaným vzorkováním odebráno 20 vzorků výrobku „A“. Výsledkem testu byl průměrný obsah vlhkosti produktu „A“ ve vzorku, který se ukázal být roven 6 % se směrodatnou odchylkou 1 %.
Určete s pravděpodobností 0,683 limity průměrné vlhkosti výrobku v celé šarži dovážených výrobků.
Příklad č. 3. Průzkum mezi 36 studenty ukázal, že průměrný počet přečtených učebnic za rok akademický rok, ukázalo se rovna 6. Za předpokladu, že počet učebnic přečtených studentem za semestr má zákon normálního rozdělení se směrodatnou odchylkou rovnou 6, zjistěte: A) se spolehlivostí 0,99 intervalový odhad pro matematický očekávání této náhodné veličiny; B) s jakou pravděpodobností můžeme říci, že průměrný počet přečtených učebnic studentem za semestr, vypočtený z tohoto vzorku, se bude odchylovat od matematického očekávání v absolutní hodnotě nejvýše o 2.

Klasifikace intervalů spolehlivosti

Podle typu hodnoceného parametru:

Podle typu vzorku:

  1. Interval spolehlivosti pro nekonečný vzorek;
  2. Interval spolehlivosti pro konečný vzorek;
Vzorek se nazývá převzorkování, pokud se vybraný objekt vrátí do populace před výběrem dalšího. Ukázka se nazývá neopakující se, pokud vybraný objekt není vrácen do populace. V praxi se většinou potýkáme s neopakujícími se vzorky.

Výpočet průměrné výběrové chyby pro náhodný výběr

Nesoulad mezi hodnotami ukazatelů získanými ze vzorku a odpovídajícími parametry obecné populace se nazývá chyba reprezentativnosti.
Označení hlavních parametrů obecné a výběrové populace.
Vzorce průměrných chyb vzorkování
opětovný výběropakovat výběr
za průměrpro sdíleníza průměrpro sdílení
Vztah mezi mezí vzorkovací chyby (Δ) je s určitou pravděpodobností zaručen Р(t), a průměrná výběrová chyba má tvar: nebo Δ = t·μ, kde t– koeficient spolehlivosti, stanovený v závislosti na úrovni pravděpodobnosti P(t) podle tabulky Laplaceovy integrální funkce.

Vzorce pro výpočet velikosti vzorku metodou čistě náhodného výběru

Nechť je náhodná veličina (můžeme mluvit o obecné populaci) rozdělena podle normálního zákona, pro který je znám rozptyl D = 2 (> 0). Z obecné populace (na množině objektů, z nichž je určena náhodná veličina) se udělá vzorek o velikosti n. Vzorek x 1 , x 2 ,..., x n je považován za množinu n nezávislých náhodných veličin rozdělených stejným způsobem jako (přístup vysvětlený výše v textu).

Následující rovnosti byly také diskutovány a prokázány dříve:

Mxi = Mx2 = ... = Mxn = M;

Dx 1 = Dx 2 = ... = Dx n = D;

Stačí jednoduše dokázat (důkaz vynecháme), že náhodná veličina je i v tomto případě rozdělena podle normálního zákona.

Označme neznámou veličinu M a a podle dané spolehlivosti vybereme číslo d > 0 tak, aby byla splněna podmínka:

P(- a< d) = (1)

Protože náhodná veličina je rozdělena podle normálního zákona s matematickým očekáváním M = M = a a rozptylem D = D /n = 2 /n, dostáváme:

P(- a< d) =P(a - d < < a + d) =

Zbývá zvolit d takové, aby platila rovnost

Pro kterýkoli z nich můžete pomocí tabulky najít číslo t takové, že (t)= / 2. Toto číslo t se někdy nazývá kvantil.

Nyní od rovnosti

určíme hodnotu d:

Konečný výsledek získáme předložením vzorce (1) ve tvaru:

Význam posledního vzorce je následující: se spolehlivostí, interval spolehlivosti

pokrývá neznámý parametr a = M populace. Můžete to říct jinak: bodový odhad určuje hodnotu parametru M s přesností d= t / a spolehlivostí.

Úkol. Nechť existuje populace s určitou charakteristikou rozdělená podle normálního zákona s rozptylem rovným 6,25. Byl odebrán vzorek o velikosti n = 27 a byla získána průměrná výběrová hodnota charakteristiky = 12. Najděte interval spolehlivosti pokrývající neznámé matematické očekávání studované charakteristiky obecné populace se spolehlivostí = 0,99.

Řešení. Nejprve pomocí tabulky pro Laplaceovu funkci zjistíme hodnotu t z rovnosti (t) = / 2 = 0,495. Na základě získané hodnoty t = 2,58 určíme přesnost odhadu (resp. poloviční délku intervalu spolehlivosti) d: d = 2,52,58 / 1,24. Odtud získáme požadovaný interval spolehlivosti: (10,76; 13,24).

statistická hypotéza obecná variační

Interval spolehlivosti pro matematické očekávání normálního rozdělení s neznámým rozptylem

Nechť je náhodná veličina rozdělená podle normálního zákona s neznámým matematickým očekáváním M, kterou označíme písmenem a. Udělejme vzorek objemu n. Stanovme průměrný výběr a korigovaný výběrový rozptyl s 2 pomocí známých vzorců.

Náhodná proměnná

rozdělené podle Studentova zákona s n - 1 stupni volnosti.

Úkolem je najít číslo t pro danou spolehlivost a počet stupňů volnosti n - 1 takové, aby rovnost

nebo ekvivalentní rovnost

Zde v závorce je napsána podmínka, že hodnota neznámého parametru a patří do určitého intervalu, kterým je interval spolehlivosti. Jeho meze závisí na spolehlivosti a také na parametrech vzorkování a s.

Abychom určili hodnotu t podle velikosti, transformujeme rovnost (2) do tvaru:

Nyní pomocí tabulky pro náhodnou veličinu t rozloženou podle Studentova zákona s použitím pravděpodobnosti 1 - a počtu stupňů volnosti n - 1 najdeme t. Vzorec (3) dává odpověď na nastolený problém.

Úkol. V kontrolních testech 20 elektrických lamp byla průměrná doba jejich provozu rovna 2000 hodinám se směrodatnou odchylkou (vypočtenou jako druhá odmocnina korigovaného rozptylu vzorku) 11 hodin. Je známo, že doba provozu lampy je normálně rozdělena náhodná veličina. Určete se spolehlivostí 0,95 interval spolehlivosti pro matematické očekávání této náhodné veličiny.

Řešení. Hodnota 1 – v tomto případě se rovná 0,05. Podle Studentovy distribuční tabulky s počtem stupňů volnosti rovným 19 zjistíme: t = 2,093. Vypočítejme nyní přesnost odhadu: 2,093121/ = 56,6. Odtud získáme požadovaný interval spolehlivosti: (1943,4; 2056,6).

Pojďme stavět v MS EXCEL důvěra interval pro odhad střední hodnoty rozdělení v případě známého rozptylu.

Samozřejmě výběr úroveň důvěry zcela závisí na řešeném problému. Míra důvěry cestujícího v letecké dopravě ve spolehlivost letadla by tedy měla být nepochybně vyšší než míra důvěry kupujícího ve spolehlivost elektrické žárovky.

Formulace problému

Předpokládejme, že z populace které byly odebrány ochutnat velikost n. Předpokládá se, že směrodatná odchylka tato distribuce je známá. Na základě toho je nutné vzorky hodnotit neznámé distribuční průměr(μ, ) a sestrojte odpovídající oboustranný interval spolehlivosti.

Bodový odhad

Jak je známo z statistika(označme to X prům) je nestranný odhad průměru tento populace a má distribuci N(μ;σ 2 /n).

Poznámka: Co dělat, když potřebujete stavět interval spolehlivosti v případě distribuce, která není normální? V tomto případě přichází na pomoc, která uvádí, že s dostatečně velkou velikostí vzorky n z distribuce nebýt normální, vzorové rozdělení statistik X prům vůle přibližně odpovídat normální distribuce s parametry N(μ;σ 2 /n).

Tak, bodový odhad průměrný distribuční hodnoty máme - tohle průměr vzorku, tj. X prům. Nyní začneme interval spolehlivosti.

Konstrukce intervalu spolehlivosti

Obvykle, když známe rozdělení a jeho parametry, můžeme vypočítat pravděpodobnost, že náhodná veličina nabude hodnoty z intervalu, který určíme. Nyní udělejme opak: najdeme interval, do kterého náhodná veličina s danou pravděpodobností dopadne. Například z vlastností normální distribuce je známo, že s pravděpodobností 95% je náhodná proměnná distribuována přes normální zákon, bude spadat do rozsahu přibližně +/- 2 od průměrná hodnota(viz článek o). Tento interval nám poslouží jako prototyp interval spolehlivosti.

Nyní se podívejme, jestli známe distribuci , vypočítat tento interval? Pro zodpovězení otázky musíme uvést tvar rozvodu a jeho parametry.

Známe formu distribuce - to je normální distribuce(pamatujte, že mluvíme o distribuce vzorkování statistika X prům).

Parametr μ nám není znám (jen je třeba jej odhadnout pomocí interval spolehlivosti), ale máme to odhad průměr X, vypočítané na základě vzorky, které lze použít.

Druhý parametr - směrodatná odchylka výběrového průměru budeme to považovat za známé, je rovno σ/√n.

Protože neznáme μ, pak sestrojíme interval +/- 2 směrodatné odchylky ne od průměrná hodnota a z jeho známého odhadu X prům. Tito. při výpočtu interval spolehlivosti to nebudeme předpokládat X prům spadá do rozmezí +/- 2 směrodatné odchylky od μ s pravděpodobností 95 % a budeme předpokládat, že interval je +/- 2 směrodatné odchylky z X prům s 95% pravděpodobností pokryje μ – průměr běžné populace, ze kterého se bere ochutnat. Tyto dva výroky jsou ekvivalentní, ale druhý výrok nám umožňuje konstrukci interval spolehlivosti.

Kromě toho si ujasněme interval: náhodná proměnná rozdělená přes normální zákon, s 95% pravděpodobností spadá do intervalu +/- 1,960 standardní odchylky, ne +/- 2 směrodatné odchylky. To lze vypočítat pomocí vzorce =NORM.ST.REV((1+0,95)/2), cm. příklad souboru Sheet Interval.

Nyní můžeme formulovat pravděpodobnostní tvrzení, které nám poslouží k formování interval spolehlivosti:
„Pravděpodobnost, že průměr populace nachází se od ukázkový průměr do 1 960" standardní odchylky průměru vzorku" rovných 95 %".

Hodnota pravděpodobnosti uvedená ve výpisu má speciální název , který je spojen s hladina významnosti α (alfa) jednoduchým výrazem úroveň důvěry =1 . V našem případě úroveň významnosti α =1-0,95=0,05 .

Nyní na základě tohoto pravděpodobnostního tvrzení napíšeme výraz pro výpočet interval spolehlivosti:

kde Z α/2 norma normální distribuce(tato hodnota náhodné proměnné z, Co P(z>=Z a/2 ) = a/2).

Poznámka: Horní α/2-kvantil definuje šířku interval spolehlivosti PROTI směrodatné odchylky průměr vzorku. Horní α/2-kvantil norma normální distribuce vždy větší než 0, což je velmi výhodné.

V našem případě s α=0,05, horní α/2-kvantil rovná se 1,960. Pro ostatní hladiny významnosti α (10 %; 1 %) horní α/2-kvantil Z a/2 lze vypočítat pomocí vzorce =NORM.ST.REV(1-α/2) nebo, je-li známo úroveň důvěry, =NORM.ST.OBR((1+úroveň důvěryhodnosti)/2).

Obvykle při stavbě intervaly spolehlivosti pro odhad střední hodnoty pouze používat horní α/2-kvantil a nepoužívejte nižší α/2-kvantil. To je možné, protože norma normální distribuce symetricky kolem osy x ( hustota jeho distribuce symetrický asi průměr, tzn. 0). Proto není třeba počítat nižší α/2-kvantil(nazývá se jednoduše α /2-kvantil), protože je to rovné horní α/2-kvantil se znaménkem mínus.

Připomeňme, že i přes tvar rozdělení hodnoty x, odpovídající náhodné veličiny X prům distribuováno přibližně Dobře N(μ;σ 2 /n) (viz článek o). Proto v obecný případ, výše uvedený výraz pro interval spolehlivosti je pouze přibližné. Pokud je hodnota x rozdělena přes normální zákon N(μ;σ 2 /n), pak výraz pro interval spolehlivosti je přesný.

Výpočet intervalu spolehlivosti v MS EXCEL

Pojďme vyřešit problém.
Doba odezvy elektronické součástky na vstupní signál je důležitou charakteristikou zařízení. Technik chce vytvořit interval spolehlivosti pro průměrnou dobu odezvy na úrovni spolehlivosti 95 %. Z předchozích zkušeností inženýr ví, že směrodatná odchylka doby odezvy je 8 ms. Je známo, že pro vyhodnocení doby odezvy inženýr provedl 25 měření, průměrná hodnota byla 78 ms.

Řešení: Inženýr chce znát dobu odezvy elektronického zařízení, ale chápe, že doba odezvy není pevná hodnota, ale náhodná veličina, která má své vlastní rozdělení. Takže to nejlepší, v co může doufat, je určit parametry a tvar tohoto rozdělení.

Bohužel z podmínek problému neznáme tvar rozložení doby odezvy (nemusí být normální). , tato distribuce je také neznámá. Známý je jen on směrodatná odchylka a=8. Proto i když nemůžeme vypočítat pravděpodobnosti a konstruovat interval spolehlivosti.

Ovšem i přes to, že distribuci neznáme čas samostatná odpověď, víme, že podle CPT, distribuce vzorkování průměrná doba odezvy je přibližně normální(budeme předpokládat, že podmínky CPT se provádějí, protože velikost vzorky poměrně velké (n=25)) .

Navíc, průměrný toto rozdělení se rovná průměrná hodnota distribuce jedné odpovědi, tzn. μ. A směrodatná odchylka tohoto rozdělení (σ/√n) lze vypočítat pomocí vzorce =8/ROOT(25) .

Je také známo, že inženýr obdržel bodový odhad parametr μ rovný 78 ms (X avg). Proto nyní můžeme vypočítat pravděpodobnosti, protože známe formu distribuce ( normální) a jeho parametry (X avg a σ/√n).

Inženýr to chce vědět matematické očekáváníμ distribuce doby odezvy. Jak bylo uvedeno výše, toto μ se rovná matematické očekávání rozložení vzorku průměrné doby odezvy. Pokud použijeme normální distribuce N(Х avg; σ/√n), pak bude požadované μ v rozsahu +/-2*σ/√n s pravděpodobností přibližně 95 %.

Úroveň významnosti rovná se 1-0,95=0,05.

Nakonec najdeme levou a pravou hranici interval spolehlivosti.
Levý okraj: =78-NORM.ST.INV(1-0,05/2)*8/ROOT(25) = 74,864
Pravé ohraničení: =78+NORM.ST.REV(1-0,05/2)*8/ROOT(25)=81,136

Levý okraj: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Pravé ohraničení: =NORM.REV(1-0,05/2; 78; 8/ROOT(25))

Odpověď: interval spolehlivosti na 95% hladina spolehlivosti a σ=8msec rovná se 78+/-3,136 ms.

V ukázkový soubor na listu Sigma známý, vytvořil formulář pro výpočet a konstrukci oboustranný interval spolehlivosti za svévolné vzorky s daným σ a úroveň významnosti.

Funkce CONFIDENCE.NORM().

Pokud hodnoty vzorky jsou v dosahu B20:B79 , A úroveň významnosti rovna 0,05; pak vzorec MS EXCEL:
=PRŮMĚR (B20:B79)-CONFIDENCE.NORM(0,05;σ; COUNT(B20:B79))
vrátí levý okraj interval spolehlivosti.

Stejný limit lze vypočítat pomocí vzorce:
=PRŮMĚR (B20:B79)-NORM.ST.REV(1-0,05/2)*σ/ROOT(COUNT(B20:B79))

Poznámka: Funkce CONFIDENCE.NORM() se objevila v MS EXCEL 2010. V dřívějších verzích MS EXCEL byla použita funkce TRUST().





chyba: Obsah chráněn!!