Interval dôvery za matematické očakávania normálnej distribúcie so známym disperziou. Interval dôvery na strednodobé hodnotenie (známe disperzie) v MS Excel

Nech CB x tvoria všeobecný súbor a B - neznámy parameter CB X. Ak je štatistické posúdenie v * bohatej, tým viac odberu vzoriek, tým presnejšia hodnota hodnoty v. V praxi však máme vzorku nie veľmi veľký objem, takže nemôžeme zaručiť väčšiu presnosť.

Nech B * - Štatistické hodnotenie B. Hodnota | B * - V | Nazýva sa presnosť hodnotenia. Je jasné, že presnosť je CB, pretože in * - náhodná hodnota. Požiadajme malé kladné číslo 8 a vyžadujú presnosť hodnotenia | B * - v | Tam bolo menej ako 8, t.j. v * - v |< 8.

Spoľahlivosť G alebo pravdepodobnosť dôvery Odhady v softvéri v * nazývanej pravdepodobnosť G, z ktorej sa vykonáva nerovnosť | v * - v |< 8, т. е.

Zvyčajne je spoľahlivosť G je špecifikovaná vopred a číslo blízko 1 (0,9; 0,95; 0,99; ...).

Od nerovnosti | B * - V< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Interval (B * - 8, B * + 5) sa nazýva interval spoľahlivosti, t.j. interval dôvery pokrýva neznámy parameter s pravdepodobnosťou. Upozorňujeme, že konce intervalu spoľahlivosti sú náhodné a líšia sa od odberu vzoriek na vzorku, preto je presnejšie povedať, že interval (B * - 8, B * 8) pokrýva neznámy parameter a nepatrí k tomuto interval.

Byť všeobecný agregát Uvádza sa náhodná hodnota X, distribuovaná podľa normálneho zákona, a priemerná kvadratická odchýlka a je známa. Neznáme očakávaná hodnota A \u003d m (x). Je potrebné nájsť interval spoľahlivosti pre danú spoľahlivosť.

Selektívny stred

je Štatistické hodnotenie pre XG \u003d a.

Teorem. Náhodná hodnota KHR má normálna distribúciaAk X má normálnu distribúciu a m (kh) \u003d A,

A (XB) \u003d A, kde A \u003d Y / B (x), A \u003d M (X). L / I.

Interval spoľahlivosti pre A má formulár:

Nájdeme 8.

Využívanie pomeru

kde f (d) je funkcia Laplace, máme:

P (XB - A |<8} = 2Ф

tabuľka hodnoty funkcie Laplace nájde hodnotu T.

Označený

T, dostaneme f (t) \u003d g, pretože g je nastavený, potom

Z rovnosti medzi hodnotením.

To znamená, že interval spoľahlivosti pre A má formulár:

Ak je vzorka definovaná zo všeobecnej populácie x

ng " X2 Xm.
n. n1. n2. nm.

n \u003d u1 + ... + nm, potom bude interval spoľahlivosti:

Príklad 6.35. Nájdite interval spoľahlivosti na posúdenie matematického očakávania normálnej distribúcie so spoľahlivosťou 0,95, poznanie selektívneho stredného XB \u003d 10,43, veľkosť vzorky n \u003d 100 a priemerná kvadratická odchýlka S \u003d 5.

Používame vzorec

Et al. Všetky z nich sú odhady ich teoretických analógov, ktoré by sa mohli získať, ak neexistovala vzorka k dispozícii, ale všeobecný agregát. Ale alas, všeobecný agregát je veľmi drahý a často nie je k dispozícii.

Koncepcia intervalu

Akékoľvek selektívne hodnotenie má nejaký rozptyl, pretože Je to náhodná premenná v závislosti od hodnôt v konkrétnej vzorke. Preto pre spoľahlivejšie štatistické závery by preto mali byť známe nielen odhadový odhad, ale aj interval, ktorý je veľmi pravdepodobný. γ (gama) pokrýva odhadovaný ukazovateľ θ (Teta).

Formálne sú tieto hodnoty (štatistiky) T 1 (x) a T 2 (x), čo T 1.< T 2 pre ktoré na danej úrovni pravdepodobnosti γ Podmienka je splnená:

Stručne povedané, s pravdepodobnosťou γ alebo viac pravého indikátora je medzi bodmi T 1 (x) a T 2 (x)ktoré sa nazývajú dolné a horné hranice dôverný interval.

Jednou z podmienok pre konštruktívne intervaly je jeho maximálna úzka, t.j. Malo by to byť rovnako krátke. Túžba je celkom prirodzená, pretože Výskumník sa snaží presnejšie nájsť základ požadovaného parametra.

Z toho vyplýva, že interval spoľahlivosti musí pokryť maximálne pravdepodobnosti distribúcie. A samotné skóre je v centre.

Že máte na mysli pravdepodobnosť odchýlky (skutočný ukazovateľ z hodnotenia) na veľkej strane rovnajúcu sa pravdepodobnosti odchýlky na menšej strane. Treba tiež poznamenať, že pre asymetrické rozdelenia sa interval vpravo nie je rovný intervalu vľavo.

Na obrázku je jednoznačne zrejmé, že čím väčšia pravdepodobnosť dôvery, širší interval je priama závislosť.

Bola to malá úvodná časť na teóriu intervalového odhadu neznámych parametrov. Poďme sa obrátiť na nájdenie hraniciach dôvery za matematické očakávania.

Interval dôvery za matematické očakávania

Ak sú počiatočné údaje distribuované softvérom, potom bude priemer normálny ako veľkosť. To vyplýva z tohto pravidla, že lineárna kombinácia normálnych hodnôt má tiež normálnu distribúciu. Preto by sme mohli vypočítať pravdepodobnosti, mohli by sme použiť matematické prístroje normálneho distribučného zákona.

To si však bude vyžadovať, aby ste poznali dva parametre - zápalky a disperzie, ktoré zvyčajne nie sú známe. Samozrejme, namiesto parametrov na použitie odhadov (priemerný aritmetický a), ale potom distribúcia priemeru nebude celkom normálna, bude to trochu posilnená kniha. Túto skutočnosť obratne notifikoval občana William Gosset z Írska, zverejnil svoje otvorenie v marcovom vydaní časopisu Biometricy pre 1908. Na účely sprisahania, Gosset podpísaný Studeta. Takže sa objavila T-Distribúcia študenta.

Normálne rozdelenie údajov, ktoré používa K. Gauss pri analýze chýb astronomických pozorovaní, v živote Zeme je mimoriadne zriedkavé a inštaluje ho pomerne ťažké (pri vysokej presnosti je potrebné asi 2 tisíc pozorovaní). Preto je predpoklad normálnej bezpečnosti najlepšie vyradiť a používať metódy, ktoré nezávisia od distribúcie zdrojových údajov.

Vzniká otázka: Aká je distribúcia priemernej aritmetiky, ak sa vypočíta podľa údajov neznámej distribúcie? Odpoveď dáva v teórii pravdepodobností známy Centrálne limit teorem. (CPT). V matematike existuje niekoľko možností (po mnoho rokov, znenie bolo špecifikované), ale všetky, zhruba, sú znížené na schválenie, že súčet veľkého počtu nezávislých náhodných premenných podlieha normálnemu distribučnému právu.

Pri výpočte priemerného aritmetika sa používa množstvo náhodných premenných. Odtiaľ sa ukáže, že aritmetický priemer má normálnu distribúciu, ktorá má veľa biokomositických údajov a disperzie -.

Inteligentní ľudia vedia, ako dokázať CPT, ale budeme presvedčení o tom s pomocou experimentu uskutočneného v programe Excel. Simulujeme vzorku 50 jednotne distribuovaných náhodných premenných (pomocou funkcie Excel trvalej). Potom vytvorte 1000 takýchto vzoriek a pre každú z nich vypočítame priemernú aritmetiku. Pozrime sa na ich distribúciu.

Je možné vidieť, že distribúcia média blízko normálneho zákona. Ak je veľkosť vzoriek a ich množstvo ešte viac, podobnosť bude ešte lepšia.

Teraz, keď sme boli presvedčení o sofistikovanosti v spravodlivosti TPT, je možné používať, vypočítať intervaly spoľahlivosti pre stredne veľké aritmetikum, ktoré s danou pravdepodobnosťou pokrývajú skutočný priemer alebo matematické očakávania.

Ak chcete vytvoriť horné a dolné hranice, potrebujete poznať parametre normálnej distribúcie. Spravidla sa preto nepoužívajú odhady: \\ t stredný aritmetický a selektívna disperzia. Opakujem, táto metóda dáva dobrý prístup len pre veľké vzorky. Keď sú vzorky malé, často odporúčame používať študentskú distribúciu. Neverte! Distribúcia študenta pre priemer je len vtedy, keď počiatočné údaje majú normálnu distribúciu, to znamená takmer nikdy. Preto je lepšie okamžite umiestniť minimálnu tyč na počet potrebných údajov a použiť asymptoticky správne metódy. Hovorí sa o dosť pozorovaní. Vezmite 50 - Nesprávne.

T 1.2. - nižšia a horná hranica intervalu spoľahlivosti

- selektívny aritmetický priemer

s 0. - priemerná odchýlka kvadratickej vzorky (nestabilná)

n. - Veľkosť vzorky

γ - pravdepodobnosť spoľahlivosti (zvyčajne rovná 0,9, 0,95 alebo 0,99)

c y \u003d φ -1 ((1 + y) / 2) - Reverzná hodnota funkcie štandardnej normálnej distribúcie. Jednoducho povedané, toto je počet štandardných chýb zo stredného aritmetika do spodnej alebo hornej hranici (špecifikované tri pravdepodobnosti zodpovedajú hodnotám 1,64, 1,96 a 2,58).

Podstatou vzorca je, že aritmetický aritmetický sa odoberie a určitá suma sa odloží z neho ( s γ.) Štandardné chyby ( s 0 / √n). Všetko je známe, vziať a zvážiť.

Pred použitím hmotnosti PEVM na získanie hodnôt funkcie normálnej distribúcie a inverznej, ktorý bol použitý. Používajú sa teraz, ale je efektívnejšie kontaktovať hotové excel vzorce. Všetky prvky zo vzorca vyššie (a) sa môžu ľahko vypočítať v programe Excel. Existuje však aj hotový vzorec pre výpočet intervalu spoľahlivosti - TRUST. NORMA. Jeho syntax je ďalej.

Dôvera. Norma (alfa, štandard_otchal; veľkosť)

alfa - úroveň významu alebo úroveň spoľahlivosti, ktorá je vo vyššie uvedenom notácii 1- γ, t.j. pravdepodobnosť, že matematickéČakanie bude mimo intervalu spoľahlivosti. S pravdepodobnosťou dôvery 0,95, alfa je 0,05 atď.

Štandard_tack - priemerná kvadratická odchýlka údajov o vzorkách. Nemusíte počítať štandardnú chybu, Excel sám bude rozdelený do root z n.

veľkosť - Veľkosť vzorky (n).

Výsledok funkcie bude dôverovať. Nore - to je druhý termín od vzorec pre výpočet intervalu spoľahlivosti, t.j. polovičný interval Nižší a horný bod je teda priemer ± výsledná hodnota.

Je teda možné konštruovať univerzálny algoritmus na výpočet intervalov spoľahlivosti pre priemerný aritmetický, ktorý nezávisí od distribúcie zdrojových údajov. Doska na univerzálnosť je jeho asymptotikibility, t.j. Potreba používať relatívne veľké vzorky. Avšak, v storočí moderných technológií, zvyčajne nie je ťažké zbierať požadované množstvo údajov.

Kontrola štatistických hypotéz s intervalom dôvery

(Modul 111)

Jednou z hlavných úloh vyriešených v štatistike je. Krátko. Predpokladá sa napríklad, že kapitán všeobecného agregátu sa rovná určitej hodnote. Potom distribúciu vzorových médií, ktoré možno pozorovať s týmto zápasom. Ďalej vyzerajú, v ktorom umiestnení tejto podmienečnej distribúcie je skutočný priemer. Ak ide nad rámec prípustných limitov, vzhľad takéhoto priemeru je veľmi nepravdepodobné, a s jedným opakovaním experimentu je takmer nemožné, čo je v rozpore s predĺženou hypotézou, ktorá je úspešne odchýlená. Ak priemer nepresahuje rámec kritickej úrovne, potom sa hypotéza neodmieta (ale nie je preukázaná!).

Takže s pomocou intervalov spoľahlivosti, v našom prípade možno skontrolovať aj niektoré hypotézy. Je to veľmi jednoduché. Predpokladajme, že priemerná aritmetika pre niektoré vzorky je 100. Hypotéza sa kontroluje, že lotion sa rovná, povedzme, 90. To znamená, že ak ste položili otázku primitívne, znie to takto: môže to byť, že s skutočným významom priemerný priemer 90, pozorovaný priemer sa ukázal byť 100?

Ak chcete odpovedať na túto otázku, bude navyše potrebné informácie o priemernej kvadratickej odchýlke a odberu vzoriek. Predpokladajme, že odchýlka strednej štvorcová je 30 a počet pozorovaní 64 (ľahko odstrániť koreň). Potom je štandardná stredná chyba 30/8 alebo 3,75. Na výpočet 95% dôverného intervalu bude potrebné odložiť na oboch stranách stredných dvoch štandardných chýb (presnejšie, o 1,96). Interval spoľahlivosti bude približne 100 ± 7,5 alebo od 92,5 do 107,5.

Ďalej sú argumenty nasledovné. Ak overiteľná hodnota vstupuje do intervalu spoľahlivosti, nie je v rozpore s hypotézou, pretože Privádza sa na náhodných kolísaniach (s pravdepodobnosťou 95%). Ak testovací bod presahuje limity intervalu spoľahlivosti, pravdepodobnosť takejto udalosti je v každom prípade veľmi malá, v každom prípade je nižšia ako prípustná úroveň. Tak, hypotéza odchýliť sa na rozdiel od pozorovaných údajov. V našom prípade je hypotéza o zhode mimo intervalu spoľahlivosti (overiteľná hodnota 90 nie je zahrnutá v intervale 100 ± 7,5), takže by sa mal zamietnuť. Reakcia na primitívnu otázku, mala by sa povedať: Nie, možno v každom prípade sa to stane veľmi zriedka. Zároveň je uvedená špecifická pravdepodobnosť chybnej odchýlky hypotézy (P-úrovni) a nie je špecifikovaná úroveň, pre ktorú bol interval spoľahlivosti postavený, ale o tom inom čase.

Ako môžete vidieť, vybudovať interval dôveryhodnosti pre stredné (alebo matematické očakávania) je jednoduché. Hlavnou vecou je chytiť podstatu a potom to bude ísť. V praxi sa vo väčšine prípadov používa 95% dôverného intervalu, ktorý má približne dve štandardné chyby na oboch stranách stredu.

To je všetko. Všetko najlepšie!

Interval dôvery za matematické očakávania

1. Nechajte to vedieť sL. Hodnota x podlieha normálnemu právu s neznámym priemerom μ a známym σ 2: x ~ n (μ, σ 2), σ 2 je zadaný, μ nie je známy. Nastavte β. Vzorkou x 1, x 2, ..., x n, je potrebné konštruovať i β (θ) (teraz θ \u003d μ) uspokojujúce (13)

Selektívny priemer (tiež hovoril selektívny priemer) normálneho zákona s rovnakým stredovým μ, ale menším disperziou x ~ n (μ, d), kde disperzia D \u003d σ 2 \u003d σ 2 / n.

Budeme potrebovať číslo β, určené pre stav ξ ~ n (0,1)

S slovami: medzi bodmi β a p a β osi osí leží oblasť pod krivkou hustoty normálneho zákona, rovná β

Napríklad až 0,90 \u003d 1,645 kvantilickej úrovne 0,95 hodnôt ξ

K 0,95 \u003d 1,96. ; \\ T Na 0,997 \u003d 3.

Najmä odloženie zo stredu akéhokoľvek normálneho zákona 1.96 štandardné odchýlky na pravej strane a vľavo doľava, budeme mať priestor pod krivkou hustoty, ktorá sa rovná 0,95, na základe ktorej je na 0 95 je úroveň kvantitatívneho 0,95 + 1 / 2 * 0,005 \u003d 0,975 pre tento zákon.

Požadovaný interval spoľahlivosti pre všeobecný priemer μ je i (μ) \u003d (x-σ, x + σ),

kde δ \u003d. (15)

Dovoľte mi zdôvodniť:

Podľa toho, čo bolo povedané, Hodnota v intervale J \u003d μ ± σ spadá s pravdepodobnosťou p (obr. 9). V tomto prípade sa hodnota odchyľuje od stredu μ menšie ako na δ a náhodného intervalu ± δ (s náhodným stredom a rovnaký ako šírka J) bude pokrývať bod μ. Tj Є J.<=> μ Є I β,a pretože p (μєі β) \u003d p (є j) \u003d p.

Teda interval i β neustále na vzorke obsahuje priemernú μ s pravdepodobnosťou p.

Jasne ako n, tým menej σ A už interval, a tým viac berieme záruku β, dôverný interval je širší.

Príklad 21.

Vzorkou s n \u003d 16 pre normálnu hodnotu so známym disperziou σ 2 \u003d 64, X \u003d 200 sa zistilo. Zostavte interval dôveryhodnosti pre všeobecné médium (inak, na matematické očakávania) μ, prijatie β \u003d 0,95.

Rozhodnutie. I β (μ) \u003d ± 5, kde δ \u003d až β σ / - až ß σ / \u003d 1,96 * 8 / \u003d 4

I 0,95 (μ) \u003d 200 4 \u003d (196; 204).

Urobiť záver, že s zárukou β \u003d 0,95 skutočný priemer patrí do intervalu (196,204), chápeme, že je možná chyba.

100 intervalov spoľahlivosti I 0. 95 (μ), v priemere 5 neobsahujú μ.

Príklad 22.

Ako v podmienkach predchádzajúceho príkladu 21 by mali n, aby sa dvojnásobok intervalu spoľahlivosti? Ak chcete mať 2δ \u003d 4, musíte si vziať

V praxi často používajú jednostranné intervaly spoľahlivosti. Takže ak sú vysoké hodnoty μ užitočné alebo nie sú hrozné, ale nie sú nízke, ako v prípade trvanlivosti alebo spoľahlivosti, je rozumné vybudovať jednosmerný interval. Na to by malo byť maximalizované jeho horné hraniciach. Ak konštruujeme, ako v príklade 21, obojsmerný interval spoľahlivosti pre daný β, a potom ju budeme čo najviac rozšíriť jedným z hraníc, dostaneme jednosmerný interval s väčšou zárukou β " \u003d p + (1-p) / 2 \u003d (1+ p) / 2, napríklad, ak β \u003d 0,90, potom p \u003d 0,90 + 0,10 / 2 \u003d 0,95.

Predpokladáme napríklad, že hovoríme o pevnosti výrobku a zvýšite hornú hranicu intervalu predtým. Potom pre μ v príklade 21 získame jednostranný interval spoľahlivosti (196, °°) s dolnou hranicou 196 a pravdepodobnosť dôvery β "\u003d 0,95 + 0,05/2 \u003d 0,975.

Praktická nevýhoda vzorca (15) je skutočnosť, že je odvodený za predpokladu, že disperzia \u003d σ 2 (teda \u003d σ 2 / n) je známa; A to sa deje v živote zriedka. Výnimkou je prípad, keď je veľkosť vzorky veľká, povedzme, n sa meria stovkami alebo tisíce a potom pre σ 2, je možné prakticky prijať jeho odhad s 2 alebo.

Príklad 23.

Pre niektoré veľké mesto sa v dôsledku selektívneho prieskumu obyvateľov obyvateľov získal nasledujúca tabuľka údajov (príklad z práce).

Tabuľka 8.

Napríklad zdroje

Prirodzene predpokladať, že Hodnota X je celková (užitočná) plocha (v m 2), ktorá prichádza na osobu, ktorá bude obetovať normálne právo. Priemerné μ a disperzia σ 2 nie je známa. Pre μ musíte vytvoriť 95% interval spoľahlivosti. Aby sa údaje zoskupenia mohli nájsť selektívne médium a disperzia, vykonajte nasledujúcu tabuľku výpočtov (tabuľka 9).

Tabuľka 9.

Výpočty X a 5 zoskupenými údajmi

N skupiny Celková plocha na osobu, m 2 Počet obyvateľov v skupine J J J Midstay interval x j R j x j Rjxj 2.
Až 5,0. 2.5 20.0 50.0
5.0-10.0 7.5 712.5 5343.75
10.0-15.0 12.5 2550.0 31875.0
15.0-20.0 17.5 4725.0 82687.5
20.0-25.0 22.5 4725.0 106312.5
25.0-30.0 27.5 3575.0 98312.5
Viac ako 30,0. 32.5 * 2697.5 87668.75
- 19005.0 412250.0

V tejto dcérskej tabuľke podľa vzorca (2) sa vypočítajú prvé a druhé počiatočné štatistické momenty. a 1.a ale 2

Hoci disperzia σ 2 tu nie je známa, vďaka veľkej veľkosti vzorky, je možné prakticky aplikovať vzorec (15), uvedenie σ \u003d 7.16 v ňom.

Potom δ \u003d K 0,95 σ / \u003d 1,96 * 7,16 / \u003d 0,46.

Interval spoľahlivosti pre všeobecný priemer v p \u003d 0,95 sa rovná i 0,95 (μ) \u003d ± 5 \u003d 19 ± 0,46 \u003d (18,54; 19,46).

V dôsledku toho priemerné námestie na osobu v danom meste so zárukou 0,95 leží medzi (18,54; 19,46).



2. Interval spoľahlivosti pre matematické očakávania μ v prípade neznámej disperzie σ 2 normálnej hodnoty. Tento interval pre danú záruku β je založená na vzorci, kde ν \u003d n-1,

(16)

Koeficient t β, ν má rovnaký význam pre T - distribúciu s ν stupňami slobody, ktoré na β pre distribúciu N (0,1), a to: \\ t

.

Inými slovami, Cl. Hodnota Tν vstupuje do intervalu (-T p, ν; + t p, ν) s pravdepodobnosťou p. T p, ν sú uvedené v tabuľke 10 pre p \u003d 0,95 a p \u003d 0,99.

Tabuľka 10.

Hodnoty t β, ν

Vrátenie sa do príkladu 23, vidíme, že v ňom bol interval spoľahlivosti konštruovaný vzorcom (16) s koeficientom t p, υ \u003d K 0..95 \u003d 1,96, pretože n \u003d 1000.

Interval dôvery za matematické očakávania - Toto je takýto vypočítaný interval, ktorý so známou pravdepodobnosťou obsahuje matematické očakávania všeobecnej populácie. Prirodzené hodnotenie matematického očakávania je priemerná aritmetika svojich pozorovaných hodnôt. Preto ďalej počas lekcie použijeme výrazy "priemer", "priemerná hodnota". V úlohách intervalu dôvery, reakcia typu "interval spoľahlivosti z priemerného čísla [hodnota v konkrétnej úlohe] je od [nižšej hodnoty] na [neskôr]". S pomocou intervalu dôvery možno odhadnúť nielen priemerné významy, ale aj podiel tohto alebo uvedeného znamenia všeobecnej populácie. Priemerná, disperzia, štandardná odchýlka a chyba, cez ktorú prídeme na nové definície a vzorce, demontované na lekcii Charakteristika odberu vzoriek a všeobecný agregát .

Odhady priemernej hodnoty a intervalu

Ak sa priemerná hodnota všeobecnej populácie odhaduje podľa čísla (bod), potom posúdenie neznámej priemernej hodnoty všeobecnej populácie berie konkrétny priemer, ktorý je určený na pozorovania vzorky. V tomto prípade je hodnota priemerného odberu vzoriek náhodnou premennou - sa nezhoduje s priemernou hodnotou všeobecnej populácie. Preto pri určovaní priemernej hodnoty vzorky súčasne zadajte chybu na odber vzoriek. Ako chybové opatrenie na odber vzoriek sa používa štandardná chyba, ktorá je vyjadrená v rovnakých meracích jednotkách ako priemer. Preto sa často používa ďalší záznam :.

Ak sa vyžaduje priemerný odhad, aby bol spojený s určitou pravdepodobnosťou, potom sa vyžaduje parameter všeobecnej populácie, ktorý nie je odhadnutý na rovnakom počte, ale interval. Dôverný interval sa nazýva interval, v ktorom s určitou pravdepodobnosťou P. \\ t Hodnota odhadovaného ukazovateľa všeobecnej populácie. Interval spoľahlivosti, v ktorom pravdepodobnosť P. \\ t = 1 - α Existuje náhodná hodnota vypočítaná takto:

,

α = 1 - P. \\ t ktorý možno nájsť v dodatku k takmer akúkoľvek knihu o štatistike.

V praxi nie je známa priemerná hodnota všeobecnej populácie a disperzie, preto je rozptýlenie všeobecnej populácie nahradená disperziou vzorky a priemerná všeobecná hodnota - priemerná hodnota vzorky. Interval spoľahlivosti sa teda vypočíta vo väčšine prípadov takto: \\ t

.

Vzorec intervalu spoľahlivosti sa môže použiť na posúdenie priemernej všeobecnej populácie, ak

  • je známa štandardná odchýlka všeobecnej populácie;
  • alebo štandardná odchýlka všeobecnej populácie nie je známa, ale veľkosť vzorky je väčšia ako 30.

Priemerná hodnota vzorky je nekomprimovaný odhad priemernej všeobecnej populácie. V odber vzoriek disperzie Nie je to nekompenzovaný odhad disperzie všeobecnej populácie. Získanie neuveriteľného odhadu rozptylu všeobecnej populácie vo vzorci vzorky disperzie. n. by sa mali nahradiť n.-1.

Príklad 1. Informácie zozbierané zo 100 náhodne vybraných kaviarní v určitom meste, že priemerný počet zamestnancov v nich je 10,5 so štandardnou odchýlkou \u200b\u200b4.6. Určiť interval spoľahlivosti 95% počtu zamestnancov kaviarne.

kde je kritická hodnota štandardnej normálnej distribúcie pre úroveň významu α = 0,05 .

Teda interval spoľahlivosti 95% priemerných pracovníkov v kaviarni bol od 9.6 do 11.4.

Príklad 2. Pre náhodnú vzorku zo všeobecnej populácie 64 pripomienok sa vypočíta tieto celkové množstvá: \\ t

množstvo hodnôt v pozorovaní, \\ t

súčet štvorcov odchýlky hodnôt z priemeru .

Vypočítajte interval spoľahlivosti 95% pre matematické očakávania.

vypočítajte štandardnú odchýlku:

,

vypočítame priemernú hodnotu:

.

Hodnoty nahrádzame do výrazu pre interval spoľahlivosti:

kde je kritická hodnota štandardnej normálnej distribúcie pre úroveň významu α = 0,05 .

Dostaneme:

Teda interval spoľahlivosti 95% pre matematické očakávania tejto vzorky bolo od 7,484 do 11.266.

Príklad 3. Pre náhodnú vzorku všeobecnej populácie 100 pozorovania sa vypočíta stredná hodnota 15,2 a štandardná odchýlka 3.2. Vypočítajte interval spoľahlivosti 95% pre matematické očakávania, potom je interval spoľahlivosti 99%. Ak sa ukážkový výkon a jeho variácia nezmení a zvyšuje sa koeficient dôvery, potom je interval spoľahlivosti zúžený alebo rozšírený?

Údaje nahrádzame výrazom pre interval dôvery

kde je kritická hodnota štandardnej normálnej distribúcie pre úroveň významu α = 0,05 .

Dostaneme:

.

Teda interval spoľahlivosti 95% pre priemer tejto vzorky bol od 14,57 do 15,82.

Tieto hodnoty opäť nahrádzame do výrazu pre interval spoľahlivosti:

kde je kritická hodnota štandardnej normálnej distribúcie pre úroveň významu α = 0,01 .

Dostaneme:

.

Teda interval spoľahlivosti 99% pre priemer tejto vzorky bol od 14,37 do 16.02.

Ako vidíme, s nárastom koeficientu dôvery, kritická hodnota štandardnej normálnej distribúcie sa tiež zvyšuje, a preto počiatočné a koncové body intervalu sú umiestnené ďalej od priemeru, a teda dôveryhodného intervalu pre matematické očakávania.

Moderná hmotnosť a interval

Podiel niektorých značiek vzorky je možné interpretovať ako bodový odhad špecifickej hmotnosti. p. \\ t Rovnaká vlastnosť vo všeobecnej populácii. Ak musí byť tento rozsah spojený s pravdepodobnosťou, mal by sa vypočítať interval dôvery špecifickej hmotnosti. p. \\ t Symptóm vo všeobecnej populácii s pravdepodobnosťou P. \\ t = 1 - α :

.

Príklad 4. V niektorých mestách dvaja kandidáti A. a B. nárok na miesto starostu. Náhodne skúmali 200 obyvateľov mesta, z toho 46% odpovedalo, že budú hlasovať za kandidáta A.26% - pre kandidáta B. A 28% nevie, kto bude hlasovať. Určiť interval spoľahlivosti 95% pre špecifickú hmotnosť obyvateľov mesta podporujúce kandidát A..

Ak chcete začať, pripomíname nasledujúcu definíciu:

Považujeme túto situáciu. Nechajte všeobecné možnosti populácie mať normálnu distribúciu s matematickými očakávaniami $ A $ a priemernej kvadratickej odchýlky $ $ SIGMA $. Selektívny priemer v tomto prípade sa bude považovať za náhodnú hodnotu. Keď je hodnota $ x $ distribuovaná normálne, selektívny priemer bude mať tiež normálnu distribúciu s parametrami

Nájdeme interval spoľahlivosti, ktorý pokrýva hodnotu $ A $ so spoľahlivosťou $ gamma $.

Na to potrebujeme rovnosť

Z toho dostaneme

Odtiaľ môžeme ľahko nájsť $ t $ podľa tabuľkových hodnôt funkcie $ F, vľavo (t vpravo) $ a v dôsledku toho nájdite $ delta $.

Pripomeňme si tabuľku hodnôt funkcie $ f, vľavo (t vpravo) $:

Obrázok 1. Tabuľka hodnôt funkcie $ f, vľavo (t vpravo). $

Trust Integral na hodnotenie matematických očakávaní s neznámym $ (MathBF Sigma) $

V tomto prípade budeme používať hodnotu opravenej disperzie $ s ^ 2 $. Výmena $ SIGMA $ $ S $ receptúra \u200b\u200bvo vyššie uvedenom za $ $, dostaneme:

Príklad Úlohu na nájdenie intervalu spoľahlivosti

Príklad 1.

Nechajte hodnotu $ x $, má normálnu distribúciu s disperziou $ SIGMA \u003d $ 4. Nechajte odberný objem $ n \u003d $ 64, a spoľahlivosť je $ gamma \u003d 0,95 $. Nájdite interval spoľahlivosti na posúdenie matematického očakávania tejto distribúcie.

Musíme nájsť interval ($ overline (x) - delta, overline (x) + delta) $.

Ako sme videli vyššie

\\ _ \\ T

Parameter $ T $ Zistiť zo vzorca

[F, vľavo (t vpravo) \u003d frac (gamma) (2) \u003d frac (0,95) (2) \u003d 0,475]

Z tabuľky 1 dostaneme, že $ t \u003d $ 1,96.



chyba:Obsah je chránený!