Válassza az Oldal lehetőséget

Konfidenciaintervallum egy ismert varianciájú normális eloszlás matematikai elvárására. Konfidenciaintervallum az átlag becsléséhez (a variancia ismert) MS EXCEL-ben

Legyen CB X egy általános sokaság, és legyen β az ismeretlen paraméter CB X. Ha a *-ban megadott statisztikai becslés konzisztens, akkor minél nagyobb a mintaméret, annál pontosabban kapjuk meg a β értékét. A gyakorlatban azonban nincsenek túl nagy mintáink, így nagyobb pontosságot nem tudunk garantálni.

Legyen b* statisztikai becslés c-re. Érték |in* - in| becslési pontosságnak nevezzük. Nyilvánvaló, hogy a pontosság CB, mivel β* egy valószínűségi változó. Adjunk meg egy kis pozitív számot 8, és követeljük meg, hogy a becslés pontossága |в* - в| kevesebb volt, mint 8, azaz | in* - in |< 8.

A g megbízhatóság vagy egy becslés megbízhatósági valószínűsége *-ban az a g valószínűsége, amellyel a |in * - in|< 8, т. е.

Általában a g megbízhatóságot előre megadják, és g-t egy 1-hez közeli számnak tekintik (0,9; 0,95; 0,99; ...).

Mivel az egyenlőtlenség |in * - in|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Az intervallumot (* - 8-ban, * + 5-ben) konfidenciaintervallumnak nevezzük, azaz. konfidencia intervallum y valószínűséggel fedi le az ismeretlen paramétert. Vegye figyelembe, hogy a konfidenciaintervallum végei véletlenszerűek, és mintánként változnak, így pontosabb azt mondani, hogy az intervallum (* - 8-ban, * + 8-ban) lefedi az ismeretlen paramétert in, nem pedig ebbe tartozik. intervallum.

Hadd lakosság egy X valószínűségi változóval adjuk meg, normális törvény szerint eloszolva, és ismert az a szórása. Ismeretlen az matematikai elvárás a = M(X). Meg kell találni a konfidencia intervallumot egy adott y megbízhatósághoz.

Mintaátlag

van statisztikai értékelés ha xg = a.

Tétel. Véletlen változó xB-nek van normál eloszlás, ha X normális eloszlású, és M (XB) = a,

A (XB) = a, ahol a = y/B (X), a = M (X). l/i

Az a konfidenciaintervallumának alakja a következő:

8-at találunk.

Az arány használata

ahol Ф(r) a Laplace-függvény, van:

P ( | XB - a |<8} = 2Ф

A Laplace-függvény értéktáblázatában megtaláljuk a t értékét.

Miután kijelölte

T, kapjuk F(t) = g Mivel g adott, akkor által

Az egyenlőségből azt találjuk, hogy a becslés pontos.

Ez azt jelenti, hogy a konfidenciaintervallumának alakja a következő:

Adott egy minta az X sokaságból

ng ide" X2 Xm
n. n1 n2 nm

n = U1 + ... + nm, akkor a konfidenciaintervallum a következő lesz:

6.35. példa. Határozza meg a normális eloszlás a matematikai elvárásának becsléséhez szükséges konfidenciaintervallumot 0,95-ös megbízhatósággal, ismerve a mintaátlagot Xb = 10,43, mintanagyságot n = 100 és szórást s = 5!

Használjuk a képletet

A többiek pedig mind elméleti analógjaik becslései, amelyeket meg lehetne szerezni, ha nem egy minta, hanem egy általános sokaság állna rendelkezésre. De sajnos az általános lakosság nagyon drága és gyakran elérhetetlen.

Az intervallumbecslés fogalma

Minden mintabecslésnek van némi szórása, mert egy valószínűségi változó, amely egy adott mintában lévő értékektől függ. Ezért a megbízhatóbb statisztikai következtetések érdekében nem csak a pontbecslést kell ismerni, hanem az intervallumot is, ami nagy valószínűséggel γ (gamma) takarja a kiértékelt mutatót θ (théta).

Formálisan ez két ilyen érték (statisztika) T 1 (X)És T 2 (X), Mi T 1< T 2 , amelyre adott valószínűségi szinten γ a feltétel teljesül:

Röviden: valószínű γ vagy több az igazi mutató a pontok között van T 1 (X)És T 2 (X), amelyeket alsó és felső határnak nevezünk konfidencia intervallum.

A konfidenciaintervallumok felépítésének egyik feltétele annak maximális szűksége, pl. a lehető legrövidebbnek kell lennie. A vágy egészen természetes, mert... a kutató igyekszik pontosabban lokalizálni a kívánt paraméter helyét.

Ebből következik, hogy a konfidenciaintervallumnak le kell fednie az eloszlás maximális valószínűségét. és magának az értékelésnek kell a középpontban lennie.

Vagyis a valós mutatónak a becsléstől való eltérésének valószínűsége felfelé egyenlő a lefelé való eltérés valószínűségével. Azt is meg kell jegyezni, hogy aszimmetrikus eloszlások esetén a jobb oldali intervallum nem egyenlő a bal oldali intervallummal.

A fenti ábra egyértelműen mutatja, hogy minél nagyobb a megbízhatósági valószínűség, annál szélesebb az intervallum - közvetlen kapcsolat.

Ez egy rövid bevezetés volt az ismeretlen paraméterek intervallumbecslésének elméletébe. Térjünk át a matematikai elvárás megbízhatósági határainak megtalálására.

Konfidenciaintervallum a matematikai elvárásokhoz

Ha az eredeti adatok el vannak osztva, akkor az átlag normál érték lesz. Ez abból a szabályból következik, hogy a normálértékek lineáris kombinációjának normális eloszlása ​​is van. Ezért a valószínűségek kiszámításához használhatjuk a normális eloszlási törvény matematikai apparátusát.

Ehhez azonban két paraméter ismeretére lesz szükség – a várakozásra és a szórásra, amelyek általában ismeretlenek. Természetesen használhatunk paraméterek helyett becsléseket (számtani átlag és ), de ekkor az átlag eloszlása ​​nem lesz teljesen normális, kissé lefelé laposodik. Ezt a tényt okosan feljegyezte William Gosset ír állampolgár, felfedezését a Biometrica folyóirat 1908. márciusi számában publikálva. Gosset titoktartási okokból hallgatónak nevezte magát. Így jelent meg a Student t-eloszlás.

A K. Gauss által a csillagászati ​​megfigyelések hibáinak elemzéséhez használt adatok normál eloszlása ​​azonban rendkívül ritka a földi életben, és meglehetősen nehéz megállapítani (a nagy pontossághoz körülbelül 2 ezer megfigyelés szükséges). Ezért a legjobb, ha elvetjük a normalitás feltételezését, és olyan módszereket alkalmazunk, amelyek nem függnek az eredeti adatok eloszlásától.

Felmerül a kérdés: mi a számtani közép eloszlása, ha ismeretlen eloszlás adataiból számítjuk? A választ a valószínűségszámításban jól ismertek adják Központi határérték tétel(CPT). A matematikában ennek több változata is létezik (a megfogalmazásokat az évek során finomították), de ezek mindegyike durván szólva arra a megállapításra vezet, hogy nagyszámú független valószínűségi változó összege engedelmeskedik egy normális eloszlási törvénynek.

A számtani átlag kiszámításakor a valószínűségi változók összegét használjuk. Innen kiderül, hogy a számtani középnek normális eloszlása ​​van, amelyben a várakozás az eredeti adat elvárása, a variancia pedig .

Az okos emberek tudják, hogyan kell bizonyítani a CLT-t, de mi ezt egy Excelben végzett kísérlet segítségével ellenőrizzük. Szimuláljunk egy 50 egyenletes eloszlású valószínűségi változóból álló mintát (az Excel RANDBETWEEN függvényével). Ezután készítünk 1000 ilyen mintát, és mindegyikre kiszámítjuk a számtani átlagot. Nézzük a megoszlásukat.

Látható, hogy az átlag eloszlása ​​közel áll a normál törvényhez. Ha a minta méretét és számát még nagyobbra tesszük, a hasonlóság még jobb lesz.

Most, hogy a saját szemünkkel láttuk a CLT érvényességét, a számtani átlaghoz kiszámíthatunk konfidencia intervallumokat, amelyek adott valószínűséggel fedik le a valós átlagot vagy a matematikai elvárást.

A felső és alsó határ megállapításához ismerni kell a normál eloszlás paramétereit. Általában nincsenek ilyenek, ezért becsléseket használnak: számtani átlagÉs minta variancia. Ismétlem, ez a módszer csak nagy minták esetén ad jó közelítést. Ha a minták kicsik, gyakran javasolt a Student eloszlás használata. Ne hidd el! Az átlag Student-eloszlása ​​csak akkor fordul elő, ha az eredeti adat normális eloszlású, vagyis szinte soha. Ezért jobb, ha azonnal minimális korlátot szabunk a szükséges adatok mennyiségére, és aszimptotikusan helyes módszereket alkalmazunk. Azt mondják, 30 megfigyelés elég. Vegyél 50-et – nem fogsz rosszul esni.

T 1.2– a konfidencia intervallum alsó és felső határa

– minta számtani átlag

s 0– a minta szórása (elfogulatlan)

n – mintanagyság

γ – megbízhatósági valószínűség (általában 0,9, 0,95 vagy 0,99)

c γ =Φ -1 ((1+γ)/2)– a standard normális eloszlásfüggvény inverz értéke. Egyszerűen fogalmazva, ez a standard hibák száma az aritmetikai átlagtól az alsó vagy felső határig (ez a három valószínűség 1,64, 1,96 és 2,58 értékeknek felel meg).

A képlet lényege, hogy a számtani középértéket veszik, majd egy bizonyos összeget ( γ-val) standard hibák ( s 0 /√n). Minden ismert, vedd és fontold meg.

A személyi számítógépek széles körű használata előtt a normál eloszlási függvény és annak inverze értékeit kapták meg. Ma is használatosak, de hatékonyabb a kész Excel képletek használata. A fenti képlet összes eleme ( , és ) könnyen kiszámítható Excelben. De van egy kész képlet a konfidenciaintervallum kiszámításához - BIZALOM.NORM. A szintaxisa a következő.

CONFIDENCE.NORM(alfa;standard_off;méret)

alfa– szignifikanciaszint vagy konfidenciaszint, amely a fentebb elfogadott jelölésben egyenlő 1- γ-val, azaz. annak a valószínűsége, hogy a matematikaia várakozás a konfidenciaintervallumon kívül lesz. 0,95-ös megbízhatósági szint mellett az alfa 0,05 stb.

standard_off– a mintaadatok szórása. Nem kell kiszámítani a standard hibát, maga az Excel osztja az n gyökével.

méret– mintanagyság (n).

A CONFIDENCE NORM függvény eredménye a konfidenciaintervallum számítási képletének második tagja, azaz. fél intervallum Ennek megfelelően az alsó és felső pont az átlag ± a kapott érték.

Így lehetséges egy univerzális algoritmus felépítése az aritmetikai átlag konfidenciaintervallumainak kiszámítására, amely nem függ az eredeti adatok eloszlásától. Az univerzalitás ára aszimptotikus volta, azaz. viszonylag nagy minták használatának szükségessége. A modern technika korában azonban a szükséges adatmennyiség összegyűjtése általában nem nehéz.

Statisztikai hipotézisek tesztelése konfidenciaintervallumokkal

(111. modul)

A statisztika egyik fő megoldandó problémája az. Lényege röviden a következő. Feltételezzük például, hogy az általános népesség elvárása valamilyen értékkel egyenlő. Ezután megszerkesztjük az adott elvárásnál megfigyelhető mintaátlagok eloszlását. Ezután azt vizsgálják, hogy ebben a feltételes eloszlásban hol található a valós átlag. Ha túllépi a megengedett határokat, akkor egy ilyen átlag megjelenése nagyon valószínűtlen, és a kísérlet egyszeri megismétlésével szinte lehetetlen, ami ellentmond a feltett hipotézisnek, amelyet sikeresen elvetettek. Ha az átlag nem lépi túl a kritikus szintet, akkor a hipotézist nem utasítják el (de nem is igazolják!).

Tehát a konfidenciaintervallumok segítségével, esetünkben a várakozásra, néhány hipotézist is tesztelhet. Nagyon könnyű megtenni. Tegyük fel, hogy egy bizonyos minta számtani átlaga 100. Azt a hipotézist teszteljük, hogy a várható érték mondjuk 90. ​​Vagyis ha primitíven tesszük fel a kérdést, akkor ez így hangzik: lehet, hogy az igaz 90-nel egyenlő átlagérték, a megfigyelt átlag 100-nak bizonyult?

A kérdés megválaszolásához további információkra lesz szüksége a szórással és a minta méretével kapcsolatban. Tegyük fel, hogy a szórása 30, a megfigyelések száma pedig 64 (a gyökér egyszerű kivonásához). Ekkor az átlag standard hibája 30/8 vagy 3,75. A 95%-os konfidenciaintervallum kiszámításához két standard hibát kell hozzáadnia az átlag mindkét oldalához (pontosabban 1,96). A konfidenciaintervallum körülbelül 100±7,5 vagy 92,5 és 107,5 között lesz.

A további érvelés a következő. Ha a vizsgált érték a konfidenciaintervallumba esik, akkor az nem mond ellent a hipotézisnek, mert véletlenszerű ingadozások határai közé esik (95%-os valószínűséggel). Ha az ellenőrzött pont a konfidenciaintervallumon kívül esik, akkor egy ilyen esemény valószínűsége nagyon kicsi, minden esetben az elfogadható szint alatt van. Ez azt jelenti, hogy a hipotézist elvetjük, mivel ellentmond a megfigyelt adatoknak. Esetünkben a várható értékre vonatkozó hipotézis a konfidencia intervallumon kívül esik (a 90-es tesztelt érték nem szerepel a 100±7,5 intervallumban), ezért el kell vetni. A fenti primitív kérdésre válaszolva azt kell mondani: nem, nem, mindenesetre ez rendkívül ritkán fordul elő. Gyakran a hipotézis téves elutasításának konkrét valószínűségét (p-szint) jelzik, és nem azt a meghatározott szintet, amelyen a konfidenciaintervallumot felállították, hanem erről egy másik alkalommal.

Amint láthatja, az átlag (vagy matematikai elvárás) konfidenciaintervallumának megalkotása nem nehéz. A lényeg az, hogy felfogd a lényeget, és akkor mennek tovább a dolgok. A gyakorlatban a legtöbb esetben 95%-os konfidencia intervallumot használnak, ami körülbelül két standard hiba széles az átlag mindkét oldalán.

Egyelőre ennyi. Minden jót!

MATEMATIKAI VÁRÁSHOZ BIZTOSÍTÁSI INTERVALLUM

1. Legyen tudatában annak sl. az x mennyiség engedelmeskedik a normáltörvénynek ismeretlen μ átlaggal és ismert σ 2: X~N(μ,σ 2), σ 2 adott, μ ismeretlen. β van megadva. Az x 1, x 2, … , x n minta alapján meg kell alkotni I β (θ) (most θ=μ), teljesül (13)

A mintaátlag (más néven mintaátlag) ugyanazzal a μ középponttal, de kisebb eltéréssel X~N (μ, D) engedelmeskedik a normáltörvénynek, ahol D =σ 2 =σ 2 /n variancia.

Szükségünk lesz a K β számra, amelyet ξ~N(0,1) a feltétel határozza meg

Szavakkal kifejezve: az abszcissza tengely -K β és K β pontjai között található a szabványos normáltörvény sűrűséggörbéje alatti terület, egyenlő β-val.

Például, K 0,90 = 1,645 kvantilis a ξ érték 0,95 szintjének

K 0,95 = 1,96. ; K 0,997 =3.

Konkrétan, ha bármely normál törvény középpontjától 1,96 szórást félreteszünk jobbra és ugyanennyit balra, a sűrűséggörbe alatti területet rögzítjük 0,95-tel, ami miatt K 0 95 a 0,95-ös szint kvantiliseje. + 1/2 * 0,005 = 0,975 ennél a törvénynél.

A μ általános átlaghoz szükséges konfidencia intervallum: I A (μ) = (x-σ, x+σ),

ahol δ = (15)

Adjunk indoklást:

Az elmondottak szerint szavak. az érték a J=μ±σ intervallumba esik β valószínűséggel (9. ábra). Ebben az esetben a mennyiség μ középponttól δ-nál kisebb mértékben tér el, és a véletlen intervallumtól ± δ (véletlenszerű középponttal és J-vel azonos szélességgel) lefedi a μ pontot. Azaz Є J<=> μ Є Iβ,és ezért Р(μЄІ β) = Р(Є J)=β.

Tehát a mintán konstans I β intervallum a μ átlagot tartalmazza β valószínűséggel.

Nyilvánvaló, hogy minél nagyobb n, annál kisebb σ és az intervallum szűkebb, és minél nagyobbra vesszük a β garanciát, annál szélesebb a konfidenciaintervallum.

21. példa.

Egy n=16-os minta alapján ismert σ 2 =64 variancia mellett x=200-at találtunk. Szerkesszünk konfidenciaintervallumot az általános átlaghoz (más szóval a matematikai elváráshoz) μ, β=0,95-tel.

Megoldás. I β (μ)= ± δ, ahol δ = K β σ/ -> K β σ/ =1,96*8/ = 4

I 0,95 (μ)=200 4=(196;204).

Abból a következtetésből, hogy β=0,95 garanciával a valódi átlag a (196,204) intervallumhoz tartozik, megértjük, hogy hiba lehetséges.

100 konfidenciaintervallumból I 0,95 (μ), átlagosan 5 nem tartalmaz μ-t.

22. példa.

Az előző 21. példa körülményei között mit kell venni a konfidenciaintervallum felére csökkentéséhez? Ahhoz, hogy 2δ=4 legyen, fel kell vennünk

A gyakorlatban gyakran alkalmaznak egyoldalú konfidencia intervallumokat. Így, ha a nagy μ értékek hasznosak vagy nem károsak, de az alacsony értékek kellemetlenek, mint például a szilárdság vagy a megbízhatóság esetében, akkor indokolt egy egyoldalú intervallum felépítése. Ehhez meg kell emelni a felső határát, amennyire csak lehetséges. Ha a 21. példához hasonlóan megszerkesztünk egy kétoldali konfidencia intervallumot egy adott β-ra, majd az egyik határ rovására a lehető legnagyobbra kibővítjük, akkor egy egyoldalú intervallumot kapunk nagyobb garanciával β" = β + (1-β) / 2 = (1+ β)/2, például, ha β = 0,90, akkor β = 0,90 + 0,10/2 = 0,95.

Például feltételezzük, hogy a szorzat erősségéről beszélünk, és az intervallum felső határát emeljük értékre. Ekkor a 21. példában μ-re egy egyoldalú konfidencia intervallumot (196,°°) kapunk, amelynek alsó határa 196, és a konfidencia valószínűsége β"=0,95+0,05/2=0,975.

A (15) képlet gyakorlati hátránya, hogy abból a feltételezésből származik, hogy a variancia = σ 2 (tehát = σ 2 /n) ismert; és ez ritkán fordul elő az életben. Kivételt képez az az eset, amikor a minta mérete nagy, mondjuk n-t százban vagy ezerben mérik, és akkor σ 2-re gyakorlatilag s 2 vagy becslést vehetünk.

23. példa.

Tételezzük fel, hogy egy nagyvárosban a lakosok életkörülményeinek mintavételes felmérése eredményeként az alábbi adattáblázatot kaptuk (munkahelyi példa).

8. táblázat

Például a forrásadatok

Természetes ezt feltételezni az X érték a teljes (hasznos) terület (m2-ben) egy főre, és megfelel a normál törvénynek. Az átlag μ és a variancia σ 2 ismeretlen. μ esetén 95%-os konfidencia intervallumot kell alkotni. A mintaátlagok és szórásnégyzetek csoportosított adatok alapján történő megtalálásához a következő számítási táblázatot állítjuk össze (9. táblázat).

9. táblázat

X és 5 kiszámítása csoportosított adatokból

N csoport 3 Teljes terület egy főre, m2 Az r j csoport lakosainak száma Az x j intervallum felezőpontja r j x j rjxj 2
5.0-ig 2.5 20.0 50.0
5.0-10.0 7.5 712.5 5343.75
10.0-15.0 12.5 2550.0 31875.0
15.0-20.0 17.5 4725.0 82687.5
20.0-25.0 22.5 4725.0 106312.5
25.0-30.0 27.5 3575.0 98312.5
több mint 30,0 32.5 * 2697.5 87668.75
- 19005.0 412250.0

Ebben a segédtáblázatban az első és a második kezdeti statisztikai momentumot a (2) képlet segítségével számítjuk ki. egy 1És A 2

Bár a σ 2 variancia itt ismeretlen, a nagy mintaszám miatt gyakorlatilag alkalmazhatjuk a (15) képletet, σ = = 7,16-ot betéve.

Ekkor δ=k 0,95 σ/ =1,96*7,16/ =0,46.

A konfidenciaintervallum az általános átlaghoz β=0,95 esetén egyenlő: I 0,95 (μ) = ± δ = 19 ± 0,46 = (18,54; 19,46).

Ebből következően az egy főre jutó terület átlagos értéke egy adott városban 0,95-ös garanciával a (18,54; 19,46) intervallumban található.



2. A μ matematikai elvárás konfidencia intervalluma a normálérték σ 2 ismeretlen varianciája esetén.

(16)

Ezt az intervallumot egy adott β garanciához a következő képlet szerint állítjuk össze, ahol ν = n-1,

.

A t β,ν együttható jelentése a ν szabadságfokú t eloszlásra ugyanaz, mint β az N(0,1) eloszlásra, nevezetesen:

Más szóval, sl. A tν érték a (-t β,ν ; +t β,ν) intervallumba esik β valószínűséggel. A t β,ν értékeit a 10. táblázat tartalmazza β=0,95 és β=0,99 esetén.

10. táblázat.

Értékek t β,ν

Visszatérve a 23. példához, azt látjuk, hogy abban a konfidenciaintervallumot a (16) képlet szerint állítottuk össze t β,υ =k 0..95 =1.96 együtthatóval, mivel n=1000. - ez egy olyan adatokból számított intervallum, amely ismert valószínűséggel tartalmazza a teljes sokaság matematikai elvárását. A matematikai elvárás természetes becslése a megfigyelt értékeinek számtani átlaga. Ezért a leckében az „átlag” és az „átlagérték” kifejezéseket fogjuk használni. A konfidenciaintervallum kiszámításának problémáinál a leggyakrabban a következő válaszra van szükség: „Az átlag [érték egy adott problémában] konfidenciaintervalluma [kisebb érték] és [nagyobb érték] között van. A konfidenciaintervallum segítségével nemcsak az átlagértékeket, hanem az általános sokaság egy adott jellemzőjének fajsúlyát is értékelheti. A leckében az átlagértékeket, a szórást, a szórást és a hibát tárgyaljuk, amelyek révén új definíciókhoz és képletekhez jutunk. A minta és a sokaság jellemzői .

Az átlag pont- és intervallumbecslései

Ha a sokaság átlagértékét egy számmal (ponttal) becsüljük meg, akkor a megfigyelések mintájából számolt fajlagos átlagot veszünk a sokaság ismeretlen átlagértékének becsléseként. Ebben az esetben a mintaátlag értéke - egy valószínűségi változó - nem esik egybe az általános sokaság átlagértékével. Ezért a mintaátlag megadásakor egyidejűleg a mintavételi hibát is jelezni kell. A mintavételi hiba mértéke a standard hiba, amelyet az átlaggal azonos mértékegységekben adnak meg. Ezért gyakran használják a következő jelölést: .

Ha az átlag becslését egy bizonyos valószínűséggel kell társítani, akkor a sokaságban érdekelt paramétert nem egy számmal, hanem egy intervallumgal kell értékelni. A konfidenciaintervallum egy olyan intervallum, amelyben bizonyos valószínűséggel P a becsült népességmutató értéke található. Konfidenciaintervallum, amelyben valószínű P = 1 - α a valószínűségi változót a következőképpen számítjuk ki:

,

α = 1 - P, amely szinte minden statisztikai témájú könyv mellékletében megtalálható.

A gyakorlatban a sokaság átlaga és variancia nem ismert, ezért a sokaság szórását a minta szórása, a sokaság átlagát pedig a minta átlaga helyettesíti. Így a legtöbb esetben a konfidencia intervallumot a következőképpen számítják ki:

.

A konfidenciaintervallum képlete használható a sokaság átlagának becslésére, ha

  • ismert a sokaság szórása;
  • vagy a sokaság szórása nem ismert, de a minta mérete nagyobb, mint 30.

A minta átlaga a sokaság átlagának elfogulatlan becslése. Viszont a minta szórása nem a populáció varianciájának elfogulatlan becslése. A minta varianciaképletében a sokaság szórásának elfogulatlan becsléséhez a minta mérete n-re kell cserélni n-1.

1. példa Egy város 100 véletlenszerűen kiválasztott kávézójából gyűjtöttük azt az információt, hogy bennük az alkalmazottak átlagos létszáma 10,5 fő, 4,6-os szórással. Határozza meg a 95%-os konfidencia intervallumot a kávézói alkalmazottak számához.

ahol a szignifikanciaszint standard normális eloszlásának kritikus értéke α = 0,05 .

Így a 95%-os konfidenciaintervallum a kávézók átlagos létszámára vonatkozóan 9,6 és 11,4 között mozgott.

2. példa A 64 megfigyelésből álló véletlenszerű minta alapján a következő összértékeket számítottuk ki:

értékek összege a megfigyelésekben,

az értékek átlagtól való eltéréseinek négyzetes összege .

Számítsa ki a matematikai elvárás 95%-os konfidencia intervallumát!

Számítsuk ki a szórást:

,

Számítsuk ki az átlagértéket:

.

Az értékeket behelyettesítjük a konfidencia intervallum kifejezésébe:

ahol a szignifikanciaszint standard normális eloszlásának kritikus értéke α = 0,05 .

Kapunk:

Így ennek a mintának a matematikai várakozásának 95%-os konfidencia intervalluma 7,484 és 11,266 között volt.

3. példa 100 megfigyelésből álló véletlenszerű populációs minta esetén a számított átlag 15,2, a szórás pedig 3,2. Számítsa ki a várható érték 95%-os, majd a 99%-os konfidencia intervallumát. Ha a minta teljesítménye és variációja változatlan marad, és a konfidencia együttható növekszik, szűkül vagy szélesedik a konfidenciaintervallum?

Ezeket az értékeket behelyettesítjük a konfidenciaintervallum kifejezésébe:

ahol a szignifikanciaszint standard normális eloszlásának kritikus értéke α = 0,05 .

Kapunk:

.

Így ennek a mintának a 95%-os konfidencia intervalluma 14,57 és 15,82 között volt.

Ezeket az értékeket ismét behelyettesítjük a konfidenciaintervallum kifejezésébe:

ahol a szignifikanciaszint standard normális eloszlásának kritikus értéke α = 0,01 .

Kapunk:

.

Így ennek a mintának a 99%-os konfidencia intervalluma 14,37 és 16,02 között volt.

Amint látjuk, a konfidencia együttható növekedésével a standard normális eloszlás kritikus értéke is növekszik, és ennek következtében az intervallum kezdő- és végpontja távolabb helyezkedik el az átlagtól, így a matematikai elvárás konfidencia intervalluma nő. .

A fajsúly ​​pont- és intervallumbecslése

Valamelyik mintaattribútum részesedése a részesedés pontbecsléseként értelmezhető p ugyanaz a jellemző az általános populációban. Ha ezt az értéket valószínűséggel kell társítani, akkor a fajsúly ​​konfidencia intervallumát kell kiszámítani p valószínűséggel jellemző a populációban P = 1 - α :

.

4. példa Egyes városokban két jelölt van AÉs B indul a polgármesteri tisztségért. Véletlenszerűen 200 városlakót kérdeztek meg, akiknek 46%-a azt válaszolta, hogy a jelöltre szavazna A, 26% - a jelöltnek B 28% pedig nem tudja, kire fog szavazni. Határozza meg a jelöltet támogató városlakók arányának 95%-os konfidencia intervallumát! A.

Kezdésként emlékezzen a következő definícióra:

Tekintsük a következő helyzetet. Legyen a sokaságváltozatok normális eloszlású, $a$ matematikai elvárással és $\sigma$ szórással. A mintaátlagot ebben az esetben valószínűségi változónak tekintjük. Ha az $X$ mennyiség normális eloszlású, a minta átlaga is normálisan eloszlik a paraméterekkel

Keressünk egy konfidencia intervallumot, amely lefedi az $a$ értéket $\gamma $ megbízhatósággal.

Ehhez egyenlőségre van szükség

Abból kapunk

Innen könnyen megtaláljuk a $t$-t a $Ф\left(t\right)$ függvényértékek táblázatából, és ennek következtében megtaláljuk a $\delta $-t.

Emlékezzünk vissza a $Ф\left(t\right)$ függvény értéktáblázatára:

1. ábra: A függvényértékek táblázata:$Ф\left(t\right).$

Konfidencia integrál egy ismeretlen $(\mathbf \sigma )$ matematikai elvárás becsléséhez

Ebben az esetben a korrigált $S^2$ varianciaértéket fogjuk használni. Ha a fenti képletben a $\sigma $-t $S$-ra cseréljük, a következőt kapjuk:

Példaproblémák konfidenciaintervallum megtalálásához

1. példa

Legyen az $X$ mennyiség normális eloszlású, $\sigma =4$ szórással. Legyen a minta mérete $n=64$, a megbízhatóság pedig $\gamma =0.95$. Keresse meg az eloszlás matematikai elvárásának becsléséhez szükséges konfidencia intervallumot.

Meg kell találnunk az intervallumot ($\overline(x)-\delta ,\overline(x)+\delta)$.

Ahogy fentebb láttuk

\[\delta =\frac(\sigma t)(\sqrt(n))=\frac(4t)(\sqrt(64))=\frac(\t)(2)\]

A képletből a $t$ paraméter található

\[Ф\left(t\right)=\frac(\gamma )(2)=\frac(0,95)(2)=0,475\]

Az 1. táblázatból azt találjuk, hogy $t=1,96$.





hiba: A tartalom védett!!