Interval de încredere pentru așteptarea matematică a unei distribuții normale cu o varianță cunoscută. Interval de încredere pentru estimarea mediei (varianța este cunoscută) în MS EXCEL

Fie CB X să formeze populația generală și β să fie un parametru necunoscut CB X. Dacă estimarea statistică în * este consecventă, atunci cu cât dimensiunea eșantionului este mai mare, cu atât valoarea lui β este mai precisă. Cu toate acestea, în practică, nu avem mostre foarte mari, așa că nu putem garanta o precizie mai mare.

Fie s* o estimare statistică pentru s. Cantitate |in* - in| se numește acuratețea estimării. Este clar că precizia este CB, deoarece s* este o variabilă aleatorie. Să stabilim un mic număr pozitiv 8 și să cerem ca acuratețea estimării |in* - in| a fost mai mică de 8, adică | în* - în |< 8.

Fiabilitatea g or nivel de încredere estimarea in cu in * este probabilitatea g cu care inegalitatea |in * - in|< 8, т. е.

De obicei, fiabilitatea lui g este stabilită în avans și, pentru g, ele iau un număr apropiat de 1 (0,9; 0,95; 0,99; ...).

Deoarece inegalitatea |în * - în|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Intervalul (în * - 8, în * + 5) se numește interval de încredere, adică. interval de încredere acoperă parametrul necunoscut în cu probabilitatea y. Rețineți că capetele intervalului de încredere sunt aleatorii și variază de la un eșantion la altul, deci este mai corect să spunem că intervalul (la * - 8, la * + 8) acoperă parametrul necunoscut β, mai degrabă decât β aparține acestui interval. .

Lăsa populatia este dată de o variabilă aleatoare X, distribuită conform legii normale, în plus, abaterea standard a este cunoscută. Necunoscut este valorea estimata a = M(X). Este necesar să se găsească un interval de încredere pentru a pentru o anumită fiabilitate y.

Eșantion mediu

este evaluare statistică pentru xr = a.

Teorema. Valoare aleatoare xB are distributie normala dacă X are o distribuție normală și M(XB) = a,

A (XB) \u003d a, unde a \u003d y / B (X), a \u003d M (X). l/i

Intervalul de încredere pentru a are forma:

Găsim 8.

Folosind raportul

unde Ф(г) este funcția Laplace, avem:

P ( | XB - a |<8} = 2Ф

Găsim valoarea lui t în tabelul de valori al funcției Laplace.

Denotand

T, obținem F(t) = g

Din egalitatea Găsiți - acuratețea estimării.

Deci intervalul de încredere pentru a are forma:

Dacă este dat un eșantion din populația generală X

ng La" X2 xm
n. n1 n2 nm

n = U1 + ... + nm, atunci intervalul de încredere va fi:

Exemplul 6.35. Găsiți intervalul de încredere pentru estimarea așteptării a unei distribuții normale cu o fiabilitate de 0,95, cunoscând media eșantionului Xb = 10,43, dimensiunea eșantionului n = 100 și abaterea standard s = 5.

Să folosim formula

Și altele.Toate sunt estimări ale omologilor lor teoretici, care ar putea fi obținute dacă nu ar exista un eșantion, ci populația generală. Dar, din păcate, populația generală este foarte scumpă și adesea indisponibilă.

Conceptul de estimare a intervalului

Orice estimare a eșantionului are o oarecare împrăștiere, deoarece este o variabilă aleatorie în funcție de valorile dintr-un anumit eșantion. Prin urmare, pentru inferențe statistice mai fiabile, ar trebui să se cunoască nu numai estimarea punctuală, ci și intervalul, care cu o probabilitate mare γ (gama) acoperă indicatorul estimat θ (theta).

Formal, acestea sunt două astfel de valori (statistici) T1(X)Și T2(X), Ce T1< T 2 , pentru care la un anumit nivel de probabilitate γ condiția este îndeplinită:

Pe scurt, este probabil γ sau mai mult valoarea adevărată este între puncte T1(X)Și T2(X), care sunt numite limite inferioare și superioare interval de încredere.

Una dintre condițiile pentru construirea intervalelor de încredere este îngustimea maximă a acestuia, adică. ar trebui să fie cât mai scurt posibil. Dorința este destul de firească, pentru că. cercetătorul încearcă să localizeze mai precis constatarea parametrului dorit.

Rezultă că intervalul de încredere ar trebui să acopere probabilitățile maxime ale distribuției. iar scorul în sine să fie în centru.

Adică, probabilitatea de abatere (a indicatorului adevărat de la estimare) în sus este egală cu probabilitatea de abatere în jos. De asemenea, trebuie remarcat faptul că, pentru distribuțiile înclinate, intervalul din dreapta nu este egal cu intervalul din stânga.

Figura de mai sus arată clar că cu cât nivelul de încredere este mai mare, cu atât intervalul este mai larg - o relație directă.

Aceasta a fost o mică introducere în teoria estimării pe intervale a parametrilor necunoscuți. Să trecem la găsirea limitelor de încredere pentru așteptarea matematică.

Interval de încredere pentru așteptările matematice

Dacă datele originale sunt distribuite peste , atunci media va fi o valoare normală. Aceasta rezultă din regula că o combinație liniară de valori normale are și o distribuție normală. Prin urmare, pentru a calcula probabilitățile, am putea folosi aparatul matematic al legii distribuției normale.

Cu toate acestea, acest lucru va necesita cunoașterea a doi parametri - valoarea așteptată și varianța, care de obicei nu sunt cunoscute. Desigur, puteți utiliza estimări în loc de parametri (media aritmetică și ), dar atunci distribuția mediei nu va fi destul de normală, va fi ușor aplatizată. Cetățeanul irlandez William Gosset a remarcat inteligent acest fapt când și-a publicat descoperirea în numărul din martie 1908 al revistei Biometrica. Din motive de secret, Gosset a semnat cu Student. Așa a apărut distribuția t a Studentului.

Cu toate acestea, distribuția normală a datelor, folosită de K. Gauss în analiza erorilor în observațiile astronomice, este extrem de rară în viața terestră și este destul de dificil de stabilit acest lucru (pentru o precizie ridicată sunt necesare aproximativ 2 mii de observații). Prin urmare, cel mai bine este să renunțați la ipoteza de normalitate și să utilizați metode care nu depind de distribuția datelor originale.

Se pune întrebarea: care este distribuția mediei aritmetice dacă este calculată din datele unei distribuții necunoscute? Răspunsul este dat de binecunoscuta teoria probabilității Teorema limitei centrale(CPT). În matematică, există mai multe versiuni ale acesteia (formulările au fost rafinate de-a lungul anilor), dar toate, grosier vorbind, se reduc la afirmația că suma unui număr mare de variabile aleatoare independente se supune legii distribuției normale.

La calcularea mediei aritmetice se folosește suma variabilelor aleatoare. Din aceasta rezultă că media aritmetică are o distribuție normală, în care valoarea așteptată este valoarea așteptată a datelor inițiale, iar varianța este .

Oamenii inteligenți știu să demonstreze CLT, dar vom verifica acest lucru cu ajutorul unui experiment realizat în Excel. Să simulăm un eșantion de 50 de variabile aleatoare distribuite uniform (folosind funcția Excel RANDOMBETWEEN). Apoi vom face 1000 de astfel de mostre și vom calcula media aritmetică pentru fiecare. Să ne uităm la distribuția lor.

Se poate observa că distribuția mediei este apropiată de legea normală. Dacă volumul probelor și numărul lor sunt și mai mari, atunci asemănarea va fi și mai bună.

Acum că am văzut singuri validitatea CLT, putem, folosind , calcula intervalele de încredere pentru media aritmetică, care acoperă media adevărată sau așteptarea matematică cu o probabilitate dată.

Pentru a stabili limitele superioare și inferioare, este necesară cunoașterea parametrilor distribuției normale. De regulă, acestea nu sunt, prin urmare, sunt utilizate estimări: medie aritmeticăȘi varianța eșantionului. Din nou, această metodă oferă o aproximare bună numai pentru eșantioane mari. Când eșantioanele sunt mici, se recomandă adesea să folosiți distribuția Student. Nu crede! Distribuția lui Student pentru medie apare numai atunci când datele originale au o distribuție normală, adică aproape niciodată. Prin urmare, este mai bine să setați imediat bara minimă pentru cantitatea de date necesare și să utilizați metode corecte asimptotic. Se spune că 30 de observații sunt suficiente. Luați 50 - nu puteți greși.

T 1.2 sunt limitele inferioare și superioare ale intervalului de încredere

– medie aritmetică eșantionului

s0– abaterea standard a eșantionului (nepărtinitoare)

n - marime de mostra

γ – nivelul de încredere (de obicei egal cu 0,9, 0,95 sau 0,99)

c γ =Φ -1 ((1+γ)/2) este reciproca funcției de distribuție normală standard. În termeni simpli, acesta este numărul de erori standard de la media aritmetică la limita inferioară sau superioară (cele trei probabilități indicate corespund valorilor 1,64, 1,96 și 2,58).

Esența formulei este că se ia media aritmetică și apoi se pune deoparte o anumită sumă ( cu γ) erori standard ( s 0 /√n). Totul se știe, ia-l și numără.

Înainte de utilizarea în masă a PC-urilor, pentru a obține valorile funcției de distribuție normală și inversul acesteia, au folosit . Sunt încă folosite, dar este mai eficient să apelezi la formule Excel gata făcute. Toate elementele din formula de mai sus ( , și ) pot fi calculate cu ușurință în Excel. Dar există și o formulă gata făcută pentru calcularea intervalului de încredere - NORMA DE ÎNCREDERE. Sintaxa sa este următoarea.

NORMĂ DE ÎNCREDERE(alpha, standard_dev, size)

alfa– nivelul de semnificație sau nivelul de încredere, care în notația de mai sus este egal cu 1-γ, i.e. probabilitatea ca matematicaașteptarea va fi în afara intervalului de încredere. Cu un nivel de încredere de 0,95, alfa este 0,05 și așa mai departe.

standard_off este abaterea standard a datelor eșantionului. Nu trebuie să calculați eroarea standard, Excel va împărți la rădăcina lui n.

mărimea– dimensiunea eșantionului (n).

Rezultatul functiei CONFIDENCE.NORM este al doilea termen din formula de calcul a intervalului de incredere, i.e. jumătate de interval. În consecință, punctele inferior și superior sunt media ± valoarea obținută.

Astfel, este posibil să se construiască un algoritm universal pentru calcularea intervalelor de încredere pentru media aritmetică, care nu depinde de distribuția datelor inițiale. Prețul pentru universalitate este natura sa asimptotică, adică. necesitatea folosirii de mostre relativ mari. Cu toate acestea, în era tehnologiei moderne, colectarea cantității potrivite de date nu este de obicei dificilă.

Testarea ipotezelor statistice folosind un interval de încredere

(modulul 111)

Una dintre principalele probleme rezolvate în statistică este. Pe scurt, esența sa este aceasta. Se presupune, de exemplu, că așteptările populației generale sunt egale cu o anumită valoare. Apoi se construiește distribuția mediilor eșantionului, care poate fi observată cu o așteptare dată. În continuare, ne uităm la locul în care se află media reală în această distribuție condiționată. Dacă depășește limitele admise, atunci apariția unei astfel de medii este foarte puțin probabilă, iar cu o singură repetare a experimentului este aproape imposibil, ceea ce contrazice ipoteza propusă, care este respinsă cu succes. Dacă media nu depășește nivelul critic, atunci ipoteza nu este respinsă (dar nici nu se dovedește!).

Deci, cu ajutorul intervalelor de încredere, în cazul nostru pentru așteptare, puteți testa și unele ipoteze. Este foarte ușor de făcut. Să presupunem că media aritmetică pentru un eșantion este 100. Se testează ipoteza că așteptarea este, să zicem, 90. Adică, dacă punem întrebarea în mod primitiv, sună astfel: se poate că, cu adevărata valoare a medie egală cu 90, media observată a fost 100?

Pentru a răspunde la această întrebare, vor fi necesare informații suplimentare despre abaterea standard și dimensiunea eșantionului. Să presupunem că abaterea standard este 30, iar numărul de observații este 64 (pentru a extrage cu ușurință rădăcina). Atunci eroarea standard a mediei este 30/8 sau 3,75. Pentru a calcula intervalul de încredere de 95%, va trebui să lăsați deoparte două erori standard de ambele părți ale mediei (mai precis, 1,96). Intervalul de încredere va fi de aproximativ 100 ± 7,5 sau de la 92,5 la 107,5.

Raționamentul suplimentar este următorul. Dacă valoarea testată se încadrează în intervalul de încredere, atunci nu contrazice ipoteza, deoarece se încadrează în limitele fluctuațiilor aleatorii (cu o probabilitate de 95%). Dacă punctul testat se află în afara intervalului de încredere, atunci probabilitatea unui astfel de eveniment este foarte mică, în orice caz sub nivelul acceptabil. Prin urmare, ipoteza este respinsă ca fiind în contradicție cu datele observate. În cazul nostru, ipoteza așteptărilor se află în afara intervalului de încredere (valoarea testată de 90 nu este inclusă în intervalul de 100±7,5), deci ar trebui respinsă. Răspunzând la întrebarea primitivă de mai sus, ar trebui să spunem: nu, nu se poate, în niciun caz, acest lucru se întâmplă extrem de rar. Adesea, aceasta indică o probabilitate specifică de respingere eronată a ipotezei (p-level), și nu un nivel dat, conform căruia a fost construit intervalul de încredere, ci mai mult de altă dată.

După cum puteți vedea, nu este dificil să construiți un interval de încredere pentru medie (sau așteptări matematice). Principalul lucru este să prindeți esența și apoi lucrurile vor merge. În practică, cei mai mulți folosesc intervalul de încredere de 95%, care are aproximativ două erori standard de fiecare parte a mediei.

Asta este tot pentru acum. Toate cele bune!

INTERVAL DE ÎNCREDERE PENTRU AȘTEPTĂRI

1. Să se știe că sl. mărimea x respectă legea normală cu medie necunoscută μ și cunoscută σ 2: X~N(μ,σ 2), σ 2 este dat, μ nu este cunoscut. Având în vedere β. Pe baza eșantionului x 1, x 2, … , x n, este necesar să se construiască I β (θ) (acum θ=μ) care să satisfacă (13)

Media eșantionului (se spune și media eșantionului) respectă legea normală cu același centru μ, dar o varianță mai mică X~N (μ , D ), unde varianța este D =σ 2 =σ 2 /n.

Avem nevoie de numărul K β definit pentru ξ~N(0,1) prin condiție

Cu cuvinte: între punctele -K β și K β ale axei x se află aria de sub curba de densitate a legii normale standard, egală cu β

De exemplu, K 0,90 \u003d 1,645 cuantilă a nivelului 0,95 al valorii ξ

K 0,95 = 1,96. ; K 0,997 \u003d 3.

În special, lăsând deoparte 1,96 abateri standard la dreapta și aceeași sumă la stânga din centrul oricărei legi normale, vom capta aria de sub curba de densitate egală cu 0,95, datorită căreia K 0 95 este cuantila nivel 0,95 + 1/2 * 0,005 = 0,975 pentru această lege.

Intervalul de încredere dorit pentru media generală μ este I A (μ) = (x-σ, x + σ),

unde δ = (15)

Să justificăm:

Conform celor spuse, valoarea se încadrează în intervalul J=μ±σ cu probabilitate β (Fig. 9). În acest caz, valoarea se abate de la centrul μ mai puțin decât δ, iar intervalul aleator ± δ (cu un centru aleator și aceeași lățime ca J) va acoperi punctul μ. Acesta este Є J<=> μ Є eu β,și prin urmare Р(μЄІ β ) = Р( Є J )=β.

Deci, intervalul eșantion-constant I β conține media μ cu probabilitatea β.

În mod clar, cu cât mai mult n, cu atât mai puțin σ iar intervalul este mai îngust, iar cu cât luăm garanția β mai mare, cu atât intervalul de încredere este mai larg.

Exemplul 21.

Pentru o probă cu n=16 pentru o valoare normală cu o varianță cunoscută σ 2 =64 găsit x=200. Construiți un interval de încredere pentru media generală (cu alte cuvinte, pentru așteptarea matematică) μ, presupunând β=0,95.

Soluţie. I β (μ)= ± δ, unde δ = К β σ/ -> К β σ/ =1,96*8/ = 4

I 0,95 (μ)=200 4=(196;204).

Concluzionând că, cu o garanție de β=0,95, adevărata medie aparține intervalului (196,204), înțelegem că este posibilă o eroare.

Din 100 de intervale de încredere I 0,95 (μ), în medie 5 nu conțin μ.

Exemplul 22.

În condițiile exemplului anterior 21, ce ar trebui luat n pentru a înjumătăți intervalul de încredere? Pentru a avea 2δ=4, trebuie să luăm

În practică, sunt adesea folosite intervale de încredere unilaterale. Deci, dacă valorile mari ale μ sunt utile sau nu sunt groaznice, dar cele scăzute nu sunt plăcute, ca în cazul rezistenței sau fiabilității, atunci este rezonabil să construiți un interval unilateral. Pentru a face acest lucru, ar trebui să ridicați limita superioară cât mai mult posibil. Dacă construim, ca în exemplul 21, un interval de încredere cu două fețe pentru un β dat și apoi îl extindem cât mai mult posibil datorită uneia dintre granițe, atunci obținem un interval unilateral cu o garanție mai mare β" = β + (1-β) / 2 = (1+ β)/2, de exemplu, dacă β = 0,90, atunci β = 0,90 + 0,10/2 = 0,95.

De exemplu, vom presupune că vorbim despre puterea produsului și vom ridica limita superioară a intervalului la . Apoi, pentru μ din exemplul 21, obținem un interval de încredere unilateral (196,°°) cu o limită inferioară de 196 și o probabilitate de încredere β"=0,95+0,05/2=0,975.

Dezavantajul practic al formulei (15) este că este derivată în ipoteza că dispersia = σ 2 (deci = σ 2 /n) este cunoscută; și asta se întâmplă rar în viața reală. Excepția este cazul când dimensiunea eșantionului este mare, să zicem, n este măsurat în sute sau mii, iar atunci pentru σ 2 putem lua practic estimarea s 2 sau .

Exemplul 23.

Să presupunem că, într-un oraș mare, în urma unei anchete prin sondaj a condițiilor de viață ale locuitorilor, s-a obținut următorul tabel de date (exemplu din muncă).

Tabelul 8

Date sursă, de exemplu

Este firesc să presupunem că valoarea X - suprafața totală (utilă) (în m 2) per persoană respectă legea normală. Media μ și varianța σ 2 nu sunt cunoscute. Pentru μ, este necesar să se construiască un interval de încredere de 95%. Pentru a găsi mediile eșantionului și varianța din datele grupate, vom compila următorul tabel de calcule (Tabelul 9).

Tabelul 9

X și 5 calcule pe date grupate

N grupa h Suprafata totala per 1 persoana, m 2 Numărul de locuitori din grupa r j Interval x j r j x j rjxj 2
Până la 5.0 2.5 20.0 50.0
5.0-10.0 7.5 712.5 5343.75
10.0-15.0 12.5 2550.0 31875.0
15.0-20.0 17.5 4725.0 82687.5
20.0-25.0 22.5 4725.0 106312.5
25.0-30.0 27.5 3575.0 98312.5
peste 30,0 32.5 * 2697.5 87668.75
- 19005.0 412250.0

În acest tabel auxiliar, conform formulei (2), se calculează primul și al doilea moment statistic inițial a 1Și A 2

Deși varianța σ 2 este necunoscută aici, datorită dimensiunii mari a eșantionului, formula (15) poate fi aplicată în practică, stabilind σ= =7,16 în ea.

Atunci δ=k 0,95 σ/ =1,96*7,16/ =0,46.

Intervalul de încredere pentru media generală la β=0,95 este I 0,95 (μ) = ± δ = 19 ± 0,46 = (18,54; 19,46).

Prin urmare, valoarea medie a suprafeței per persoană din acest oraș cu garanție de 0,95 se află în interval (18,54; 19,46).



2. Interval de încredere pentru așteptarea matematică μ în cazul unei variații necunoscute σ 2 de valoare normală. Acest interval pentru o garanție dată β este construit conform formulei , unde ν = n-1 ,

(16)

Coeficientul t β,ν are aceeași semnificație pentru distribuția t cu ν grade de libertate, ca și pentru β pentru distribuția N(0,1), și anume:

.

Cu alte cuvinte, sl. Valoarea tν se încadrează în intervalul (-t β,ν ; +t β,ν) cu probabilitate β. Valorile lui t β,ν sunt date în Tabelul 10 pentru β=0,95 și β=0,99.

Tabelul 10

Valorile t β,ν

Revenind la exemplul 23, vedem că intervalul de încredere din acesta a fost construit după formula (16) cu coeficientul t β,υ =k 0..95 =1.96, întrucât n=1000.

Interval de încredere pentru așteptările matematice - acesta este un astfel de interval calculat din date, care cu o probabilitate cunoscută conține așteptarea matematică a populației generale. Estimarea naturală pentru așteptarea matematică este media aritmetică a valorilor observate. Prin urmare, în continuare pe parcursul lecției vom folosi termenii „medie”, „valoare medie”. În problemele de calculare a intervalului de încredere, răspunsul cel mai adesea solicitat este „Intervalul de încredere al numărului mediu [valoarea unei anumite probleme] este de la [valoare mai mică] la [valoare mai mare]”. Cu ajutorul intervalului de încredere, este posibil să se evalueze nu numai valorile medii, ci și ponderea uneia sau alteia caracteristici a populației generale. Valorile medii, varianța, abaterea standard și eroarea, prin care vom ajunge la noi definiții și formule, sunt analizate în lecție Eșantionul și caracteristicile populației .

Estimări punctuale și pe intervale ale mediei

Dacă valoarea medie a populației generale este estimată printr-un număr (punct), atunci o medie specifică calculată dintr-un eșantion de observații este luată ca o estimare a mediei necunoscute a populației generale. În acest caz, valoarea mediei eșantionului - o variabilă aleatorie - nu coincide cu valoarea medie a populației generale. Prin urmare, atunci când se indică valoarea medie a eșantionului, este, de asemenea, necesar să se indice eroarea eșantionului în același timp. Eroarea standard este utilizată ca măsură a erorii de eșantionare, care este exprimată în aceleași unități ca și media. Prin urmare, se folosește adesea următoarea notație: .

Dacă estimarea mediei se cere să fie asociată cu o anumită probabilitate, atunci parametrul populației generale de interes trebuie estimat nu printr-un singur număr, ci printr-un interval. Un interval de încredere este un interval în care, cu o anumită probabilitate, P se constată valoarea indicatorului estimat al populaţiei generale. Interval de încredere în care cu probabilitate P = 1 - α este o variabilă aleatorie, se calculează după cum urmează:

,

α = 1 - P, care poate fi găsit în anexa la aproape orice carte de statistică.

În practică, media și varianța populației nu sunt cunoscute, astfel încât varianța populației este înlocuită cu varianța eșantionului, iar media populației cu media eșantionului. Astfel, intervalul de încredere în majoritatea cazurilor se calculează după cum urmează:

.

Formula intervalului de încredere poate fi utilizată pentru a estima media populației dacă

  • se cunoaște abaterea standard a populației generale;
  • sau abaterea standard a populației nu este cunoscută, dar dimensiunea eșantionului este mai mare de 30.

Media eșantionului este o estimare imparțială a mediei populației. La rândul său, varianța eșantionului nu este o estimare imparțială a varianței populației. Pentru a obține o estimare imparțială a varianței populației în formula variației eșantionului, dimensiunea eșantionului este n ar trebui înlocuit cu n-1.

Exemplul 1 Informații sunt colectate de la 100 de cafenele selectate aleatoriu dintr-un anumit oraș că numărul mediu de angajați din ele este de 10,5 cu o abatere standard de 4,6. Determinați intervalul de încredere de 95% din numărul de lucrători ai cafenelei.

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Astfel, intervalul de încredere de 95% pentru numărul mediu de angajați ai cafenelei a fost între 9,6 și 11,4.

Exemplul 2 Pentru un eșantion aleatoriu dintr-o populație generală de 64 de observații, au fost calculate următoarele valori totale:

suma valorilor din observații,

suma abaterilor pătrate ale valorilor de la medie .

Calculați intervalul de încredere de 95% pentru valoarea așteptată.

calculați abaterea standard:

,

calculați valoarea medie:

.

Înlocuiți valorile din expresie pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

Astfel, intervalul de încredere de 95% pentru așteptarea matematică a acestui eșantion a variat între 7,484 și 11,266.

Exemplul 3 Pentru un eșantion aleatoriu dintr-o populație generală de 100 de observații, au fost calculate o valoare medie de 15,2 și o abatere standard de 3,2. Calculați intervalul de încredere de 95% pentru valoarea așteptată, apoi intervalul de încredere de 99%. Dacă puterea eșantionului și variația acesteia rămân aceleași, dar factorul de încredere crește, intervalul de încredere se va îngusta sau se va lărgi?

Inlocuim aceste valori in expresia pentru intervalul de incredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

.

Astfel, intervalul de încredere de 95% pentru media acestui eșantion a fost de la 14,57 la 15,82.

Din nou, înlocuim aceste valori în expresia pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,01 .

Primim:

.

Astfel, intervalul de încredere de 99% pentru media acestui eșantion a fost de la 14,37 la 16,02.

După cum puteți vedea, pe măsură ce factorul de încredere crește, crește și valoarea critică a distribuției normale standard și, prin urmare, punctele de început și de sfârșit ale intervalului sunt situate mai departe de medie și, astfel, intervalul de încredere pentru așteptarea matematică. crește.

Estimări punctiforme și pe intervale ale greutății specifice

Ponderea unei anumite caracteristici a eșantionului poate fi interpretată ca o estimare punctuală a cotei p aceeași trăsătură în populația generală. Dacă această valoare trebuie să fie asociată cu o probabilitate, atunci intervalul de încredere al greutății specifice trebuie calculat p caracteristică în populația generală cu o probabilitate P = 1 - α :

.

Exemplul 4 Sunt doi candidați într-un anumit oraș AȘi B candideaza la functia de primar. 200 de locuitori ai orașului au fost chestionați aleatoriu, dintre care 46% au răspuns că vor vota pentru candidat A, 26% - pentru candidat B iar 28% nu știu pe cine vor vota. Determinați intervalul de încredere de 95% pentru proporția de locuitori ai orașului care susțin candidatul A.

Mai întâi, să ne amintim următoarea definiție:

Să luăm în considerare următoarea situație. Fie variantele populației generale să aibă o distribuție normală cu așteptare matematică $a$ și abatere standard $\sigma $. Media eșantionului în acest caz va fi considerată ca o variabilă aleatorie. Când $X$ este distribuit în mod normal, media eșantionului va avea și o distribuție normală cu parametri

Să găsim un interval de încredere care acoperă $a$ cu fiabilitate $\gamma $.

Pentru a face acest lucru, avem nevoie de egalitate

Din asta obținem

De aici putem găsi cu ușurință $t$ din tabelul de valori al funcției $Ф\left(t\right)$ și, ca rezultat, găsim $\delta $.

Reamintim tabelul de valori al funcției $Ф\left(t\right)$:

Figura 1. Tabelul de valori al funcției $Ф\left(t\right).$

Integrala de încredere pentru estimarea așteptării atunci când $(\mathbf \sigma )$ este necunoscut

În acest caz, vom folosi valoarea varianței corectate $S^2$. Înlocuind $\sigma $ în formula de mai sus cu $S$, obținem:

Un exemplu de sarcini pentru găsirea unui interval de încredere

Exemplul 1

Fie ca cantitatea $X$ să aibă o distribuție normală cu varianță $\sigma =4$. Fie dimensiunea eșantionului $n=64$ și fiabilitatea egală cu $\gamma =0,95$. Găsiți intervalul de încredere pentru estimarea așteptărilor matematice ale distribuției date.

Trebuie să găsim intervalul ($\overline(x)-\delta ,\overline(x)+\delta)$.

După cum am văzut mai sus

\[\delta =\frac(\sigma t)(\sqrt(n))=\frac(4t)(\sqrt(64))=\frac(\ t)(2)\]

Găsim parametrul $t$ din formulă

\[Ф\left(t\right)=\frac(\gamma )(2)=\frac(0,95)(2)=0,475\]

Din tabelul 1 obținem că $t=1,96$.



eroare: Conținutul este protejat!!