Interval de încredere pentru așteptarea matematică a unei distribuții normale cu o varianță cunoscută.

Să fie prelevat un eșantion dintr-o populație generală supusă legii normal distributie XN( m; ). Această ipoteză de bază a statisticii matematice se bazează pe teorema centrală a limitei. Fie cunoscută abaterea standard generală , dar așteptarea matematică a distribuției teoretice este necunoscută m(valoare medie).

În acest caz, eșantionul înseamnă , obținut în timpul experimentului (secțiunea 3.4.2), va fi de asemenea o variabilă aleatorie m;
). Apoi abaterea „normalizată”.
N(0;1) – este o variabilă aleatorie normală standard.

Sarcina este de a găsi o estimare a intervalului pentru m. Să construim un interval de încredere cu două fețe pentru m astfel încât adevărata așteptare matematică îi aparține cu o probabilitate dată (fiabilitate) .

Setați un astfel de interval pentru valoare
- aceasta înseamnă găsirea valorii maxime a acestei cantități
si minim
, care sunt limitele regiunii critice:
.

Deoarece această probabilitate este egală
, apoi rădăcina acestei ecuații
poate fi găsit folosind tabelele de funcții Laplace (Tabelul 3, Anexa 1).

Apoi cu probabilitate se poate argumenta că variabila aleatoare
, adică media generală dorită aparține intervalului
. (3.13)

Dimensiune
(3.14)

numit precizie evaluări.

Număr
cuantilă distributie normala– poate fi găsit ca argument al funcției Laplace (Tabelul 3, Anexa 1), ținând cont de relația 2Ф( u)=, adică F( u)=
.

Invers, în funcție de valoarea specificată a abaterii se poate afla cu ce probabilitate aparține intervalului media generală necunoscută
. Pentru a face acest lucru, trebuie să calculați

. (3.15)

Lasă afară populatia o probă aleatorie a fost extrasă folosind eșantionarea repetată. Din Eq.
poate fi găsit minim volumul de reeșantionare n, necesar pentru intervalul de încredere cu o fiabilitate dată nu a depășit valoarea prestabilită . Mărimea eșantionului necesară este estimată folosind formula:

. (3.16)

Să explorăm acuratețea estimării
:

1) Pe măsură ce dimensiunea eșantionului crește n magnitudinea scade, și, prin urmare, acuratețea estimării crește.

2) C crește fiabilitatea evaluării valoarea argumentului crește u(deoarece F(u) creşte monoton) şi deci crește . În acest caz, creșterea fiabilității reduce acuratețea evaluării sale .

Evaluare
(3.17)

numit clasic(Unde t- un anumit parametru in functie de Şi n), pentru că caracterizează cele mai frecvent întâlnite legi de distribuţie.

3.5.3 Intervale de încredere pentru estimarea așteptării matematice a unei distribuții normale cu o abatere standard necunoscută 

Să se știe că populația este supusă legii distribuției normale XN( m;), unde valoarea rădăcină medie pătrată abaterile necunoscut.

Pentru a construi un interval de încredere pentru estimarea mediei generale în acest caz, se folosesc statistici
, având o distribuție Student cu k= n-1 grad de libertate. Aceasta rezultă din faptul că N(0;1) (vezi secțiunea 3.5.2) și
(vezi secțiunea 3.5.3) și din definiția distribuției Student (partea 1.secțiunea 2.11.2).

Să găsim acuratețea estimării clasice a distribuției Student: i.e. vom găsi t din formula (3.17). Fie probabilitatea îndeplinirii inegalității
dat de fiabilitate :

. (3.18)

Deoarece TSf( n-1), este evident că t depinde de Şi n, așa că de obicei scriu
.

(3.19)

Unde
– Funcția de distribuție a elevilor cu n-1 grad de libertate.

Rezolvarea acestei ecuații pentru m, obținem intervalul
care acoperă fiabil  parametrul necunoscut m.

Magnitudinea t , n-1, folosit pentru a determina intervalul de încredere variabilă aleatoare T(n-1), distribuite conform testului t cu n-1 grad de libertate se numește Coeficientul elevului. Ar trebui găsită după valorile date nși  din tabelele „Puncte critice ale distribuției elevilor”. (Tabelul 6, Anexa 1), care reprezintă soluțiile ecuației (3.19).

Ca rezultat, obținem următoarea expresie precizie interval de încredere pentru estimare așteptări matematice(media generală), dacă varianța este necunoscută:

(3.20)

Astfel, există o formulă generală pentru construirea intervalelor de încredere pentru așteptarea matematică a populației:

unde este precizia intervalului de încredere in functie de dispersia cunoscuta sau necunoscuta se gaseste dupa formule, respectiv 3.16. și 3.20.

Problema 10. Au fost efectuate câteva teste, ale căror rezultate sunt enumerate în tabel:

x i

Se știe că respectă legea distribuției normale cu
. Găsiți evaluare m* pentru așteptările matematice m, construiți un interval de încredere de 90% pentru acesta.

Soluţie:

Aşa, m(2.53;5.47).

Problema 11. Adâncimea mării este măsurată de un dispozitiv a cărui eroare sistematică este 0, iar erorile aleatorii sunt distribuite conform legii normale, cu o abatere standard. = 15 m. Câte măsurători independente trebuie făcute pentru a determina adâncimea cu erori de cel mult 5 m la un nivel de încredere de 90%?

Soluţie:

Dupa conditiile problemei pe care o avem XN( m; ), Unde = 15 m, =5m, =0,9. Să găsim volumul n.

1) Cu o fiabilitate dată = 0,9, găsim din Tabelele 3 (Anexa 1) argumentul funcției Laplace u = 1.65.

2) Cunoașterea exactității estimării specificate =u=5, să găsim
. Avem

. Prin urmare, numărul de teste n25.

Problema 12. Prelevare de probe de temperatură t pentru primele 6 zile ale lunii ianuarie este prezentată în tabel:

Găsiți intervalul de încredere pentru așteptarea matematică m populație cu probabilitate de încredere
și evaluează generalul abaterea standard s.

Soluţie:


Şi
.

2) Estimare imparțială găsiți-l folosind formula
:

=-175

=234.84

;
;

=-192

=116


.

3) Deoarece varianța generală este necunoscută, dar estimarea ei este cunoscută, atunci pentru a estima așteptarea matematică m folosim distribuția Student (Tabelul 6, Anexa 1) și formula (3.20).

Deoarece n 1 =n 2 =6, atunci ,
, s 1 =6,85 avem:
, deci -29,2-4,1<m 1 < -29.2+4.1.

Prin urmare -33,3<m 1 <-25.1.

La fel avem,
, s 2 = 4,8, deci

–34.9< m 2 < -29.1. Тогда доверительные интервалы примут вид: m 1 (-33,3;-25,1) și m 2 (-34.9;-29.1).

În științele aplicate, de exemplu, în disciplinele de construcție, pentru a evalua acuratețea obiectelor, se folosesc tabele cu intervale de încredere, care sunt date în literatura de referință relevantă.

Fie CB X o populație generală și fie β parametrul necunoscut CB X. Dacă estimarea statistică în * este consecventă, atunci cu cât dimensiunea eșantionului este mai mare, cu atât obținem mai precis valoarea lui β. Cu toate acestea, în practică, nu avem mostre foarte mari, așa că nu putem garanta o precizie mai mare.

Fie b* o estimare statistică pentru c. Valoarea |in* - in| se numește precizie de estimare. Este clar că acuratețea este CB, deoarece β* este o variabilă aleatorie. Să specificăm un mic număr pozitiv 8 și să cerem ca acuratețea estimării |в* - в| a fost mai mică de 8, adică | în* - în |< 8.

Fiabilitatea g sau probabilitatea de încredere a unei estimări în * este probabilitatea g cu care inegalitatea |în * - în|< 8, т. е.

De obicei, fiabilitatea g este specificată în avans, iar g este considerat un număr apropiat de 1 (0,9; 0,95; 0,99; ...).

Deoarece inegalitatea |în * - în|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Intervalul (în * - 8, în * + 5) se numește interval de încredere, adică intervalul de încredere acoperă parametrul necunoscut în cu probabilitatea y. Rețineți că capetele intervalului de încredere sunt aleatorii și variază de la un eșantion la altul, deci este mai corect să spunem că intervalul (în * - 8, în * + 8) acoperă parametrul necunoscut în, mai degrabă decât în ​​aparține acestui interval.

Fie populația definită de o variabilă aleatoare X, distribuită conform unei legi normale, iar abaterea standard a este cunoscută. Necunoscuta este așteptarea matematică a = M (X). Este necesar să se găsească intervalul de încredere pentru a pentru o anumită fiabilitate y.

Eșantion mediu

este o estimare statistică pentru xr = a.

Teorema. O variabilă aleatoare xB are o distribuție normală dacă X are o distribuție normală și M (XB) = a,

A (XB) = a, unde a = y/B (X), a = M (X). l/i

Intervalul de încredere pentru a are forma:

Găsim 8.

Folosind raportul

unde Ф(r) este funcția Laplace, avem:

P ( | XB - a |<8} = 2Ф

tabelul de valori al funcției Laplace găsim valoarea lui t.

După ce a desemnat

T, obținem F(t) = g Deoarece g este dat, atunci de

Din egalitate aflăm că estimarea este corectă.

Aceasta înseamnă că intervalul de încredere pentru a are forma:

Având în vedere un eșantion din populația X

ng La" X2 Xm
n. n1 n2 nm

n = U1 + ... + nm, atunci intervalul de încredere va fi:

Exemplul 6.35. Aflați intervalul de încredere pentru estimarea așteptării matematice a a distribuției normale cu o fiabilitate de 0,95, cunoscând media eșantionului Xb = 10,43, dimensiunea eșantionului n = 100 și abaterea standard s = 5.

Să folosim formula

Există două tipuri de estimări în statistică: punct și interval. Estimare punctuală este un singur eșantion statistic care este utilizat pentru a estima un parametru de populație. De exemplu, media eșantionului este o estimare punctuală a așteptărilor matematice a populației și a varianței eșantionului S 2- estimarea punctuală a varianței populației σ 2. s-a demonstrat că media eșantionului este o estimare imparțială a așteptărilor matematice a populației. O medie a eșantionului se numește imparțial deoarece media tuturor mediilor eșantionului (cu aceeași dimensiune a eșantionului) n) este egală cu așteptarea matematică a populației generale.

Pentru variația eșantionului S 2 a devenit o estimare imparțială a varianței populației σ 2, numitorul varianței eșantionului trebuie setat egal cu n – 1 , nu n. Cu alte cuvinte, varianța populației este media tuturor variațiilor posibile ale eșantionului.

La estimarea parametrilor populației, ar trebui să se țină cont de faptul că statisticile eșantionului precum , depind de mostre specifice. A ține cont de acest fapt, a obține estimarea intervalului așteptarea matematică a populației generale, analizați distribuția mediilor eșantionului (pentru mai multe detalii, vezi). Intervalul construit este caracterizat de un anumit nivel de încredere, care reprezintă probabilitatea ca parametrul adevărat al populației să fie estimat corect. Intervale similare de încredere pot fi utilizate pentru a estima proporția unei caracteristici rși principala masă distribuită a populației.

Descărcați nota în sau format, exemple în format

Construirea unui interval de încredere pentru așteptarea matematică a populației cu o abatere standard cunoscută

Construirea unui interval de încredere pentru ponderea unei caracteristici în populație

Această secțiune extinde conceptul de interval de încredere la date categorice. Acest lucru ne permite să estimăm ponderea caracteristicii în populație r folosind partajarea eșantionului rS= X/n. După cum este indicat, dacă cantitățile nrŞi n(1 – p) depășește numărul 5, distribuția binomială poate fi aproximată ca normal. Prin urmare, pentru a estima ponderea unei caracteristici în populație r se poate construi un interval al cărui nivel de încredere este egal cu (1 – α)х100%.


Unde pS- proporția de eșantion a caracteristicii egală cu X/n, adică numărul de succese împărțit la dimensiunea eșantionului, r- ponderea caracteristicii în populația generală, Z- valoarea critică a distribuției normale standardizate, n- dimensiunea eșantionului.

Exemplul 3. Sa presupunem ca din sistemul informatic este extras un esantion format din 100 de facturi completate in ultima luna. Să presupunem că 10 dintre aceste facturi au fost întocmite cu erori. Astfel, r= 10/100 = 0,1. Nivelul de încredere de 95% corespunde valorii critice Z = 1,96.

Astfel, probabilitatea ca între 4,12% și 15,88% din facturi să conțină erori este de 95%.

Pentru o anumită dimensiune a eșantionului, intervalul de încredere care conține proporția caracteristicii în populație pare mai larg decât pentru o variabilă aleatoare continuă. Acest lucru se datorează faptului că măsurătorile unei variabile aleatoare continue conțin mai multe informații decât măsurătorile datelor categorice. Cu alte cuvinte, datele categorice care iau doar două valori conțin informații insuficiente pentru a estima parametrii distribuției lor.

ÎNcalcularea estimărilor extrase dintr-o populație finită

Estimarea așteptărilor matematice. Factorul de corecție pentru populația finală ( fpc) a fost folosit pentru a reduce eroarea standard cu un factor. La calcularea intervalelor de încredere pentru estimările parametrilor populației, se aplică un factor de corecție în situațiile în care probele sunt extrase fără a fi returnate. Astfel, un interval de încredere pentru așteptarea matematică având un nivel de încredere egal cu (1 – α)х100%, se calculează prin formula:

Exemplul 4. Pentru a ilustra utilizarea factorului de corecție pentru o populație finită, să revenim la problema calculării intervalului de încredere pentru suma medie a facturilor, discutată mai sus în Exemplul 3. Să presupunem că o companie emite 5.000 de facturi pe lună și = 110,27 dolari, S= 28,95 USD N = 5000, n = 100, α = 0,05, t 99 = 1,9842. Folosind formula (6) obtinem:

Estimarea cotei unei caracteristici. Atunci când alegeți fără returnare, intervalul de încredere pentru proporția atributului având un nivel de încredere egal cu (1 – α)х100%, se calculează prin formula:

Intervalele de încredereși probleme etice

Atunci când se eșantionează o populație și se trag concluzii statistice, apar adesea probleme etice. Principalul este modul în care intervalele de încredere și estimările punctuale ale statisticilor eșantionului sunt de acord. Publicarea estimărilor punctuale fără a specifica intervalele de încredere asociate (de obicei la nivelul de încredere de 95%) și dimensiunea eșantionului din care sunt derivate pot crea confuzie. Acest lucru poate da utilizatorului impresia că estimarea punctuală este exact ceea ce are nevoie pentru a prezice proprietățile întregii populații. Astfel, este necesar să înțelegem că în orice cercetare accentul ar trebui să fie nu pe estimările punctuale, ci pe estimările pe intervale. În plus, o atenție deosebită trebuie acordată selecției corecte a dimensiunilor eșantionului.

Cel mai adesea, obiectele manipulării statistice sunt rezultatele anchetelor sociologice ale populației pe anumite probleme politice. În același timp, rezultatele sondajului sunt publicate pe primele pagini ale ziarelor, iar eroarea de eșantionare și metodologia de analiză statistică sunt publicate undeva la mijloc. Pentru a demonstra validitatea estimărilor punctuale obținute este necesar să se indice mărimea eșantionului pe baza căruia au fost obținute, limitele intervalului de încredere și nivelul său de semnificație.

Următoarea notă

Sunt utilizate materiale din cartea Levin et al. – M.: Williams, 2004. – p. 448–462

Teorema limitei centrale afirmă că, cu o dimensiune a eșantionului suficient de mare, distribuția eșantionului de medii poate fi aproximată printr-o distribuție normală. Această proprietate nu depinde de tipul de distribuție a populației.

Interval de încredere– valorile limită ale unei mărimi statistice care, cu o probabilitate de încredere dată γ, se vor afla în acest interval la eșantionarea unui volum mai mare. Notat cu P(θ - ε. În practică, probabilitatea de încredere γ este aleasă dintre valori destul de apropiate de unitate: γ = 0,9, γ = 0,95, γ = 0,99.

Scopul serviciului. Folosind acest serviciu, puteți determina:

  • interval de încredere pentru media generală, interval de încredere pentru varianță;
  • interval de încredere pentru abaterea standard, interval de încredere pentru cota generală;
Soluția rezultată este salvată într-un fișier Word (vezi exemplu). Mai jos este o instrucțiune video despre cum să completați datele inițiale.

Exemplul nr. 1. Într-o fermă colectivă, dintr-un efectiv total de 1000 de oi, 100 de oi au fost tunse cu control selectiv. Ca urmare, s-a stabilit o tăiere medie a lânii de 4,2 kg per oaie. Determinați cu o probabilitate de 0,99 eroarea pătratică medie a eșantionului atunci când se determină forfecarea medie a lânii per oaie și limitele în care este conținută valoarea forfeței dacă varianța este 2,5. Eșantionul este nerepetitiv.
Exemplul nr. 2. Dintr-un lot de produse importate de la postul Vamalului de Nord din Moscova, 20 de mostre de produs „A” au fost prelevate prin prelevare repetă aleatorie. În urma testului, a fost stabilit conținutul mediu de umiditate al produsului „A” din probă, care s-a dovedit a fi egal cu 6% cu o abatere standard de 1%.
Determinați cu probabilitate 0,683 limitele conținutului mediu de umiditate al produsului în întregul lot de produse importate.
Exemplul nr. 3. Un sondaj efectuat pe 36 de studenți a arătat că numărul mediu de manuale citite de aceștia în cursul anului universitar a fost egal cu 6. Presupunând că numărul de manuale citite de un student pe semestru are o lege de distribuție normală cu o abatere standard egală cu 6, găsiți : A) cu o fiabilitate de 0,99 estimare de interval pentru așteptarea matematică a acestei variabile aleatoare; B) cu ce probabilitate putem spune că numărul mediu de manuale citite de un student pe semestru, calculat din acest eșantion, se va abate de la așteptarea matematică în valoare absolută cu cel mult 2.

Clasificarea intervalelor de încredere

După tipul de parametru evaluat:

După tipul de eșantion:

  1. Interval de încredere pentru un eșantion infinit;
  2. Interval de încredere pentru eșantionul final;
Eșantionul se numește reeșantionare, dacă obiectul selectat este returnat populației înainte de a-l selecta pe următorul. Eșantionul se numește non-repeat, dacă obiectul selectat nu este returnat populației. În practică, de obicei avem de-a face cu mostre nerepetitive.

Calculul erorii medii de eșantionare pentru eșantionarea aleatorie

Discrepanța dintre valorile indicatorilor obținuți din eșantion și parametrii corespunzători ai populației generale se numește eroare de reprezentativitate.
Desemnări ale parametrilor principali ai populațiilor generale și eșantionului.
Formule de eroare medie de eșantionare
re-selectarerepeta selectia
pentru mediepentru împărțirepentru mediepentru împărțire
Relația dintre limita erorii de eșantionare (Δ) este garantată cu o oarecare probabilitate Р(t), iar eroarea medie de eșantionare are forma: sau Δ = t·μ, unde t– coeficient de încredere, determinat în funcție de nivelul de probabilitate P(t) conform tabelului funcției integrale Laplace.

Formule pentru calcularea dimensiunii eșantionului folosind o metodă de eșantionare pur aleatorie





eroare: Continut protejat!!