Intervale de încredere pentru estimarea așteptărilor matematice. Matematică și informatică

Fie variabila aleatoare X populatia este distribuit normal, dat fiind că varianța și abaterea standard s ale acestei distribuții sunt cunoscute. Este necesar să se estimeze așteptările matematice necunoscute folosind media eșantionului. În acest caz, problema se rezumă la găsirea interval de încredere Pentru așteptări matematice cu fiabilitate b. Dacă specificați valoarea probabilității de încredere (fiabilitatea) b, atunci puteți găsi probabilitatea de a cădea în intervalul pentru așteptarea matematică necunoscută folosind formula (6.9a):

unde Ф(t) este funcția Laplace (5.17a).

Ca rezultat, putem formula un algoritm pentru găsirea limitelor intervalului de încredere pentru așteptarea matematică dacă se cunoaște varianța D = s 2:

  1. Setați valoarea fiabilității – b.
  2. Din (6.14) exprimă Ф(t) = 0,5× b. Selectați valoarea lui t din tabel pentru funcția Laplace pe baza valorii Ф(t) (vezi Anexa 1).
  3. Calculați abaterea e folosind formula (6.10).
  4. Scrieți un interval de încredere folosind formula (6.12) astfel încât cu probabilitatea b inegalitatea să fie valabilă:

.

Exemplul 5.

Variabila aleatoare X are o distribuție normală. Găsiți intervale de încredere pentru o estimare cu fiabilitatea b = 0,96 a așteptării matematice necunoscute a, dacă este dat:

1) abaterea standard generală s = 5;

2) media eșantionului;

3) dimensiunea eșantionului n = 49.

În formula (6.15) a intervalului de estimare a așteptării matematice O cu fiabilitatea b toate mărimile cu excepția t sunt cunoscute. Valoarea lui t poate fi găsită folosind (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

Folosind tabelul din Anexa 1 pentru funcția Laplace Ф(t) = 0,48, găsiți valoarea corespunzătoare t = 2,06. Prin urmare, . Prin înlocuirea valorii calculate a lui e în formula (6.12), puteți obține un interval de încredere: 30-1,47< a < 30+1,47.

Intervalul de încredere necesar pentru o estimare cu fiabilitatea b = 0,96 a așteptării matematice necunoscute este egal cu: 28,53< a < 31,47.

Pentru început, amintiți-vă următoarea definiție:

Să luăm în considerare următoarea situație. Fie că variantele populației au o distribuție normală cu așteptare matematică $a$ și abatere standard $\sigma$. Media eșantionului în acest caz va fi considerată ca o variabilă aleatorie. Când cantitatea $X$ este distribuită în mod normal, media eșantionului va fi, de asemenea, distribuită în mod normal cu parametrii

Să găsim un interval de încredere care acoperă valoarea $a$ cu o fiabilitate de $\gamma $.

Pentru a face acest lucru, avem nevoie de egalitate

Din asta obținem

De aici putem găsi cu ușurință $t$ din tabelul cu valorile funcției $Ф\left(t\right)$ și, în consecință, găsim $\delta $.

Să ne amintim tabelul de valori al funcției $Ф\left(t\right)$:

Figura 1. Tabelul valorilor funcției $Ф\left(t\right).$

Integrală de încredere pentru estimarea așteptării matematice pentru o necunoscută $(\mathbf \sigma )$

În acest caz, vom folosi valoarea variației corectate $S^2$. Înlocuind $\sigma $ cu $S$ în formula de mai sus, obținem:

Exemple de probleme pentru găsirea unui interval de încredere

Exemplul 1

Fie ca cantitatea $X$ să aibă o distribuție normală cu varianță $\sigma =4$. Fie dimensiunea eșantionului $n=64$ și fiabilitatea $\gamma =0,95$. Găsiți intervalul de încredere pentru estimarea așteptărilor matematice ale acestei distribuții.

Trebuie să găsim intervalul ($\overline(x)-\delta ,\overline(x)+\delta)$.

După cum am văzut mai sus

\[\delta =\frac(\sigma t)(\sqrt(n))=\frac(4t)(\sqrt(64))=\frac(\t)(2)\]

Găsim parametrul $t$ din formulă

\[Ф\left(t\right)=\frac(\gamma )(2)=\frac(0,95)(2)=0,475\]

Din tabelul 1 aflăm că $t=1,96$.

Interval de încredere– valori limită valoare statistică, care cu o probabilitate de încredere dată γ se va afla în acest interval la eșantionarea unui volum mai mare. Notat ca P(θ - ε. În practică, alegeți probabilitatea de încredereγ de la valori destul de apropiate de unitate: γ = 0,9, γ = 0,95, γ = 0,99.

Scopul serviciului. Folosind acest serviciu, puteți determina:

  • interval de încredere pentru media generală, interval de încredere pentru varianță;
  • interval de încredere pentru abaterea standard, interval de încredere pentru cota generală;
Soluția rezultată este salvată într-un fișier Word (vezi exemplu). Mai jos este o instrucțiune video despre cum să completați datele inițiale.

Exemplul nr. 1. Într-o fermă colectivă, dintr-un efectiv total de 1000 de oi, 100 de oi au fost tunse cu control selectiv. Ca urmare, s-a stabilit o tăiere medie a lânii de 4,2 kg per oaie. Determinați cu o probabilitate de 0,99 media eroare pătrată probe la determinarea mediei de forfecare a lânii per oaie și a limitelor în care este conținută valoarea de forfecare dacă varianța este de 2,5. Eșantionul este nerepetitiv.
Exemplul nr. 2. Dintr-un lot de produse importate de la postul Vamalului de Nord din Moscova, 20 de mostre de produs „A” au fost prelevate prin prelevare repetă aleatorie. În urma testului, a fost stabilit conținutul mediu de umiditate al produsului „A” din probă, care s-a dovedit a fi egal cu 6% cu o abatere standard de 1%.
Determinați cu probabilitate 0,683 limitele conținutului mediu de umiditate al produsului în întregul lot de produse importate.
Exemplul nr. 3. Un sondaj efectuat pe 36 de elevi a arătat că numărul mediu de manuale pe care le citesc pe an an universitar, s-a dovedit a fi egal cu 6. Presupunând că numărul de manuale citite de un student pe semestru are o lege de distribuție normală cu o abatere standard egală cu 6, găsiți: A) cu o fiabilitate de 0,99, o estimare de interval pentru matematica așteptarea acestei variabile aleatoare; B) cu ce probabilitate putem spune că numărul mediu de manuale citite de un student pe semestru, calculat din acest eșantion, se va abate de la așteptarea matematică în valoare absolută cu cel mult 2.

Clasificarea intervalelor de încredere

După tipul de parametru evaluat:

După tipul de eșantion:

  1. Interval de încredere pentru un eșantion infinit;
  2. Interval de încredere pentru eșantionul final;
Eșantionul se numește reeșantionare, dacă obiectul selectat este returnat populației înainte de a-l selecta pe următorul. Eșantionul se numește non-repeat, dacă obiectul selectat nu este returnat populației. În practică, de obicei avem de-a face cu mostre nerepetitive.

Calculul erorii medii de eșantionare pentru eșantionarea aleatorie

Discrepanța dintre valorile indicatorilor obținuți din eșantion și parametrii corespunzători ai populației generale se numește eroare de reprezentativitate.
Desemnări ale parametrilor principali ai populațiilor generale și eșantionului.
Formule de eroare medie de eșantionare
re-selectarerepeta selectia
pentru mediepentru împărțirepentru mediepentru împărțire
Relația dintre limita erorii de eșantionare (Δ) este garantată cu o oarecare probabilitate Р(t), iar eroarea medie de eșantionare are forma: sau Δ = t·μ, unde t– coeficient de încredere, determinat în funcție de nivelul de probabilitate P(t) conform tabelului funcției integrale Laplace.

Formule pentru calcularea dimensiunii eșantionului folosind o metodă de eșantionare pur aleatorie

Fie o variabilă aleatoare (putem vorbi despre o populație generală) să fie distribuită după o lege normală, pentru care se cunoaște varianța D = 2 (> 0). Din populația generală (pe mulțimea de obiecte din care se determină o variabilă aleatorie), se realizează un eșantion de mărimea n. Eșantionul x 1 , x 2 ,..., x n este considerat ca o mulțime de n variabile aleatoare independente distribuite în același mod ca (abordarea explicată mai sus în text).

Următoarele egalități au fost, de asemenea, discutate și dovedite mai devreme:

Mx 1 = Mx 2 = ... = Mx n = M;

Dx 1 = Dx 2 = ... = Dx n = D;

Este suficient să demonstrăm pur și simplu (omitem dovada) că și variabila aleatoare în acest caz este distribuită conform legii normale.

Să notăm cu a mărimea necunoscută M și să selectăm, pe baza fiabilității date, numărul d > 0 astfel încât condiția să fie îndeplinită:

P(- a< d) = (1)

Deoarece variabila aleatoare este distribuită conform legii normale cu așteptare matematică M = M = a și varianță D = D /n = 2 /n, obținem:

P(- a< d) =P(a - d < < a + d) =

Rămâne să alegeți d astfel încât egalitatea să fie valabilă

Pentru oricine, puteți folosi tabelul pentru a găsi un număr t astfel încât (t)= / 2. Acest număr t este uneori numit cuantilă.

Acum de la egalitate

să determinăm valoarea lui d:

Rezultatul final îl obținem prezentând formula (1) sub forma:

Semnificația ultimei formule este următoarea: cu fiabilitate, intervalul de încredere

acoperă parametrul necunoscut a = M al populației. Poți spune altfel: estimare punctuală determină valoarea parametrului M cu precizie d= t / și fiabilitate.

Sarcină. Să existe o populație cu o anumită caracteristică distribuită după o lege normală cu o varianță egală cu 6,25. A fost luată o dimensiune a eșantionului de n = 27 și s-a obținut valoarea medie a eșantionului a caracteristicii = 12. Găsiți un interval de încredere care să acopere așteptarea matematică necunoscută a caracteristicii studiate a populației generale cu fiabilitate = 0,99.

Soluţie. În primul rând, folosind tabelul pentru funcția Laplace, găsim valoarea lui t din egalitatea (t) = / 2 = 0,495. Pe baza valorii obținute t = 2,58, determinăm acuratețea estimării (sau jumătate din lungimea intervalului de încredere) d: d = 2,52,58 / 1,24. De aici obținem intervalul de încredere dorit: (10,76; 13,24).

ipoteza statistică variaţională generală

Interval de încredere pentru așteptarea matematică a unei distribuții normale cu varianță necunoscută

Fie o variabilă aleatoare distribuită după o lege normală cu o așteptare matematică necunoscută M, pe care o notăm cu litera a. Să facem o mostră de volum n. Să determinăm eșantionul mediu și varianța eșantionului corectat s 2 folosind formule cunoscute.

Variabila aleatoare

distribuite conform legii Student cu n - 1 grade de libertate.

Sarcina este de a găsi un număr t pentru o fiabilitate dată și numărul de grade de libertate n - 1 astfel încât egalitatea

sau egalitate echivalentă

Aici este scrisă între paranteze condiția ca valoarea parametrului necunoscut a să aparțină unui anumit interval, care este intervalul de încredere. Limitele sale depind de fiabilitate, precum și de parametrii de eșantionare și de s.

Pentru a determina valoarea lui t după mărime, transformăm egalitatea (2) în forma:

Acum, folosind tabelul pentru o variabilă aleatorie t distribuită conform legii lui Student, folosind probabilitatea 1 - și numărul de grade de libertate n - 1, găsim t. Formula (3) oferă răspunsul la problema pusă.

Sarcină. În testele de control a 20 de lămpi electrice, durata medie de funcționare a acestora a fost egală cu 2000 de ore cu o abatere standard (calculată ca rădăcină pătrată a variației eșantionului corectat) egală cu 11 ore. Se știe că durata de funcționare a lămpii este distribuită în mod normal variabilă aleatoare. Determinați cu o fiabilitate de 0,95 un interval de încredere pentru așteptarea matematică a acestei variabile aleatoare.

Soluţie. Valoarea 1 - în acest caz este egală cu 0,05. Conform tabelului de distribuție Student, cu numărul de grade de libertate egal cu 19, găsim: t = 2,093. Să calculăm acum acuratețea estimării: 2,093121/ = 56,6. De aici obținem intervalul de încredere necesar: (1943,4; 2056,6).

Să construim în MS EXCEL incredere interval de estimare a valorii medii a distribuţiei în cazul unei variaţii cunoscute.

Desigur alegerea nivelul de încredere depinde complet de problema rezolvată. Astfel, gradul de încredere al unui pasager aerian în fiabilitatea unui avion ar trebui să fie, fără îndoială, mai mare decât gradul de încredere al unui cumpărător în fiabilitatea unui bec electric.

Formularea problemei

Să presupunem că de la populatia fiind luate eşantion marimea n. Se presupune că abaterea standard această distribuţie este cunoscută. Este necesar pe baza acestui lucru mostre evalua necunoscutul mijloc de distribuție(μ, ) și construiți corespunzătoare faţă-verso interval de încredere.

Estimare punctuală

După cum se știe din statistici(să o notăm medie X) este estimare imparțială a mediei acest populatiași are o distribuție N(μ;σ 2 /n).

Nota: Ce să faci dacă trebuie să construiești interval de încredereîn cazul unei distribuţii care nu este normal?În acest caz, vine în ajutor, care afirmă că cu o dimensiune suficient de mare mostre n din distribuție nefiind normal, distribuția eșantionului de statistici X avg voinţă aproximativ corespund distributie normala cu parametrii N(μ;σ 2 /n).

Aşa, estimare punctuală medie valorile de distribuție avem - asta eșantion mediu, adică medie X. Acum să începem interval de încredere.

Construirea unui interval de încredere

De obicei, cunoscând distribuția și parametrii acesteia, putem calcula probabilitatea ca variabila aleatoare să ia o valoare din intervalul pe care îl specificăm. Acum să facem invers: găsiți intervalul în care variabila aleatoare va cădea cu o probabilitate dată. De exemplu, din proprietăți distributie normala se ştie că, cu o probabilitate de 95%, o variabilă aleatoare distribuită peste legea normală, se va încadra în intervalul de aproximativ +/- 2 de la valoare medie(vezi articolul despre). Acest interval ne va servi drept prototip interval de încredere.

Acum să vedem dacă știm distribuția , pentru a calcula acest interval? Pentru a răspunde la întrebare, trebuie să indicăm forma distribuției și parametrii acesteia.

Cunoaștem forma de distribuție - aceasta este distributie normala(rețineți că vorbim despre distribuția eșantionării statistici medie X).

Parametrul μ ne este necunoscut (trebuie doar estimat folosind interval de încredere), dar avem o estimare a acesteia medie X, calculat pe baza mostre, care poate fi folosit.

Al doilea parametru - abaterea standard a mediei eșantionului îl vom considera cunoscut, este egal cu σ/√n.

Deoarece nu știm μ, atunci vom construi intervalul +/- 2 abateri standard nu de la valoare medie, și din estimarea sa cunoscută medie X. Aceste. la calcul interval de încredere NU vom presupune că medie X se încadrează în intervalul +/- 2 abateri standard de la μ cu o probabilitate de 95% și vom presupune că intervalul este +/- 2 abateri standard din medie X cu 95% probabilitate va acoperi μ – media populației generale, din care se ia eşantion. Aceste două afirmații sunt echivalente, dar a doua declarație ne permite să construim interval de încredere.

În plus, să clarificăm intervalul: o variabilă aleatoare distribuită peste legea normală, cu o probabilitate de 95% se încadrează în intervalul +/- 1.960 abateri standard, nu +/- 2 abateri standard. Aceasta poate fi calculată folosind formula =NORM.ST.REV((1+0,95)/2), cm. fișier exemplu Sheet Interval.

Acum putem formula o afirmație probabilistică care ne va servi să formăm interval de încredere:
„Probabilitatea ca media populatiei situat din medie a probeiîn termen de 1.960 " abaterile standard ale mediei eșantionului", egal cu 95%”.

Valoarea probabilității menționată în declarație are o denumire specială , care este asociat cu nivelul de semnificație α (alfa) printr-o expresie simplă nivelul de încredere =1 . În cazul nostru nivelul de semnificație α =1-0,95=0,05 .

Acum, pe baza acestei afirmații probabilistice, scriem o expresie pentru calcul interval de încredere:

unde Z α/2 standard distributie normala(această valoare a variabilei aleatoare z, Ce P(z>=Z α/2 )=α/2).

Nota: α/2-quantila superioară definește lățimea interval de încredere V abateri standard eșantion mediu. α/2-quantila superioară standard distributie normalaîntotdeauna mai mare decât 0, ceea ce este foarte convenabil.

În cazul nostru, cu α=0,05, α/2-quantila superioară este egal cu 1.960. Pentru alte niveluri de semnificație α (10%; 1%) α/2-quantila superioară Z α/2 poate fi calculat folosind formula =NORM.ST.REV(1-α/2) sau, dacă este cunoscută nivelul de încredere, =NORM.ST.OBR((1+nivel de încredere)/2).

De obicei, la construirea intervale de încredere pentru estimarea mediei utilizați numai α superioară/2-cuantilă si nu folositi mai mic α/2-cuantilă. Acest lucru este posibil pentru că standard distributie normala simetric fata de axa x ( densitatea sa de distribuție simetric despre medie, adică 0). Prin urmare, nu este nevoie să se calculeze α/2-cuantilă mai mică(se numește pur și simplu α /2-quantila), pentru că este egal α superioară/2-cuantilă cu semnul minus.

Să ne amintim că, în ciuda formei distribuției valorii x, variabila aleatoare corespunzătoare medie X distribuite aproximativ Amenda N(μ;σ 2 /n) (vezi articolul despre). Prin urmare, în caz general, expresia de mai sus pentru interval de încredere este doar o aproximare. Dacă valoarea x este distribuită peste legea normală N(μ;σ 2 /n), apoi expresia pentru interval de încredere este exactă.

Calcul intervalului de încredere în MS EXCEL

Să rezolvăm problema.
Timpul de răspuns al unei componente electronice la un semnal de intrare este o caracteristică importantă a dispozitivului. Un inginer dorește să construiască un interval de încredere pentru timpul mediu de răspuns la un nivel de încredere de 95%. Din experiența anterioară, inginerul știe că abaterea standard a timpului de răspuns este de 8 ms. Se știe că pentru a evalua timpul de răspuns, inginerul a făcut 25 de măsurători, valoarea medie a fost de 78 ms.

Soluţie: Un inginer vrea să cunoască timpul de răspuns al unui dispozitiv electronic, dar înțelege că timpul de răspuns nu este o valoare fixă, ci o variabilă aleatorie care are propria sa distribuție. Deci, cel mai bun lucru la care poate spera este să determine parametrii și forma acestei distribuții.

Din păcate, din condițiile problemei nu cunoaștem forma distribuției timpului de răspuns (nu trebuie să fie normal). , această distribuție este de asemenea necunoscută. Numai el este cunoscut abaterea standardσ=8. Prin urmare, în timp ce nu putem calcula probabilitățile și construi interval de încredere.

Cu toate acestea, în ciuda faptului că nu cunoaștem distribuția timp răspuns separat, știm că conform CPT, distribuția eșantionului timpul mediu de răspuns este de aproximativ normal(vom presupune că condițiile CPT sunt efectuate, deoarece dimensiune mostre destul de mare (n=25)) .

În plus, medie această distribuţie este egală cu valoare medie distribuția unui singur răspuns, adică μ. O abaterea standard a acestei distribuții (σ/√n) poate fi calculată folosind formula =8/ROOT(25) .

De asemenea, se știe că inginerul a primit estimare punctuală parametrul μ egal cu 78 ms (X avg). Prin urmare, acum putem calcula probabilități, deoarece cunoaștem forma de distribuție ( normal) și parametrii săi (X avg și σ/√n).

Inginerul vrea să știe așteptări matematiceμ distribuțiile timpului de răspuns. După cum sa menționat mai sus, acest μ este egal cu așteptarea matematică a distribuției eșantionului a timpului mediu de răspuns. Dacă folosim distributie normala N(Х avg; σ/√n), atunci μ dorit va fi în intervalul +/-2*σ/√n cu o probabilitate de aproximativ 95%.

Nivel de semnificație este egal cu 1-0,95=0,05.

În cele din urmă, să găsim marginile din stânga și din dreapta interval de încredere.
Chenarul din stânga: =78-NORM.ST.INV(1-0,05/2)*8/ROOT(25) = 74,864
Chenarul din dreapta: =78+NORM.ST.INV(1-0,05/2)*8/ROOT(25)=81,136

Chenarul din stânga: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Chenarul din dreapta: =NORM.REV(1-0,05/2; 78; 8/ROOT(25))

Răspuns: interval de încredere la Nivel de încredere de 95% și σ=8msec egală 78+/-3,136 ms.

ÎN exemplu de fișier pe foaia Sigma cunoscut, a creat o formă de calcul și construcție faţă-verso interval de încredere pentru arbitrar mostre cu σ dat și nivelul de semnificație.

Funcția CONFIDENCE.NORM().

Dacă valorile mostre sunt în gamă B20:B79 , A nivelul de semnificație egal cu 0,05; apoi formula MS EXCEL:
=MEDIE(B20:B79)-ÎNCREDERE.NORMĂ(0,05;σ; NUMĂRĂ (B20:B79))
va întoarce marginea stângă interval de încredere.

Aceeași limită poate fi calculată folosind formula:
=AVERAGE(B20:B79)-NORM.ST.REV(1-0,05/2)*σ/ROOT(COUNT(B20:B79))

Nota: Funcția CONFIDENCE.NORM() a apărut în MS EXCEL 2010. În versiunile anterioare ale MS EXCEL, a fost folosită funcția TRUST().





eroare: Continut protejat!!