Distribuția Poisson a unei variabile aleatoare discrete. Distribuția Poisson

Introducere

Sunt fenomenele care sunt aleatorii în natură supuse vreunei legi? Da, dar aceste legi sunt diferite de legile fizice cu care suntem obișnuiți. Valorile SW nu pot fi prezise nici măcar în condiții experimentale cunoscute, putem indica doar probabilitățile ca SW să ia una sau alta valoare. Dar cunoscând distribuția de probabilitate a SW, putem trage concluzii despre evenimentele la care participă aceste variabile aleatoare. Adevărat, aceste concluzii vor fi, de asemenea, de natură probabilistică.

Lasă unele SW să fie discrete, adică poate lua doar valori fixe Xi. În acest caz, o serie de probabilități P(Xi) pentru toate valorile admisibile (i=1…n) ale acestei mărimi se numește legea distribuției sale.

Legea distribuției SW este o relație care stabilește o relație între posibilele valori ale SW și probabilitățile cu care aceste valori sunt acceptate. Legea distribuției caracterizează pe deplin SW.

La construirea model matematic pentru verificare ipoteza statistica este necesar să se introducă o ipoteză matematică despre legea distribuției SW (modul parametric de construire a unui model).

Abordarea neparametrică a descrierii modelului matematic (SW nu are o lege de distribuție parametrică) este mai puțin precisă, dar are mai multe zonă largă aplicatii.

La fel ca și pentru probabilitatea unui eveniment aleatoriu, există doar două moduri de a-l găsi pentru legea distribuției CV. Fie construim o schemă a unui eveniment aleatoriu și găsim o expresie analitică (formulă) pentru calcularea probabilității (poate că cineva a făcut-o deja sau o va face pentru noi!), Sau va trebui să folosim un experiment și, pe baza frecvențele observațiilor, faceți câteva ipoteze (propuneți ipoteze) despre distribuția legii.

Desigur, pentru fiecare dintre distribuțiile „clasice”, această lucrare a fost făcută de mult timp - larg cunoscute și foarte des folosite în statistica aplicată sunt distribuțiile binomiale și polinomiale, distribuțiile geometrice și hipergeometrice, distribuțiile Pascal și Poisson, și multe altele.

Pentru aproape toate distribuțiile clasice, au fost imediat construite și publicate tabele statistice speciale, rafinate pe măsură ce acuratețea calculelor creștea. Fără a folosi multe volume din aceste tabele, fără a învăța cum să le folosești în ultimele două secole uz practic statisticile nu au fost posibile.

Astăzi situația s-a schimbat - nu este nevoie să stocați datele de calcul folosind formule (oricât de complicate ar fi acestea din urmă!), Timpul de utilizare a legii de distribuție pentru practică este redus la minute, sau chiar secunde. Deja acum există un număr suficient de diverse pachete de programe de calculator aplicate în aceste scopuri.

Dintre toate distribuțiile de probabilitate, există cele care sunt utilizate cel mai des în practică. Aceste distribuții au fost studiate în detaliu și proprietățile lor sunt bine cunoscute. Multe dintre aceste distribuții formează baza unor domenii întregi de cunoaștere, cum ar fi teoria cozilor, teoria fiabilității, controlul calității, teoria jocurilor etc.

Printre acestea, nu se poate decât să acorde atenție lucrărilor lui Poisson (1781-1840), care a dovedit o formă mai generală a legii numerelor mari decât cea a lui Jacob Bernoulli și, de asemenea, a aplicat pentru prima dată teoria probabilității la împușcare. Probleme. Numele lui Poisson este asociat cu una dintre legile distribuției, care joacă un rol important în teoria probabilității și în aplicațiile acesteia.

Această lucrare este dedicată acestei legi de distribuție. munca de curs. Vom vorbi direct despre lege, despre caracteristicile ei matematice, proprietăți speciale, legătura cu distribuția binomială. Se vor spune câteva cuvinte despre aplicarea practică și se vor da câteva exemple din practică.

Scopul rezumatului nostru este de a clarifica esența teoremelor de distribuție Bernoulli și Poisson.

Sarcina este de a studia și analiza literatura de specialitate pe tema eseului.

1. Distribuție binomială (distribuția Bernoulli)

Distribuție binomială (distribuția Bernoulli) - distribuția de probabilitate a numărului de apariții ale unui eveniment cu repetate teste independente, dacă probabilitatea de apariție a acestui eveniment în fiecare încercare este egală cu p (0

Se spune că SV X este distribuit conform legii Bernoulli cu parametrul p dacă ia valorile 0 și 1 cu probabilități pX(x)ºP(X=x) = pxq1-x; p+q=1; x=0,1.

Distribuție binomială apare în acele cazuri când se pune întrebarea: de câte ori apare un anumit eveniment într-o serie de un anumit număr de observații (experimente) independente efectuate în aceleași condiții.

Pentru comoditate și claritate, vom presupune că știm valoarea p - probabilitatea ca un vizitator care intră în magazin să fie cumpărător și (1 - p) = q - probabilitatea ca un vizitator care intră în magazin să nu fie cumpărător.

Dacă X este numărul de cumpărători de la numărul total n vizitatori, atunci probabilitatea ca printre n vizitatori să existe k cumpărători este

P(X= k) = , unde k=0,1,…n 1)

Formula (1) se numește formula Bernoulli. Cu un număr mare de încercări, distribuția binomială tinde să fie normală.

Testul Bernoulli este un experiment probabilistic cu două rezultate, care sunt de obicei numite „succes” (de obicei este notat cu simbolul 1) și „eșec” (respectiv, este notat cu 0). Probabilitatea de succes este de obicei notată cu litera p, eșecul - cu litera q; desigur q=1-p. Valoarea p se numește parametrul testului Bernoulli.

Variabile aleatoare binomiale, geometrice, Pascal și binomiale negative sunt obținute dintr-o secvență de încercări Bernoulli independente dacă această secvență se termină într-un fel sau altul, de exemplu, după a n-a încercare sau a x-a succes. Se obișnuiește să se folosească următoarea terminologie:

este parametrul trial Bernoulli (probabilitatea de succes într-o singură încercare);

– numărul de teste;

– numărul de succese;

- numărul de defecțiuni.

Variabila aleatoare binomială (m|n,p) este numărul m de succese în n încercări.

Variabila aleatoare geometrică G(m|p) este numărul m de încercări până la primul succes (inclusiv primul succes).

Variabila aleatorie Pascal C(m|x,p) este numărul m de încercări până la al X-lea succes (fără includere, desigur, al X-lea succes în sine).

Variabila aleatoare binomială negativă Y(m|x,p) este numărul m de eșecuri înainte de al x-lea succes (fără a include al x-lea succes).

Notă: uneori distribuția binomială negativă se numește pascal și invers.


Distribuția Poisson

2.1. Definiția legii Poisson

În multe probleme practice, trebuie să se ocupe de variabile aleatoare distribuite după o lege particulară, care se numește legea lui Poisson.

Considerăm o variabilă aleatoare discontinuă X, care poate lua numai valori întregi, nenegative: 0, 1, 2, … , m, … ; iar succesiunea acestor valori este teoretic nelimitată. Se spune că o variabilă aleatoare X este distribuită conform legii lui Poisson dacă probabilitatea ca aceasta să ia o anumită valoare m este exprimată prin formula:

unde a este o valoare pozitivă, numită parametrul legii Poisson.

Domeniul de distribuție variabilă aleatorie X, distribuit conform legii lui Poisson, arată astfel:

xm m
P.m e-a

2.2.Principalele caracteristici ale distribuției Poisson

În primul rând, să ne asigurăm că succesiunea probabilităților poate fi o serie de distribuție, adică. că suma tuturor probabilităților Pm este egală cu unu.

Folosim extinderea funcției ex din seria Maclaurin:

Se știe că această serie converge pentru orice valoare a lui x, prin urmare, luând x = a, obținem

prin urmare

Să definim principalele caracteristici - așteptarea și varianța matematică - ale unei variabile aleatoare X, distribuite conform legii Poisson. Așteptarea matematică a unei variabile aleatoare discrete este suma produselor tuturor valorilor sale posibile și probabilitățile acestora. Prin definiție, atunci când o variabilă aleatorie discretă ia un set numărabil de valori:

Primul termen al sumei (corespunzător cu m=0) este egal cu zero, prin urmare, însumarea poate fi începută de la m=1:

Astfel, parametrul a nu este altceva decât așteptarea matematică a unei variabile aleatoare X.

Dispersia unei variabile aleatoare X se numește așteptarea matematică a pătratului abaterii unei variabile aleatoare de la așteptarea ei matematică:

Cu toate acestea, este mai convenabil să îl calculați folosind formula:

Prin urmare, găsim mai întâi al doilea moment inițial al lui X:

Conform celor dovedite anterior

în afară de,

2.3 Caracteristici suplimentare ale distribuției Poisson

I. Momentul inițial de ordin k al unei variabile aleatoare X este așteptarea matematică a valorii Xk:

În special, momentul inițial de ordinul întâi este egal cu așteptarea matematică:

II. Momentul central de ordinul k al unei variabile aleatoare X este așteptarea matematică a valorii k:

În special, momentul central al ordinului 1 este 0:

μ1=M=0,

momentul central de ordinul 2 este egal cu dispersia:

μ2=M2=a.

III. Pentru o variabilă aleatoare X distribuită conform legii Poisson, găsim probabilitatea ca aceasta să ia o valoare nu mai mică decât un k dat. Notăm această probabilitate cu Rk:

Evident, probabilitatea Rk poate fi calculată ca sumă

Cu toate acestea, este mult mai ușor să o determinați din probabilitatea evenimentului opus:

În special, probabilitatea ca cantitatea X să ia o valoare pozitivă este exprimată prin formula

După cum sa menționat deja, multe probleme în practică duc la o distribuție Poisson. Luați în considerare una dintre problemele tipice de acest gen.

Fig.2

Punctele să fie distribuite aleatoriu pe axa x Ox (Fig. 2). Să presupunem că distribuție aleatorie punctele îndeplinesc următoarele condiții:

1) Probabilitatea ca unul sau alt număr de puncte să cadă pe segmentul l depinde numai de lungimea acestui segment, dar nu depinde de poziția lui pe axa x. Cu alte cuvinte, punctele sunt distribuite pe axa x cu aceeași densitate medie. Să notăm această densitate, i.e. așteptarea matematică a numărului de puncte pe unitatea de lungime, prin λ.

2) Punctele sunt distribuite pe axa x independent unele de altele, i.e. probabilitatea ca un anumit număr de puncte să cadă pe un anumit segment nu depinde de câte dintre ele cad pe orice alt segment care nu se suprapune cu acesta.

3) Probabilitatea ca două sau mai multe puncte să lovească o zonă mică Δх este neglijabil de mică în comparație cu probabilitatea de a lovi un punct (această condiție înseamnă că două sau mai multe puncte sunt practic imposibil să coincidă).

Să evidențiem un anumit segment de lungime l pe axa absciselor și să considerăm o variabilă aleatoare discretă X - numărul de puncte care se încadrează pe acest segment. Valorile posibile ale cantității vor fi 0,1,2,…,m,… această serie continuă la nesfârșit.

Să demonstrăm că variabila aleatoare X este distribuită conform legii Poisson. Pentru a face acest lucru, trebuie să calculăm probabilitatea Pm ca exact m puncte să cadă pe segment.

Mai întâi să rezolvăm mai multe o sarcină simplă. Luați în considerare o secțiune mică Δx pe axa Ox și calculați probabilitatea ca cel puțin un punct să cadă pe această secțiune. Vom argumenta după cum urmează. Valorea estimata numărul de puncte care se încadrează pe această secțiune este în mod evident egal cu λ·Δх (deoarece în medie λ puncte cad pe unitatea de lungime). Conform condiției 3, pentru un segment mic Δх, posibilitatea ca două sau mai multe puncte să cadă pe acesta poate fi neglijată. Prin urmare, așteptarea matematică λ·Δх a numărului de puncte care cad pe secțiunea Δх va fi aproximativ egală cu probabilitatea de a lovi un punct pe ea (sau, ceea ce este echivalent în aceste condiții, cel puțin unul).

Astfel, până la infinitezimal de ordin superior, la Δх→0, putem considera probabilitatea ca un (cel puțin un) punct să cadă pe locul Δх, egal cu λ·Δх, și probabilitatea ca niciunul să nu cadă, egală cu 1-c·Δх.

Să folosim aceasta pentru a calcula probabilitatea Pm ca exact m puncte să cadă pe segmentul l. Să împărțim segmentul l în n părți egale de lungime, să fim de acord să numim segmentul elementar Δx „gol” dacă nu include niciun punct și „ocupat” dacă cel puțin unul intră în el. Conform celor de mai sus, probabilitatea ca segmentul Δх să fie „ocupat” este aproximativ egală cu λ·Δх= ; probabilitatea ca acesta să fie „gol” este egală cu 1- . Deoarece, conform condiției 2, loviturile de puncte din segmentele care nu se suprapun sunt independente, atunci n segmentele noastre pot fi considerate n „experimente” independente, în fiecare dintre acestea segmentul poate fi „ocupat” cu probabilitatea p= . Să aflăm probabilitatea ca între n segmente să fie exact m „ocupat”. După teorema încercărilor independente repetate, această probabilitate este egală cu

,

sau notăm λl=a:

.

Pentru n suficient de mare, această probabilitate este aproximativ egală cu probabilitatea ca exact m puncte să cadă pe segmentul l, deoarece lovirea a două sau mai multe puncte pe segmentul Δx are o probabilitate neglijabilă. Pentru a găsi valoarea exactă a lui Pm, trebuie să mergem la limita ca n→∞:

Dat fiind

,

obţinem că probabilitatea dorită este exprimată prin formula

unde a=λl, adică mărimea X se distribuie conform legii Poisson cu parametrul a=λl.

Trebuie remarcat faptul că valoarea a în sensul este numărul mediu de puncte pe segment l. Valoarea lui R1 (probabilitatea ca valoarea lui X să ia o valoare pozitivă) în acest caz exprimă probabilitatea ca cel puțin un punct să cadă pe segmentul l: R1=1-e-a.

Astfel, ne-am asigurat că Distribuția Poisson apare acolo unde unele puncte (sau alte elemente) ocupă o poziție aleatorie independent unul de celălalt, iar numărul acestor puncte care se încadrează într-o anumită zonă este numărat. În cazul nostru, această zonă a fost segmentul l de pe axa x. Cu toate acestea, această concluzie poate fi extinsă cu ușurință la cazul distribuției punctelor în plan (câmp aleator plat de puncte) și în spațiu (câmp spațial aleator de puncte). Este ușor de demonstrat că dacă sunt îndeplinite următoarele condiții:

1) punctele sunt distribuite statistic uniform în câmpul cu o densitate medie λ;

2) punctele se încadrează în regiuni care nu se suprapun în mod independent;

3) punctele apar singure, nu în perechi, tripleți etc.,

atunci numărul de puncte X care se încadrează în orice zonă D (plată sau spațială) este distribuit conform legii Poisson:

,

unde a este numărul mediu de puncte care se încadrează în regiunea D.

Pentru carcasă plată a=SD λ, unde SD este aria regiunii D,

pentru a spațial = VD λ, unde VD este volumul regiunii D.

Pentru distribuția Poisson a numărului de puncte care se încadrează într-un segment sau zonă, condiția densității constante (λ=const) nu este esențială. Dacă sunt îndeplinite celelalte două condiții, atunci legea lui Poisson încă are loc, doar parametrul a din acesta capătă o expresie diferită: se obține nu prin simpla înmulțire a densității λ cu lungime, aria sau volum, ci prin integrarea densității variabile. pe un segment, zonă sau volum.

Distribuția Poisson joacă un rol important într-o serie de probleme din fizică, teoria comunicării, teoria fiabilității, teoria cozilor de așteptare etc. Peste tot unde un număr aleatoriu de unele evenimente (degradări radioactive, apeluri telefonice, defecțiuni ale echipamentelor, accidente etc.) pot avea loc într-un anumit timp.

Luați în considerare situația cea mai tipică în care apare distribuția Poisson. Lăsați unele evenimente (cumpărări din magazin) să aibă loc la momente aleatorii. Să determinăm numărul de apariții ale unor astfel de evenimente în intervalul de timp de la 0 la T.

Un număr aleatoriu de evenimente care au avut loc în timp de la 0 la T este distribuit conform legii Poisson cu parametrul l=aT, unde a>0 este un parametru de sarcină care reflectă frecvența medie a evenimentelor. Probabilitatea de a cumpăra k pe un interval de timp mare (de exemplu, o zi) va fi


Concluzie

În concluzie, aș dori să remarc că distribuția Poisson este o distribuție destul de comună și importantă care are aplicații atât în ​​teoria probabilităților și aplicațiile acesteia, cât și în statistica matematică.

Multe probleme practice se reduc în cele din urmă la distribuția Poisson. Proprietatea sa specială, care constă în egalitatea așteptărilor matematice și a varianței, este adesea folosită în practică pentru a decide dacă o variabilă aleatoare este distribuită conform legii lui Poisson sau nu.

De asemenea, important este faptul că legea lui Poisson face posibilă găsirea probabilităților unui eveniment în încercări independente repetate la în număr mare repetări de experiență și probabilitate unică mică.

Cu toate acestea, distribuția Bernoulli este folosită în practica calculelor economice, și în special în analiza sustenabilității, extrem de rar. Acest lucru se datorează atât dificultăților de calcul, cât și faptului că distribuția Bernoulli este pentru cantități discrete, și cu faptul că condițiile schemei clasice (independența, un număr numărabil de încercări, invarianța condițiilor care afectează posibilitatea unui eveniment) nu sunt întotdeauna îndeplinite în situații practice. Cercetări ulterioare în domeniul analizei schemei Bernoulli, efectuate în secolele XVIII-XIX. Laplace, Moivre, Poisson și alții au avut ca scop crearea posibilității utilizării schemei Bernoulli în cazul unui număr mare de teste care tind spre infinit.


Literatură

1. Wentzel E.S. Teoria probabilității. - M, „Școala superioară” 1998

2. Gmurman V.E. Ghid de rezolvare a problemelor de teoria probabilităților și statistică matematică. - M, „Școala superioară” 1998

3. Culegere de probleme de matematică pentru instituţiile de învăţământ superior. Ed. Efimova A.V. - M, Știință 1990

Distribuția binomială se aplică cazurilor în care a fost prelevat un eșantion de dimensiune fixă. Distribuția Poisson se referă la cazurile în care numărul de evenimente aleatoare are loc la o anumită lungime, zonă, volum sau timp, în timp ce parametrul determinant al distribuției este numărul mediu de evenimente , nu dimensiunea eșantionului Pși rata de succes R. De exemplu, numărul de neconformități dintr-o probă sau numărul de neconformități pe unitate de produs.

Distribuția probabilității pentru numărul de succese X are următoarea formă:

Sau putem spune că o variabilă aleatoare discretă X distribuit conform legii lui Poisson dacă valorile sale posibile sunt 0,1, 2, ...t, ...p, iar probabilitatea de apariție a unor astfel de valori este determinată de relația:

(14)

Unde m sau λ este o valoare pozitivă, numită parametrul distribuției Poisson.

Legea lui Poisson se aplică evenimentelor care apar „rar”, în timp ce posibilitatea unui alt succes (de exemplu, eșec) este continuă, constantă și nu depinde de numărul de succese sau eșecuri anterioare (când vine vorba de procese care se dezvoltă în timp, aceasta se numește „independență față de trecut”). Exemplul clasic în care se aplică legea lui Poisson este numărul de apeluri telefonice la o centrală telefonică într-un interval de timp dat. Alte exemple ar putea fi numărul de pete de cerneală pe o pagină a unui manuscris neglijent sau numărul de pete de pe caroseria unei mașini în timpul vopsirii. Legea distribuției Poisson măsoară numărul de defecte, nu numărul de produse defecte.

Distribuția Poisson respectă numărul de evenimente aleatoare care apar la intervale fixe de timp sau într-o regiune fixă ​​a spațiului, pentru λ<1 значение P(m) монотонно убывает с ростом m то, a при λ>1 valoare a lui P(m) cu creștere t trece printr-un maxim aproape de /

O caracteristică a distribuției Poisson este egalitatea varianței cu așteptările matematice. Parametrii distribuției Poisson

M(x) = σ 2 = λ (15)

Această caracteristică a distribuției Poisson ne permite să afirmăm în practică că distribuția obținută experimental a unei variabile aleatoare este supusă distribuției Poisson dacă valorile eșantionului așteptării și varianței matematice sunt aproximativ egale.

Legea evenimentelor rare se aplică în inginerie mecanică pentru eșantionare produse terminate când, conform condițiilor tehnice, este permis un anumit procent de defecte (de obicei mici) în lotul de produse acceptat q<<0.1.

Dacă probabilitatea q a evenimentului A este foarte mică (q≤0,1), iar numărul de încercări este mare, atunci probabilitatea ca evenimentul A să se producă de m ori în n încercări va fi egală cu



,

unde λ = M(x) = nq

Pentru a calcula distribuția Poisson, puteți utiliza următoarele relații de recurență

și (16)

Distribuția Poisson joacă un rol important în metodele statistice de asigurare a calității, deoarece poate fi utilizată pentru a aproxima distribuțiile hipergeometrice și binomiale.

O astfel de aproximare este admisibilă atunci când , cu condiția ca qn să aibă o limită finită și q<0.1. Когда n →∞, A p → 0, medie n p = t = const.

Folosind legea evenimentelor rare, puteți calcula probabilitatea ca un eșantion de n cele să conțină: 0,1,2,3 etc. piese defecte, de ex. dat de m ori. De asemenea, puteți calcula probabilitatea de apariție într-un astfel de eșantion de m bucăți de piese defecte și multe altele. Această probabilitate, bazată pe regula adunării probabilităților, va fi egală cu:

Exemplul 1. Lotul conține piese defecte, a căror proporție este de 0,1. 10 părți sunt luate și examinate secvenţial, după care sunt returnate în lot, adică. testele sunt independente. Care este probabilitatea ca la verificarea a 10 piese să apară una cu defecte?

Decizie Din condiția problemei q=0,1; n=10; m = 1. Evident, p=1-q=0,9.

Rezultatul obținut poate fi atribuit și cazului în care 10 părți sunt îndepărtate la rând fără a le întoarce înapoi în lot. Cu un lot suficient de mare, de exemplu, 1000 de bucăți, probabilitatea de extragere a pieselor se va schimba neglijabil. Prin urmare, în astfel de condiții, îndepărtarea unei piese defecte poate fi considerată ca un eveniment independent de rezultatele testelor anterioare.

Exemplul 2 Lotul conține 1% piese defecte. Care este probabilitatea ca, dacă dintr-un lot se ia o probă de 50 de unități, acesta să conțină 0, 1, 2, 3,4 piese defecte?

Decizie. Aici q=0,01, nq=50*0,01=0,5

Astfel, pentru a aplica efectiv distribuția Poisson ca aproximare a celei binomiale, este necesar ca probabilitatea de succes R a fost semnificativ mai mică q . A n p = t era de ordinul uneia (sau mai multor unități).

Astfel, în metodele statistice de asigurare a calității

legea hipergeometrică aplicabil pentru mostre de orice dimensiune P și orice nivel de inconsecvență q ,

legea binomială și legea lui Poisson sunt cazurile sale speciale, respectiv, cu condiția ca n/N<0,1 и

Cel mai general caz al diferitelor tipuri de distribuții de probabilitate este distribuția binomială. Să folosim universalitatea sa pentru a determina cele mai comune tipuri de distribuții întâlnite în practică.

Distribuție binomială

Să fie un eveniment A. Probabilitatea de apariție a evenimentului A este egală cu p, probabilitatea ca evenimentul A să nu se producă este 1 p, denumit uneori ca q. Lăsa n numărul de încercări, m frecvenţa de apariţie a evenimentului A în acestea n teste.

Se știe că probabilitatea totală a tuturor combinațiilor posibile de rezultate este egală cu unul, adică:

1 = p n + n · p n 1 (1 p) + C n n 2 · p n 2 (1 p) 2 + + C n m · p m(1 p) n – m+ + (1 p) n .

p n probabilitatea ca în nn o singura data;

n · p n 1 (1 p) probabilitatea ca în nn 1) o dată și nu se va întâmpla o dată;

C n n 2 · p n 2 (1 p) 2 probabilitatea ca în n teste, va avea loc evenimentul A ( n 2) ori și nu se va întâmpla de 2 ori;

P m = C n m · p m(1 p) n – m probabilitatea ca în n evenimentul A se va întâmpla m o dată și nu se va întâmpla n – m) o singura data;

(1 p) n probabilitatea ca în nîn încercări, evenimentul A nu va avea loc niciodată;

numărul de combinații de la n pe m .

Valorea estimata M distribuția binomială este:

M = n · p ,

Unde n numărul de încercări, p probabilitatea producerii evenimentului A .

Deviație standard σ :

σ = sqrt( n · p(1 p)) .

Exemplul 1 . Calculați probabilitatea ca un eveniment cu o probabilitate p= 0,5 in n= vor avea loc 10 încercări m= 1 dată. Avem: C 10 1 = 10 și mai departe: P 1 = 10 0,5 1 (1 0,5) 10 1 = 10 0,5 10 = 0,0098. După cum puteți vedea, probabilitatea ca acest eveniment să se producă este destul de mică. Acest lucru se explică, în primul rând, prin faptul că nu este absolut clar dacă evenimentul va avea loc sau nu, deoarece probabilitatea este de 0,5 și șansele aici sunt „50 la 50”; iar în al doilea rând, este necesar să se calculeze că evenimentul va avea loc exact o dată (nici mai mult, nici mai puțin) din zece.

Exemplul 2 . Calculați probabilitatea ca un eveniment cu o probabilitate p= 0,5 in n= vor avea loc 10 încercări m= de 2 ori. Avem: C 10 2 \u003d 45 și mai departe: P 2 = 45 0,5 2 (1 0,5) 10 2 = 45 0,5 10 = 0,044. Probabilitatea acestui eveniment a crescut!

Exemplul 3 . Să creștem probabilitatea apariției evenimentului în sine. Să facem mai probabil. Calculați probabilitatea ca un eveniment cu o probabilitate p= 0,8 in n= vor avea loc 10 încercări m= 1 dată. Avem: C 10 1 = 10 și mai departe: P 1 = 10 0,8 1 (1 0,8) 10 1 = 10 0,8 1 0,2 9 = 0,000004. Probabilitatea a devenit mai mică decât în ​​primul exemplu! Răspunsul, la prima vedere, pare ciudat, dar din moment ce evenimentul are o probabilitate suficient de mare, este puțin probabil să se producă o singură dată. Este mai probabil să se întâmple de mai multe ori, de câte ori. Într-adevăr, numărând P 0 , P 1 , P 2 , P 3, ½, P 10 (probabilitatea ca un eveniment în n= 10 încercări vor avea loc de 0, 1, 2, 3, , de 10 ori), vom vedea:

C 10 0 = 1 , C 10 1 = 10 , C 10 2 = 45 , C 10 3 = 120 , C 10 4 = 210 , C 10 5 = 252 ,
C 10 6 = 210 , C 10 7 = 120 , C 10 8 = 45 , C 10 9 = 10 , C 10 10 = 1 ;

P 0 = 1 0,8 0 (1 0,8) 10 0 = 1 1 0,2 10 = 0,0000;
P 1 = 10 0,8 1 (1 0,8) 10 1 = 10 0,8 1 0,2 9 = 0,0000;
P 2 = 45 0,8 2 (1 0,8) 10 2 = 45 0,8 2 0,2 ​​8 = 0,0000;
P 3 = 120 0,8 3 (1 0,8) 10 3 = 120 0,8 3 0,2 7 = 0,0008;
P 4 = 210 0,8 4 (1 0,8) 10 4 = 210 0,8 4 0,2 6 = 0,0055;
P 5 = 252 0,8 5 (1 0,8) 10 5 = 252 0,8 5 0,2 5 = 0,0264;
P 6 = 210 0,8 6 (1 0,8) 10 6 = 210 0,8 6 0,2 4 = 0,0881;
P 7 = 120 0,8 7 (1 0,8) 10 7 = 120 0,8 7 0,2 3 = 0,2013;
P 8 = 45 0,8 8 (1 0,8) 10 8 = 45 0,8 8 0,2 2 = 0,3020(cel mai probabil!);
P 9 = 10 0,8 9 (1 0,8) 10 9 = 10 0,8 9 0,2 1 = 0,2684;
P 10 = 1 0,8 10 (1 0,8) 10 10 = 1 0,8 10 0,2 0 = 0,1074

Desigur P 0 + P 1 + P 2 + P 3 + P 4 + P 5 + P 6 + P 7 + P 8 + P 9 + P 10 = 1 .

Distributie normala

Dacă reprezentăm cantitățile P 0 , P 1 , P 2 , P 3, ½, P 10 , pe care l-am calculat în exemplul 3, pe grafic, rezultă că distribuția lor are o formă apropiată de legea distribuției normale (vezi Fig. 27.1) (vezi prelegerea 25. Modelarea variabilelor aleatoare distribuite normal).

Orez. 27.1. Tip de distribuție binomială
probabilități pentru diverse m la p = 0,8, n = 10

Legea binomială devine normală dacă probabilitățile de apariție și de neapariție a evenimentului A sunt aproximativ aceleași, adică condiționat putem scrie: p≈ (1 p) . De exemplu, să luăm n= 10 și p= 0,5 (adică p= 1 p = 0.5 ).

La o astfel de problemă vom ajunge într-un mod semnificativ dacă, de exemplu, vrem să calculăm teoretic câți băieți și câte fete vor fi din 10 copii născuți în maternitate în aceeași zi. Mai exact, vom lua în considerare nu băieți și fete, ci probabilitatea ca să se nască numai băieți, să se nască 1 băiat și 9 fete, să se nască 2 băieți și 8 fete etc. Pentru simplitate, vom presupune că probabilitatea de a avea un băiat și o fată este aceeași și este egală cu 0,5 (dar de fapt, să fiu sincer, nu este cazul, vezi cursul „Modelarea sistemelor de inteligență artificială”).

Este clar că distribuția va fi simetrică, deoarece probabilitatea de a avea 3 băieți și 7 fete este egală cu probabilitatea de a avea 7 băieți și 3 fete. Cea mai mare probabilitate de naștere va fi la 5 băieți și 5 fete. Această probabilitate este egală cu 0,25, apropo, nu este atât de mare în valoare absolută. În plus, probabilitatea ca 10 sau 9 băieți să se nască deodată este mult mai mică decât probabilitatea ca 5 ± 1 băiat din 10 copii să se nască. Doar distribuția binomială ne va ajuta să facem acest calcul. Asa de.

C 10 0 = 1 , C 10 1 = 10 , C 10 2 = 45 , C 10 3 = 120 , C 10 4 = 210 , C 10 5 = 252 ,
C 10 6 = 210 , C 10 7 = 120 , C 10 8 = 45 , C 10 9 = 10 , C 10 10 = 1 ;

P 0 = 1 0,5 0 (1 0,5) 10 0 = 1 1 0,5 10 = 0,000977;
P 1 = 10 0,5 1 (1 0,5) 10 1 = 10 0,5 10 = 0,009766;
P 2 = 45 0,5 2 (1 0,5) 10 2 = 45 0,5 10 = 0,043945;
P 3 = 120 0,5 3 (1 0,5) 10 3 = 120 0,5 10 = 0,117188;
P 4 = 210 0,5 4 (1 0,5) 10 4 = 210 0,5 10 = 0,205078;
P 5 = 252 0,5 5 (1 0,5) 10 5 = 252 0,5 10 = 0,246094;
P 6 = 210 0,5 6 (1 0,5) 10 6 = 210 0,5 10 = 0,205078;
P 7 = 120 0,5 7 (1 0,5) 10 7 = 120 0,5 10 = 0,117188;
P 8 = 45 0,5 8 (1 0,5) 10 8 = 45 0,5 10 = 0,043945;
P 9 = 10 0,5 9 (1 0,5) 10 9 = 10 0,5 10 = 0,009766;
P 10 = 1 0,5 10 (1 0,5) 10 10 = 1 0,5 10 = 0,000977

Desigur P 0 + P 1 + P 2 + P 3 + P 4 + P 5 + P 6 + P 7 + P 8 + P 9 + P 10 = 1 .

Vom reflecta pe grafic valorile P 0 , P 1 , P 2 , P 3, ½, P 10 (vezi fig. 27.2).

Orez. 27.2. Graficul de distribuție binomială sub parametri
p = 0,5 și n = 10, apropiindu-l de legea normală

Deci, în condiții mn/2 și p≈ 1 p sau p≈ 0,5 în loc de distribuția binomială, o puteți folosi pe cea normală. Pentru valori mari n graficul se deplasează la dreapta și devine mai plat pe măsură ce media și varianța cresc odată cu creșterea n : M = n · p , D = n · p(1 p) .

Apropo, legea binomului tinde spre normal și cu creștere n, ceea ce este destul de firesc, conform teoremei limitei centrale (vezi cursul 34. Fixarea și prelucrarea rezultatelor statistice).

Acum luați în considerare cum se schimbă legea binomială în cazul în care pq, acesta este p> 0 . În acest caz, ipoteza normalității distribuției nu poate fi aplicată, iar distribuția binomială se transformă în distribuția Poisson.

Distribuția Poisson

Distribuția Poisson este un caz special al distribuției binomiale (când n>> 0 și la p> 0 (evenimente rare)).

Din matematică, se știe o formulă care vă permite să calculați aproximativ valoarea oricărui membru al distribuției binomiale:

Unde A = n · p Parametrul Poisson (așteptările matematice), iar varianța este egală cu așteptarea matematică. Să prezentăm calcule matematice care explică această tranziție. Legea distribuției binomiale

P m = C n m · p m(1 p) n – m

poate fi scris dacă punem p = A/n , la fel de

La fel de p foarte mic, trebuie luate în considerare doar cifrele m, mic comparativ cu n. Muncă

foarte aproape de unitate. Același lucru este valabil și pentru dimensiune

Valoare

foarte aproape de e – A. De aici obținem formula:

Exemplu. În cutie este n= 100 de piese, atât bune, cât și defecte. Probabilitatea de a obține un produs defect este p= 0,01. Să presupunem că scoatem produsul, stabilim dacă este defect sau nu și îl punem înapoi. Procedând astfel, s-a dovedit că din 100 de articole pe care le-am rezolvat, două s-au dovedit a fi defecte. Care este probabilitatea asta?

Conform distribuției binomiale, obținem:

Conform distribuției Poisson, obținem:

După cum se poate observa, valorile s-au dovedit a fi apropiate, prin urmare, în cazul unor evenimente rare, este destul de acceptabil să se aplice legea Poisson, mai ales că necesită mai puțin efort de calcul.

Arătăm grafic forma legii lui Poisson. Să luăm parametrii ca exemplu. p = 0.05 , n= 10 . Apoi:

C 10 0 = 1 , C 10 1 = 10 , C 10 2 = 45 , C 10 3 = 120 , C 10 4 = 210 , C 10 5 = 252 ,
C 10 6 = 210 , C 10 7 = 120 , C 10 8 = 45 , C 10 9 = 10 , C 10 10 = 1 ;

P 0 = 1 0,05 0 (1 0,05) 10 0 = 1 1 0,95 10 = 0,5987;
P 1 = 10 0,05 1 (1 0,05) 10 1 = 10 0,05 1 0,95 9 = 0,3151;
P 2 = 45 0,05 2 (1 0,05) 10 2 = 45 0,05 2 0,95 8 = 0,0746;
P 3 = 120 0,05 3 (1 0,05) 10 3 = 120 0,05 3 0,95 7 = 0,0105;
P 4 = 210 0,05 4 (1 0,05) 10 4 = 210 0,05 4 0,95 6 = 0,00096;
P 5 = 252 0,05 5 (1 0,05) 10 5 = 252 0,05 5 0,95 5 = 0,00006;
P 6 = 210 0,05 6 (1 0,05) 10 6 = 210 0,05 6 0,95 4 = 0,0000;
P 7 = 120 0,05 7 (1 0,05) 10 7 = 120 0,05 7 0,95 3 = 0,0000;
P 8 = 45 0,05 8 (1 0,05) 10 8 = 45 0,05 8 0,95 2 = 0,0000;
P 9 = 10 0,05 9 (1 0,05) 10 9 = 10 0,05 9 0,95 1 = 0,0000;
P 10 = 1 0,05 10 (1 0,05) 10 10 = 1 0,05 10 0,95 0 = 0,0000

Desigur P 0 + P 1 + P 2 + P 3 + P 4 + P 5 + P 6 + P 7 + P 8 + P 9 + P 10 = 1 .

Orez. 27.3. Graficul de distribuție Poisson la p = 0,05 și n = 10

La n> ∞ distribuția Poisson devine normală conform teoremei limitei centrale (vezi

Luați în considerare distribuția Poisson, calculați așteptarea, varianța, modul ei matematic. Folosind funcția MS EXCEL POISSON.DIST(), reprezentăm graficul funcției de distribuție și al densității probabilității. Să estimăm parametrul de distribuție, așteptările sale matematice și abaterea standard.

În primul rând, dăm o definiție formală a distribuției, apoi dăm exemple de situații în care Distribuția Poisson(Engleză) Poissondistributie) este un model adecvat pentru descrierea unei variabile aleatoare.

Dacă evenimente aleatorii au loc într-o anumită perioadă de timp (sau într-un anumit volum de materie) cu o frecvență medie λ( lambda), apoi numărul de evenimente X, survenite în această perioadă de timp vor avea Distribuția Poisson.

Aplicarea distribuției Poisson

Exemple când Distribuția Poisson este un model adecvat:

  • numărul de apeluri primite de centrala telefonică pentru o anumită perioadă de timp;
  • numărul de particule care au suferit dezintegrare radioactivă într-o anumită perioadă de timp;
  • numărul de defecte dintr-o bucată de țesătură de lungime fixă.

Distribuția Poisson este un model adecvat dacă sunt îndeplinite următoarele condiții:

  • evenimentele au loc independent unul de celălalt, adică probabilitatea unui eveniment ulterior nu depinde de cel precedent;
  • frecvența medie a evenimentelor este constantă. În consecință, probabilitatea unui eveniment este proporțională cu lungimea intervalului de observație;
  • două evenimente nu pot avea loc în același timp;
  • numărul de evenimente trebuie să ia valoarea 0; 1; 2…

Notă: Un indiciu bun pe care îl are variabila aleatoare observată distribuția poissonului, este faptul că aproximativ egal (vezi mai jos).

Următoarele sunt exemple de situații în care Distribuția Poisson nu poti a fi aplicat:

  • numărul de studenți care părăsesc universitatea în decurs de o oră (deoarece fluxul mediu de studenți nu este constant: sunt puțini studenți în timpul orelor, iar numărul studenților crește brusc între ore);
  • numărul de cutremure cu o amplitudine de 5 puncte pe an în California (deoarece un cutremur poate provoca șocuri repetate de o amplitudine similară - evenimentele nu sunt independente);
  • numărul de zile petrecătoare de pacienți în secția de terapie intensivă (deoarece numărul de zile petrecute în secția de terapie intensivă este întotdeauna mai mare de 0).

Notă: Distribuția Poisson este o aproximare a mai precisă distribuții discrete: și .

Notă: Despre relație Distribuția Poissonși Distribuție binomială poate fi citit in articol. Despre relație Distribuția Poissonși Distribuție exponențială poate fi găsit în articolul despre .

Distribuția Poisson în MS EXCEL

În MS EXCEL, începând cu versiunea 2010, pt Distribuții Poisson există o funcție POISSON.DIST() , nume englezesc- POISSON.DIST(), care vă permite să calculați nu numai probabilitatea ca într-o anumită perioadă de timp să se întâmple X evenimente (funcția probabilitate densitate p(x), vezi formula de mai sus), dar și (probabilitatea ca într-o anumită perioadă de timp cel puțin X evenimente).

Înainte de MS EXCEL 2010, EXCEL avea funcția POISSON(), care vă permite, de asemenea, să calculați funcția de distribuțieși probabilitate densitate p(x). POISSON() este lăsat în MS EXCEL 2010 pentru compatibilitate.

Fișierul exemplu conține grafice densitatea distribuției de probabilitateși funcția de distribuție integrală.

Distribuția Poisson are o formă înclinată (o coadă lungă în dreapta funcției de probabilitate), dar pe măsură ce parametrul λ crește, devine din ce în ce mai simetric.

Notă: In medieși dispersie(pătrat) sunt egale cu parametrul Distribuția Poisson– λ (vezi fișă de fișier exemplu Exemplu).

O sarcină

Aplicație tipică Distribuții Poissonîn controlul calității, este un model al numărului de defecte care pot apărea într-un dispozitiv sau dispozitiv.

De exemplu, dacă numărul mediu de defecte dintr-un cip λ (lambda) este 4, probabilitatea ca un cip selectat aleatoriu să aibă 2 sau mai puține defecte este egală cu: = POISSON.DIST(2,4,TRUE)=0,2381

Al treilea parametru din funcție este setat = TRUE, deci funcția va reveni funcția de distribuție integrală, adică probabilitatea ca numărul de evenimente aleatoare să fie în intervalul de la 0 la 4 inclusiv.

Calculele în acest caz se fac după formula:

Probabilitatea ca un cip selectat aleatoriu să aibă exact 2 defecte este: POISSON.DIST(2,4,FALSE)=0,1465

Al treilea parametru din funcție este setat = FALSE, deci funcția va returna densitatea probabilității.

Probabilitatea ca un cip selectat aleatoriu să aibă mai mult de 2 defecte este egală cu: \u003d 1-POISSON.DIST (2, 4, TRUE) \u003d 0,8535

Notă: Dacă X nu este un număr întreg, atunci când se calculează formula . Formule =POISSON.DIST( 2 ; patru; MINCIUT)și =POISSON.DIST( 2,9 ; patru; MINCIUT) va returna acelasi rezultat.

Generarea numerelor aleatoare și estimarea λ

Pentru valorile λ >15 , Distribuția Poisson bine aproximat distributie normala cu următorii parametri: μ , σ 2 .

Puteți citi mai multe despre relația dintre aceste distribuții în articol. Acolo sunt date și exemple de aproximare, iar condițiile sunt explicate când este posibil și cu ce precizie.

SFAT: Puteți citi despre alte distribuții ale MS EXCEL în articol.

Unde λ este egal cu numărul mediu de apariții ale evenimentelor în aceleași încercări independente, i.e. λ = n × p, unde p este probabilitatea unui eveniment într-o încercare, e = 2,71828 .

Seria de distribuție a legii lui Poisson are forma:


Atribuirea serviciului. Calculatorul online este folosit pentru a construi distribuția Poisson și a calcula toate caracteristicile seriei: așteptare matematică, varianță și abatere standard. Procesul-verbal cu decizia se intocmeste in format Word.
Număr de încercări: n= , Probabilitatea p =
Calculați probabilitatea pentru: m =
va veni o singura data
Mai puțin o singura data
macar o singura data
Mai mult o singura data
nu mai o singura data
macar si nu mai mult o singura data
vino măcar o dată
În cazul în care n este mare și λ = p n > 10, formula Poisson oferă o aproximare foarte grosieră și teoremele Moivre-Laplace locale și integrale sunt utilizate pentru a calcula P n (m).

Caracteristicile numerice ale unei variabile aleatoare X

Așteptările matematice ale distribuției Poisson
M[X] = λ

Varianta distribuției Poisson
D[X] = λ

Exemplul #1. Semințele conțin 0,1% buruieni. Care este probabilitatea de a găsi 5 semințe de buruieni într-o selecție aleatorie de 2000 de semințe?
Decizie.
Probabilitatea p este mică, iar numărul n este mare. np = 2 P(5) = λ 5 e -5 /5! = 0,03609
Valorea estimata: M[X] = λ = 2
Dispersia: D[X] = λ = 2

Exemplul #2. Există 0,4% semințe de buruieni printre semințele de secară. Întocmește legea de distribuție a numărului de buruieni cu o selecție aleatorie de 5000 de semințe. Găsiți așteptările matematice și varianța acestei variabile aleatoare.
Decizie. Așteptări: M[X] = λ = 0,004*5000 = 20. Varianta: D[X] = λ = 20
Legea distributiei:

X0 1 2 m
Pe-2020e-20200e-2020 de metri -20 / metri!

Exemplul #3. La centrala telefonică apare o conexiune incorectă cu o probabilitate de 1/200. Găsiți probabilitatea ca între 200 de conexiuni să existe:
a) exact o conexiune greșită;
b) mai puțin de trei conexiuni incorecte;
c) mai mult de două conexiuni incorecte.
Decizie.În funcție de starea problemei, probabilitatea unui eveniment este mică, așa că folosim formula Poisson (15).
a) Având în vedere: n = 200, p = 1/200, k = 1. Aflați P 200 (1).
Primim: . Atunci P 200 (1) ≈ e -1 ≈ 0,3679.
b) Având în vedere: n = 200, p = 1/200, k< 3. Найдем P 200 (k < 3).
Avem: a = 1.

c) Având în vedere: n = 200, p = 1/200, k > 2. Aflați P 200 (k > 2).
Această problemă poate fi rezolvată mai simplu: pentru a găsi probabilitatea evenimentului opus, deoarece în acest caz trebuie să calculați mai puțini termeni. Ținând cont de cazul anterior, avem

Luați în considerare cazul în care n este suficient de mare și p este suficient de mic; punem np = a, unde a este un număr. În acest caz, probabilitatea dorită este determinată de formula Poisson:


Probabilitatea de apariție a k evenimente într-un timp cu durata t poate fi găsită și folosind formula Poisson:
unde λ este intensitatea fluxului de evenimente, adică numărul mediu de evenimente care apar pe unitatea de timp.

Exemplul #4. Probabilitatea ca o piesă să fie defectă este de 0,005. Sunt verificate 400 de piese. Specificați formula pentru calcularea probabilității ca mai mult de 3 părți să fie defecte.

Exemplul numărul 5. Probabilitatea apariției pieselor defecte în producția lor în masă este egală cu p. determinați probabilitatea ca un lot de N părți să conțină a) exact trei părți; b) nu mai mult de trei piese defecte.
p=0,001; N=4500
Decizie.
Probabilitatea p este mică, iar numărul n este mare. np = 4,5< 10. Значит случайная величина Х – распределена по Пуассоновскому распределению. Составим закон.
Variabila aleatoare X are intervalul (0,1,2,...,m). Probabilitățile acestor valori pot fi găsite prin formula:

Să găsim seria de distribuție X.
Aici λ = np = 4500*0,001 = 4,5
P(0) = e - λ = e -4,5 = 0,01111
P(1) = λe -λ = 4,5e -4,5 = 0,04999

Atunci probabilitatea ca un lot de N părți să conțină exact trei părți este egală cu:

Atunci probabilitatea ca un lot de N părți să nu conțină mai mult de trei părți defecte este:
P(x<3) = P(0) + P(1) + P(2) = 0,01111 + 0,04999 + 0,1125 = 0,1736

Exemplul numărul 6. O centrală telefonică automată primește, în medie, N apeluri pe oră. Determinați probabilitatea ca într-un minut dat să primească: a) exact două apeluri; b) mai mult de două apeluri.
N = 18
Decizie.
Într-un minut, ATS primește în medie λ = 18/60 min. = 0,3
Presupunând că un număr aleatoriu X de apeluri primite la PBX într-un minut,
respectă legea lui Poisson, prin formula găsim probabilitatea necesară

Să găsim seria de distribuție X.
Aici λ = 0,3
P(0) = e - λ = e -0,3 = 0,7408
P(1) = λe -λ = 0,3e -0,3 = 0,2222

Probabilitatea ca ea să primească exact două apeluri într-un minut dat este:
P(2) = 0,03334
Probabilitatea ca ea să primească mai mult de două apeluri într-un minut dat este:
P(x>2) = 1 - 0,7408 - 0,2222 - 0,03334 = 0,00366

Exemplul numărul 7. Luăm în considerare două elemente care funcționează independent unul de celălalt. Durata timpului de funcționare are o distribuție exponențială cu parametrul λ1 = 0,02 pentru primul element și λ2 = 0,05 pentru al doilea element. Aflați probabilitatea ca în 10 ore: a) ambele elemente să funcționeze impecabil; b) numai Probabilitatea ca elementul #1 să nu eșueze în 10 ore:
Soluţie.
P 1 (0) \u003d e -λ1 * t \u003d e -0,02 * 10 \u003d 0,8187

Probabilitatea ca elementul #2 să nu eșueze în 10 ore este:
P 2 (0) \u003d e -λ2 * t \u003d e -0,05 * 10 \u003d 0,6065

a) ambele elemente vor funcționa impecabil;
P(2) = P 1 (0)*P 2 (0) = 0,8187*0,6065 = 0,4966
b) un singur element va eșua.
P(1) = P 1 (0)*(1-P 2 (0)) + (1-P 1 (0))*P 2 (0) = 0,8187*(1-0,6065) + (1-0,8187) *0,6065 = 0,4321

Exemplul numărul 7. Producția dă 1% din căsătorie. Care este probabilitatea ca din 1100 de produse luate pentru cercetare, nu mai mult de 17 să fie respinse?
Notă: deoarece aici n*p =1100*0.01=11 > 10, este necesar să folosiți



eroare: Conținutul este protejat!!