Legea distribuției binomiale. Distribuție binomială

Salutări tuturor cititorilor!

Analiza statistică, după cum știți, se ocupă de colectarea și prelucrarea datelor reale. Este util, și adesea profitabil, pentru că. concluziile corecte vă permit să evitați greșelile și pierderile în viitor și, uneori, să ghiciți corect acest viitor. Datele colectate reflectă starea unor fenomene observate. Datele sunt adesea (dar nu întotdeauna) numerice și pot fi manipulate cu diverse manipulări matematice pentru a extrage informații suplimentare.

Cu toate acestea, nu toate fenomenele sunt măsurate pe o scară cantitativă precum 1, 2, 3 ... 100500 ... Nu întotdeauna un fenomen poate lua un infinit sau un număr mare de stări diferite. De exemplu, genul unei persoane poate fi fie M, fie F. trăgătorul fie lovește ținta, fie ratează. Puteți vota fie „pentru”, fie „împotrivă”, etc. etc. Cu alte cuvinte, astfel de date reflectă starea unui atribut alternativ - fie „da” (evenimentul a avut loc), fie „nu” (evenimentul nu a avut loc). Evenimentul care urmează (rezultat pozitiv) se mai numește și „succes”. Astfel de fenomene pot fi, de asemenea, masive și întâmplătoare. Prin urmare, ele pot fi măsurate și se pot trage concluzii valide statistic.

Se numesc experimente cu astfel de date Schema Bernoulli, în onoarea celebrului matematician elvețian care a stabilit că atunci când în număr mare studii, raportul dintre rezultatele pozitive și numărul total de încercări tinde la probabilitatea ca acest eveniment să apară.

Variabilă alternativă de caracteristică

Pentru a utiliza aparatul matematic în analiză, rezultatele acestor observații trebuie notate în formă numerică. Pentru a face acest lucru, unui rezultat pozitiv i se atribuie numărul 1, unul negativ - 0. Cu alte cuvinte, avem de-a face cu o variabilă care poate lua doar două valori: 0 sau 1.

Ce beneficii se poate obține din asta? De fapt, nu mai puțin decât din date obișnuite. Deci, este ușor să numărăm numărul de rezultate pozitive - este suficient să însumăm toate valorile, de exemplu. toate 1 (succes). Puteți merge mai departe, dar pentru aceasta trebuie să introduceți câteva notații.

Primul lucru de remarcat este că rezultatele pozitive (care sunt egale cu 1) au o anumită probabilitate de a apărea. De exemplu, obținerea capetelor la aruncarea unei monede este ½ sau 0,5. Această probabilitate este indicată în mod tradițional Literă latină p. Prin urmare, probabilitatea ca un eveniment alternativ să se producă este 1-p, care se notează și prin q, acesta este q = 1 – p. Aceste denumiri pot fi sistematizate vizual sub forma unei plăci de distribuție variabilă X.

Acum avem o listă de valori posibile și probabilitățile acestora. Puteți începe să calculați astfel de caracteristici minunate ale unei variabile aleatorii ca valorea estimatași dispersie. Permiteți-mi să vă reamintesc că așteptarea matematică este calculată ca suma produselor tuturor valorilor posibile și probabilitățile lor corespunzătoare:

Să calculăm valoarea așteptată folosind notația din tabelele de mai sus.

Se pare că așteptarea matematică a unui semn alternativ este egală cu probabilitatea acestui eveniment - p.

Acum să definim care este varianța unei caracteristici alternative. Permiteți-mi să vă reamintesc, de asemenea, că varianța este pătratul mediu al abaterilor de la așteptări matematice. Formula generala(pentru date discrete) are forma:

De aici variația caracteristicii alternative:

Este ușor de observat că această dispersie are un maxim de 0,25 (at p=0,5).

Abaterea standard - rădăcina varianței:

Valoarea maximă nu depășește 0,5.

După cum puteți vedea, atât așteptarea matematică, cât și varianța semnului alternativ au o formă foarte compactă.

Distribuția binomială a unei variabile aleatoare

Acum luați în considerare situația dintr-un unghi diferit. Într-adevăr, cui îi pasă că pierderea medie de capete la o aruncare este de 0,5? Este chiar imposibil de imaginat. Este mai interesant să ridicăm problema numărului de capete care apar pentru un anumit număr de aruncări.

Cu alte cuvinte, cercetătorul este adesea interesat de probabilitatea ca un anumit număr de evenimente de succes să aibă loc. Acesta poate fi numărul de produse defecte din lotul testat (1 - defect, 0 - bun) sau numărul de recuperări (1 - sănătos, 0 - bolnav), etc. Numărul de astfel de „reușite” va fi egal cu suma tuturor valorilor variabilei X, adică numărul de rezultate unice.

Valoare aleatoare B se numește binom și ia valori de la 0 la n(la B= 0 - toate părțile sunt bune, cu B = n- toate piesele sunt defecte). Se presupune că toate valorile X independente unele de altele. Luați în considerare principalele caracteristici ale variabilei binomiale, adică vom stabili așteptările matematice, varianța și distribuția acesteia.

Așteptarea unei variabile binomiale este foarte ușor de obținut. Amintiți-vă că există o sumă de așteptări matematice pentru fiecare valoare adăugată și este aceeași pentru toată lumea, prin urmare:

De exemplu, așteptarea numărului de capete la 100 de aruncări este 100 × 0,5 = 50.

Acum derivăm formula pentru varianța variabilei binomiale. este suma varianțelor. De aici

Abaterea standard, respectiv

Pentru 100 de aruncări de monede, abaterea standard este

Și, în final, luați în considerare distribuția mărimii binomiale, i.e. probabilitatea ca valoare aleatorie B va lua diverse sensuri k, Unde 0≤k≤n. Pentru o monedă, această problemă ar putea suna așa: care este probabilitatea de a obține 40 de capete în 100 de aruncări?

Pentru a înțelege metoda de calcul, să ne imaginăm că moneda este aruncată doar de 4 ori. Oricare parte poate cădea de fiecare dată. Ne întrebăm: care este probabilitatea de a obține 2 capete din 4 aruncări. Fiecare aruncare este independentă una de cealaltă. Aceasta înseamnă că probabilitatea de a obține orice combinație va fi egală cu produsul dintre probabilitățile unui rezultat dat pentru fiecare aruncare individuală. Fie O capete și P cozi. Atunci, de exemplu, una dintre combinațiile care ni se potrivesc poate arăta ca OOPP, adică:

Probabilitatea unei astfel de combinații este egală cu produsul a două probabilități de a obține cap și a încă două probabilități de a nu apărea (evenimentul invers calculat ca 1-p), adică 0,5×0,5×(1-0,5)×(1-0,5)=0,0625. Aceasta este probabilitatea uneia dintre combinațiile care ni se potrivesc. Dar întrebarea era despre numărul total de vulturi, și nu despre o anumită ordine. Apoi trebuie să adăugați probabilitățile tuturor combinațiilor în care există exact 2 vulturi. Este clar că toate sunt la fel (produsul nu se schimbă de la schimbarea locurilor factorilor). Prin urmare, trebuie să calculați numărul lor și apoi să înmulțiți cu probabilitatea unei astfel de combinații. Să numărăm toate combinațiile de 4 aruncări a 2 vulturi: RROO, RORO, ROOR, ORRO, OROR, OORR. Doar 6 variante.

Prin urmare, probabilitatea dorită de a obține 2 capete după 4 aruncări este 6×0,0625=0,375.

Cu toate acestea, numărarea în acest fel este plictisitoare. Deja pentru 10 monede, va fi foarte dificil să obțineți numărul total de opțiuni prin forță brută. Prin urmare, oamenii inteligenți au inventat cu mult timp în urmă o formulă, cu ajutorul căreia calculează numărul de combinații diferite de n elemente prin k, Unde n este numărul total de elemente, k este numărul de elemente ale căror opțiuni de aranjare sunt calculate. Formula combinată a n elemente prin k este:

Lucruri similare au loc în secțiunea de combinatorie. Trimit acolo pe toți cei care doresc să-și îmbunătățească cunoștințele. De aici, apropo, numele distribuției binomiale (formula de mai sus este coeficientul de expansiune al binomului Newton).

Formula pentru determinarea probabilității poate fi generalizată cu ușurință la orice număr nși k. Ca rezultat, formula de distribuție binomială are următoarea formă.

Cu alte cuvinte: înmulțiți numărul de combinații potrivite cu probabilitatea uneia dintre ele.

Pentru uz practic este suficient doar să cunoaștem formula distribuției binomiale. Și poate nici nu știți - mai jos este cum să determinați probabilitatea folosind Excel. Dar e mai bine să știi.

Să folosim această formulă pentru a calcula probabilitatea de a obține 40 de capete în 100 de aruncări:

Sau doar 1,08%. Pentru comparație, probabilitatea așteptării matematice a acestui experiment, adică 50 de capete, este de 7,96%. Probabilitatea maximă a unei valori binomiale aparține valorii corespunzătoare așteptării matematice.

Calcularea probabilităților de distribuție binomială în Excel

Dacă utilizați doar hârtie și un calculator, atunci calculele folosind formula de distribuție binomială, în ciuda absenței integralelor, sunt destul de dificile. De exemplu, o valoare de 100! - are mai mult de 150 de caractere. Este imposibil să calculați acest lucru manual. Anterior, și chiar acum, se foloseau formule aproximative pentru a calcula astfel de cantități. În acest moment, este recomandabil să folosiți software special, precum MS Excel. Astfel, orice utilizator (chiar și un umanist de educație) poate calcula cu ușurință probabilitatea valorii unei variabile aleatoare distribuite binomial.

Pentru a consolida materialul, vom folosi Excel deocamdată ca un calculator obișnuit, adică. Să facem un calcul pas cu pas folosind formula de distribuție binomială. Să calculăm, de exemplu, probabilitatea de a obține 50 de capete. Mai jos este o poză cu pașii de calcul și rezultatul final.

După cum puteți vedea, rezultatele intermediare sunt de o asemenea scară încât nu se potrivesc într-o celulă, deși funcții simple de tipul sunt folosite peste tot: FACTOR (calcul factorial), POWER (ridicarea unui număr la o putere), precum și ca operatori de înmulţire şi împărţire. Mai mult, acest calcul este destul de greoi, în orice caz nu este compact, deoarece multe celule implicate. Și da, este greu să-ți dai seama.

În general, Excel oferă o funcție gata făcută pentru calcularea probabilităților distribuției binomiale. Funcția se numește BINOM.DIST.

Numărul de succese este numărul de încercări reușite. Avem 50 dintre ele.

Numărul de încercări- număr de aruncări: de 100 de ori.

Probabilitatea de succes– probabilitatea de a obține capete la o aruncare este de 0,5.

Integral- este indicat fie 1, fie 0. Dacă 0, atunci probabilitatea este calculată P(B=k); dacă 1, atunci se calculează funcția de distribuție binomială, i.e. suma tuturor probabilităților de la B=0 inainte de B=k inclusiv.

Apăsăm OK și obținem același rezultat ca mai sus, doar totul a fost calculat de o singură funcție.

Foarte confortabil. De dragul experimentului, în loc de ultimul parametru 0, punem 1. Obținem 0,5398. Aceasta înseamnă că în 100 de aruncări de monede, probabilitatea de a obține capete între 0 și 50 este de aproape 54%. Și la început părea că ar trebui să fie de 50%. În general, calculele se fac ușor și rapid.

Un analist adevărat trebuie să înțeleagă cum se comportă funcția (care este distribuția ei), așa că haideți să calculăm probabilitățile pentru toate valorile de la 0 la 100. Adică să ne întrebăm: care este probabilitatea ca niciun vultur să nu cadă, că va cădea 1 vultur, 2, 3, 50, 90 sau 100. Calculul este prezentat în următoarea imagine în mișcare. Linia albastră este distribuția binomială în sine, punctul roșu este probabilitatea pentru un anumit număr de succese k.

S-ar putea întreba, nu este distribuția binomială similară cu... Da, foarte asemănătoare. Chiar și De Moivre (în 1733) spunea că cu eșantioane mari se apropie distribuția binomială (nu știu cum se numea atunci), dar nimeni nu l-a ascultat. Doar Gauss, și apoi Laplace, 60-70 de ani mai târziu, au redescoperit și studiat cu atenție legea distribuției normale. Graficul de mai sus arată clar că probabilitatea maximă cade pe așteptarea matematică și, pe măsură ce se abate de la aceasta, scade brusc. La fel ca legea normală.

Distribuție binomială are o mare importanță practică, apare destul de des. Prin utilizarea calcule Excel realizat rapid si usor. Așa că nu ezitați să-l utilizați.

În acest sens îmi propun să-mi iau rămas bun până la următoarea întâlnire. Toate cele bune, fiți sănătoși!

Capitolul 7

Legile specifice de distribuție a variabilelor aleatoare

Tipuri de legi de distribuție a variabilelor aleatoare discrete

Fie ca o variabilă aleatorie discretă să ia valorile X 1 , X 2 , …, x n, … . Probabilitățile acestor valori pot fi calculate din diverse formule, de exemplu, folosind teoremele de bază ale teoriei probabilităților, formula Bernoulli sau alte formule. Pentru unele dintre aceste formule, legea distribuției are propriul nume.

Cele mai comune legi ale distribuției unei variabile aleatoare discrete sunt binomiale, geometrice, hipergeometrice, legea distribuției lui Poisson.

Legea distribuției binomiale

Lasă-l să fie produs n studii independente, în fiecare dintre acestea un eveniment poate sau nu să apară ȘI. Probabilitatea de apariție a acestui eveniment în fiecare încercare este constantă, nu depinde de numărul procesului și este egală cu R=R(ȘI). De aici probabilitatea ca evenimentul să nu se producă ȘIîn fiecare test este de asemenea constantă și egală cu q=1–R. Luați în considerare o variabilă aleatorie X egal cu numărul de apariţii ale evenimentului ȘIîn n teste. Este evident că valorile acestei cantități sunt egale cu

X 1 =0 - eveniment ȘIîn n testele nu au apărut;

X 2 =1 – eveniment ȘIîn n procesele au apărut o dată;

X 3 =2 - eveniment ȘIîn n procesele au apărut de două ori;

…………………………………………………………..

x n +1 = n- eveniment ȘIîn n testele au apărut totul n o singura data.

Probabilitățile acestor valori pot fi calculate folosind formula Bernoulli (4.1):

Unde la=0, 1, 2, …,n .

Legea distribuției binomiale X egal cu numărul de succese în nÎncercările Bernoulli, cu probabilitate de succes R.

Deci, o variabilă aleatorie discretă are o distribuție binomială (sau este distribuită conform legii binomiale) dacă valorile sale posibile sunt 0, 1, 2, …, n, iar probabilitățile corespunzătoare sunt calculate prin formula (7.1).

Distribuția binomială depinde de două parametrii Rși n.

Seria de distribuție a unei variabile aleatoare distribuite conform legii binomiale are forma:

X k n
R

Exemplu 7.1 . Trei focuri independente sunt trase în țintă. Probabilitatea de a lovi fiecare lovitură este de 0,4. Valoare aleatoare X- numărul de lovituri pe țintă. Construiți-i seria de distribuție.

Decizie. Valori posibile ale unei variabile aleatorii X sunt X 1 =0; X 2 =1; X 3 =2; X 4=3. Găsiți probabilitățile corespunzătoare folosind formula Bernoulli. Este ușor de demonstrat că aplicarea acestei formule aici este pe deplin justificată. Rețineți că probabilitatea de a nu lovi ținta cu o singură lovitură va fi egală cu 1-0,4=0,6. obține

Seria de distribuție are următoarea formă:

X
R 0,216 0,432 0,288 0,064

Este ușor de verificat dacă suma tuturor probabilităților este egală cu 1. Variabila aleatoare în sine X distribuite conform legii binomiale. ■

Să găsim așteptarea și varianța matematică a unei variabile aleatoare distribuite conform legii binomiale.

La rezolvarea exemplului 6.5, s-a arătat că așteptarea matematică a numărului de apariții ale unui eveniment ȘIîn n teste independente dacă probabilitatea apariţiei ȘIîn fiecare test este constantă și egală R, egal n· R

În acest exemplu, a fost folosită o variabilă aleatoare, distribuită conform legii binomiale. Prin urmare, soluția din Exemplul 6.5 este, de fapt, o demonstrație a următoarei teoreme.

Teorema 7.1. Așteptarea matematică a unei variabile aleatoare discrete distribuite conform legii binomiale este egală cu produsul dintre numărul de încercări și probabilitatea de „reușită”, i.e. M(X)=n· R.

Teorema 7.2. Varianta unei variabile aleatoare discrete distribuite conform legii binomiale este egală cu produsul dintre numărul de încercări cu probabilitatea de „reușit” și probabilitatea de „eșec”, i.e. D(X)=npq.

Deformarea și curtoza unei variabile aleatoare distribuite conform legii binomiale sunt determinate de formulele

Aceste formule pot fi obținute folosind conceptul de momente inițiale și centrale.

Legea distribuției binomiale stă la baza multor situații reale. Pentru valori mari n distribuția binomială poate fi aproximată prin alte distribuții, în special distribuția Poisson.

Distribuția Poisson

Să fie n Procesele Bernoulli, cu numărul de încercări n destul de mare. Anterior, s-a arătat că în acest caz (dacă, în plus, probabilitatea R evoluții ȘI foarte mic) pentru a afla probabilitatea ca un eveniment ȘI a aparea t odată ajuns la teste, puteți folosi formula Poisson (4.9). Dacă variabila aleatoare Xînseamnă numărul de apariții ale evenimentului ȘIîn nîncercări Bernoulli, apoi probabilitatea ca X va căpăta sensul k poate fi calculat prin formula

, (7.2)

Unde λ = np.

Legea distribuției Poisson se numește distribuția unei variabile aleatoare discrete X, pentru care valorile posibile sunt numere întregi nenegative și probabilitățile p t aceste valori se găsesc prin formula (7.2).

Valoare λ = np numit parametru Distribuția Poisson.

O variabilă aleatoare distribuită conform legii lui Poisson poate lua un număr infinit de valori. Deoarece pentru această distribuţie probabilitatea R apariția unui eveniment în fiecare proces este mică, atunci această distribuție este uneori numită legea fenomenelor rare.

Seria de distribuție a unei variabile aleatoare distribuită conform legii Poisson are forma

X t
R

Este ușor de verificat că suma probabilităților celui de-al doilea rând este egală cu 1. Pentru a face acest lucru, trebuie să ne amintim că funcția poate fi extinsă într-o serie Maclaurin, care converge pentru orice X. În acest caz avem

. (7.3)

După cum sa menționat, legea lui Poisson în anumite cazuri limită înlocuiește legea binomială. Un exemplu este o variabilă aleatorie X, ale căror valori sunt egale cu numărul de defecțiuni pentru o anumită perioadă de timp cu utilizarea repetată a unui dispozitiv tehnic. Se presupune că acest dispozitiv este de înaltă fiabilitate, adică probabilitatea de eșec într-o singură aplicație este foarte mică.

Pe lângă astfel de cazuri limitative, în practică există variabile aleatoare distribuite conform legii Poisson, care nu au legătură cu distribuția binomială. De exemplu, distribuția Poisson este adesea folosită atunci când se tratează numărul de evenimente care au loc într-o perioadă de timp (numărul de apeluri către centrala telefonică în timpul orei, numărul de mașini care au ajuns la spălătorie în timpul zilei, numărul de opriri ale mașinii pe săptămână etc.). Toate aceste evenimente trebuie să formeze așa-numitul flux de evenimente, care este unul dintre conceptele de bază ale teoriei cozilor. Parametru λ caracterizează intensitatea medie a fluxului de evenimente.

Luați în considerare distribuția binomială, calculați așteptarea, varianța, modul ei matematic. Folosind funcția MS EXCEL BINOM.DIST(), vom reprezenta graficul funcției de distribuție și al densității probabilității. Să estimăm parametrul de distribuție p, așteptarea matematică a distribuției și abaterea standard. Luați în considerare și distribuția Bernoulli.

Definiție. Lasă-le să fie ținute n teste, în fiecare dintre ele pot apărea doar 2 evenimente: evenimentul „succes” cu o probabilitate p sau evenimentul „eşec” cu probabilitatea q =1-p (așa-numitul Schema Bernoulli,Bernoulliîncercări).

Probabilitatea de a obține exact X succes in acestea n teste este egal cu:

Numărul de succese din eșantion X este o variabilă aleatoare care are Distribuție binomială(Engleză) Binomdistributie) pși n sunt parametri ai acestei distribuţii.

Amintiți-vă că pentru a aplica Scheme Bernoulliși în mod corespunzător distribuție binomială, trebuie îndeplinite următoarele condiții:

  • fiecare încercare trebuie să aibă exact două rezultate, numite condiționat „succes” și „eșec”.
  • rezultatul fiecărui test nu trebuie să depindă de rezultatele testelor anterioare (independența testului).
  • rata de succes p ar trebui să fie constantă pentru toate testele.

Distribuție binomială în MS EXCEL

În MS EXCEL, începând cu versiunea 2010, pt Distribuție binomială există o funcție BINOM.DIST() , titlu englezesc- BINOM.DIST(), care vă permite să calculați probabilitatea ca eșantionul să fie exact X„succesuri” (adică funcția de densitate de probabilitate p(x), vezi formula de mai sus) și funcția de distribuție integrală(probabilitatea ca eșantionul să aibă X sau mai puține „reușite”, inclusiv 0).

Înainte de MS EXCEL 2010, EXCEL avea funcția BINOMDIST(), care vă permite, de asemenea, să calculați funcția de distribuțieși probabilitate densitate p(x). BINOMDIST() este lăsat în MS EXCEL 2010 pentru compatibilitate.

Fișierul exemplu conține grafice densitatea distribuției de probabilitateși .

Distribuție binomială are denumirea B(n; p) .

Notă: Pentru constructii funcția de distribuție integrală tip grafic de potrivire perfectă Programa, pentru densitatea distributieiHistogramă cu grupare. Pentru mai multe informații despre construirea diagramelor, citiți articolul Principalele tipuri de diagrame.

Notă: Pentru confortul scrierii formulelor în fișierul exemplu, au fost create Nume pentru parametri Distribuție binomială: n și p.

Fișierul exemplu arată diferite calcule de probabilitate folosind funcțiile MS EXCEL:

După cum se vede în imaginea de mai sus, se presupune că:

  • Populația infinită din care este făcut eșantionul conține 10% (sau 0,1) elemente bune (parametru p, al treilea argument al funcției =BINOM.DIST() )
  • Pentru a calcula probabilitatea ca într-un eșantion de 10 elemente (parametrul n, al doilea argument al funcției) vor fi exact 5 elemente valide (primul argument), trebuie să scrieți formula: =BINOM.DIST(5; 10; 0,1; FALSE)
  • Ultimul, al patrulea element este setat = FALSE, i.e. valoarea funcției este returnată densitatea distributiei.

Dacă valoarea celui de-al patrulea argument = TRUE, atunci funcția BINOM.DIST() returnează valoarea funcția de distribuție integrală sau pur și simplu funcția de distribuție. În acest caz, puteți calcula probabilitatea ca numărul de elemente bune din eșantion să fie dintr-un anumit interval, de exemplu, 2 sau mai puțin (inclusiv 0).

Pentru a face acest lucru, trebuie să scrieți formula:
= BINOM.DIST(2; 10; 0,1; TRUE)

Notă: Pentru o valoare neîntregătoare a lui x, . De exemplu, următoarele formule vor returna aceeași valoare:
=BINOM.DIST( 2 ; 10; 0,1; ADEVĂRAT)
=BINOM.DIST( 2,9 ; 10; 0,1; ADEVĂRAT)

Notă: În fișierul exemplu probabilitate densitateși funcția de distribuție de asemenea, calculat folosind definiția și funcția COMBIN().

Indicatori de distribuție

LA fișier exemplu pe foaie Exemplu există formule pentru calcularea unor indicatori de distribuție:

  • =n*p;
  • (abaterea standard pătrată) = n*p*(1-p);
  • = (n+1)*p;
  • =(1-2*p)*ROOT(n*p*(1-p)).

Deducem formula așteptări matematice Distribuție binomială folosind Schema Bernoulli.

Prin definiție, o variabilă aleatoare X în Schema Bernoulli(variabilă aleatoare Bernoulli) are funcția de distribuție:

Această distribuție se numește distribuția Bernoulli.

Notă: distribuția Bernoulli- caz special Distribuție binomială cu parametrul n=1.

Să generăm 3 matrice de 100 de numere cu diferite probabilități de succes: 0,1; 0,5 și 0,9. Pentru a face acest lucru, în fereastră Generarea numerelor aleatorii setați următorii parametri pentru fiecare probabilitate p:

Notă: Dacă setați opțiunea Imprăștire aleatorie (Sămânță aleatorie), apoi puteți alege un anumit set aleatoriu de numere generate. De exemplu, setând această opțiune =25, puteți genera aceleași seturi de numere aleatorii pe computere diferite (dacă, desigur, alți parametri de distribuție sunt aceiași). Valoarea opțiunii poate lua valori întregi de la 1 la 32 767. Numele opțiunii Imprăștire aleatorie poate deruta. Ar fi mai bine să o traducem ca Setați un număr cu numere aleatorii.

Ca urmare, vom avea 3 coloane de 100 de numere, pe baza cărora, de exemplu, putem estima probabilitatea de succes p dupa formula: Număr de succese/100(cm. exemplu de fișă de fișier Generarea lui Bernoulli).

Notă: Pentru distribuții Bernoulli cu p=0,5, puteți folosi formula =RANDBETWEEN(0;1) , care corespunde cu .

Generarea numerelor aleatorii. Distribuție binomială

Să presupunem că există 7 articole defecte în eșantion. Aceasta înseamnă că este „foarte probabil” ca proporția produselor defecte să se fi schimbat. p, care este o caracteristică a procesului nostru de producție. Deși această situație este „foarte probabilă”, există o posibilitate (risc alfa, eroare de tip 1, „alarma falsă”) ca p a rămas neschimbată, iar numărul crescut de produse defecte s-a datorat prelevării aleatorii.

După cum se poate observa în figura de mai jos, 7 este numărul de produse defecte care este acceptabil pentru un proces cu p=0,21 la aceeași valoare Alfa. Acest lucru ilustrează faptul că, atunci când pragul de articole defecte dintr-o probă este depășit, p„probabil” a crescut. Expresia „cel mai probabil” înseamnă că există doar o șansă de 10% (100%-90%) ca abaterea procentului de produse defecte peste prag să se datoreze doar unor cauze aleatorii.

Astfel, depășirea numărului prag de produse defecte din probă poate servi drept semnal că procesul a devenit deranjat și a început să producă b despre procent mai mare de produse defecte.

Notă: Înainte de MS EXCEL 2010, EXCEL avea o funcție CRITBINOM() , care este echivalentă cu BINOM.INV() . CRITBINOM() este lăsat în MS EXCEL 2010 și mai sus pentru compatibilitate.

Relația distribuției binomiale cu alte distribuții

Dacă parametrul n Distribuție binomială tinde spre infinit şi p tinde spre 0, atunci în acest caz Distribuție binomială poate fi aproximată.
Este posibil să se formuleze condiții când aproximarea Distribuția Poisson functioneaza bine:

  • p<0,1 (mai putin pși altele n, cu atât aproximarea este mai precisă);
  • p>0,9 (având în vedere că q=1- p, calculele în acest caz trebuie efectuate folosind q(A X trebuie inlocuit cu n- X). Prin urmare, cu atât mai puțin qși altele n, cu atât aproximarea este mai precisă).

La 0,1<=p<=0,9 и n*p>10 Distribuție binomială poate fi aproximată.

In schimb, Distribuție binomială poate servi ca o bună aproximare atunci când dimensiunea populației este N Distribuție hipergeometrică mult mai mare decât dimensiunea eșantionului n (adică N>>n sau n/N<<1).

Puteți citi mai multe despre relația dintre distribuțiile de mai sus în articol. Acolo sunt date și exemple de aproximare, iar condițiile sunt explicate când este posibil și cu ce precizie.

SFAT: Puteți citi despre alte distribuții ale MS EXCEL în articol.

Distribuții de probabilitate ale variabilelor aleatoare discrete. Distribuție binomială. Distribuția Poisson. Distribuția geometrică. functie generatoare.

6. Distribuții de probabilitate ale variabilelor aleatoare discrete

6.1. Distribuție binomială

Lasă-l să fie produs nîncercări independente, în fiecare dintre ele câte un eveniment A poate sau nu să apară. Probabilitate p producerea unui eveniment Aîn toate testele este constantă și nu se modifică de la un test la altul. Considerați ca o variabilă aleatoare X numărul de apariții ale evenimentului Aîn aceste teste. Formula pentru a afla probabilitatea producerii unui eveniment A neted k odata n testele, după cum se știe, sunt descrise formula Bernoulli

Distribuția de probabilitate definită de formula Bernoulli se numește binom .

Această lege se numește „binom” deoarece partea dreaptă poate fi considerată ca un termen comun în extinderea binomului Newton

Scriem legea binomului sub forma unui tabel

p n

np n –1 q

q n

Să găsim caracteristicile numerice ale acestei distribuții.

După definiția așteptărilor matematice pentru DSW, avem

.

Să notăm egalitatea, care este bin Newton

.

și diferențiază-l față de p. Drept urmare, obținem

.

Înmulțiți părțile din stânga și din dreapta cu p:

.

Dat fiind p+ q=1, avem

(6.2)

Asa de, așteptarea matematică a numărului de apariții ale evenimentelor înnîncercări independente este egal cu produsul numărului de încercărinpe probabilitatepapariția unui eveniment în fiecare proces.

Calculăm dispersia prin formula

.

Pentru aceasta găsim

.

În primul rând, diferențiem formula binomială a lui Newton de două ori în raport cu p:

și înmulțiți ambele părți ale ecuației cu p 2:

Prin urmare,

Deci varianța distribuției binomiale este

. (6.3)

Aceste rezultate pot fi obținute și din raționamente pur calitative. Totalul X apariții ale evenimentului A în toate încercările se adaugă la numărul de apariții ale evenimentului în încercările individuale. Prin urmare, dacă X 1 este numărul de apariții ale evenimentului în prima încercare, X 2 în a doua, etc., atunci numărul total de apariții ale evenimentului A în toate încercările este X=X 1 +X 2 +...+ X n. Conform proprietății așteptării matematice:

Fiecare dintre termenii din partea dreaptă a egalității este așteptarea matematică a numărului de evenimente dintr-un test, care este egal cu probabilitatea evenimentului. În acest fel,

Conform proprietății de dispersie:

Deoarece , și așteptarea matematică a unei variabile aleatoare , care poate lua doar două valori și anume 1 2 cu probabilitate pși 0 2 cu probabilitate q, apoi
. În acest fel,
Drept urmare, obținem

Folosind conceptul de momente inițiale și centrale, se pot obține formule pentru asimetrie și curtoză:

. (6.4)

Orez. 6.1

Poligonul distribuției binomiale are următoarea formă (vezi Fig. 6.1). Probabilitatea P n (k) mai întâi crește odată cu creșterea k atinge valoarea maximă și apoi începe să scadă. Distribuția binomială este denaturată, cu excepția cazului p=0,5. Rețineți că pentru un număr mare de teste n distribuția binomială este foarte apropiată de normal. (Justificarea acestei propoziții este legată de teorema locală Moivre-Laplace.)

Numărm 0 se numește apariția unui evenimentcel mai probabil , dacă probabilitatea ca evenimentul să se producă de un anumit număr de ori în această serie de încercări este cea mai mare (maxim în poligonul de distribuție). Pentru distribuția binomială

Cometariu. Această inegalitate poate fi demonstrată folosind formula recurentă pentru probabilitățile binomiale:

(6.6)

Exemplul 6.1. Ponderea produselor premium la această întreprindere este de 31%. Care este media și varianța, precum și numărul cel mai probabil de articole premium dintr-un lot selectat aleatoriu de 75 de articole?

Decizie. Deoarece p=0,31, q=0,69, n=75, atunci

M[ X] = np= 750,31 = 23,25; D[ X] = npq = 750,310,69 = 16,04.

Pentru a găsi numărul cel mai probabil m 0 , compunem o dublă inegalitate

De aici rezultă că m 0 = 23.

În aceasta și în următoarele câteva note, vom lua în considerare modele matematice ale evenimentelor aleatorii. Model matematic este o expresie matematică care reprezintă o variabilă aleatorie. Pentru variabile aleatoare discrete, această expresie matematică este cunoscută sub numele de funcție de distribuție.

Dacă problema vă permite să scrieți în mod explicit o expresie matematică reprezentând o variabilă aleatorie, puteți calcula probabilitatea exactă a oricăreia dintre valorile acesteia. În acest caz, puteți calcula și enumera toate valorile funcției de distribuție. În aplicații de afaceri, sociologice și medicale, există diverse distribuții ale variabilelor aleatorii. Una dintre cele mai utile distribuții este binomul.

Distribuție binomială este folosit pentru a modela situaţii caracterizate prin următoarele caracteristici.

  • Eșantionul este format dintr-un număr fix de elemente n reprezentând rezultatul unui test.
  • Fiecare element eșantion aparține uneia dintre cele două categorii care se exclud reciproc, care acoperă întreg spațiul eșantionului. De obicei, aceste două categorii sunt numite succes și eșec.
  • Probabilitatea de succes R este constantă. Prin urmare, probabilitatea de eșec este 1 - p.
  • Rezultatul (adică succesul sau eșecul) oricărui studiu este independent de rezultatul altui studiu. Pentru a asigura independența rezultatelor, elementele eșantionului sunt obținute de obicei folosind două metode diferite. Fiecare element eșantion este extras aleatoriu dintr-o populație infinită fără înlocuire sau dintr-o populație finită cu înlocuire.

Descărcați nota în sau format, exemple în format

Distribuția binomială este utilizată pentru a estima numărul de succese dintr-un eșantion format din n observatii. Să luăm comanda ca exemplu. Clienții Saxon Company pot folosi un formular electronic interactiv pentru a plasa o comandă și a o trimite companiei. Apoi sistemul informatic verifică dacă există erori în comenzi, precum și informații incomplete sau inexacte. Orice comandă în dubiu este semnalată și inclusă în raportul zilnic de excepție. Datele colectate de companie indică faptul că probabilitatea erorilor în comenzi este de 0,1. Compania ar dori să știe care este probabilitatea de a găsi un anumit număr de comenzi eronate într-un eșantion dat. De exemplu, să presupunem că clienții au completat patru formulare electronice. Care este probabilitatea ca toate comenzile să fie fără erori? Cum se calculează această probabilitate? Prin succes, ne referim la o eroare la completarea formularului și vom considera toate celelalte rezultate drept eșec. Amintiți-vă că suntem interesați de numărul de comenzi eronate dintr-un eșantion dat.

Ce rezultate putem observa? Dacă eșantionul constă din patru comenzi, unul, două, trei sau toate cele patru pot fi greșite, în plus, toate pot fi completate corect. Poate variabila aleatoare care descrie numărul de formulare completate incorect să ia o altă valoare? Acest lucru nu este posibil deoarece numărul de formulare completate incorect nu poate depăși dimensiunea eșantionului n sau fi negativ. Astfel, o variabilă aleatorie care respectă legea distribuției binomiale ia valori de la 0 la n.

Să presupunem că într-un eșantion de patru ordine se observă următoarele rezultate:

Care este probabilitatea de a găsi trei ordine eronate într-un eșantion de patru ordine și în ordinea specificată? Deoarece studiile preliminare au arătat că probabilitatea unei erori în completarea formularului este de 0,10, probabilitățile rezultatelor de mai sus sunt calculate după cum urmează:

Deoarece rezultatele sunt independente unele de altele, probabilitatea secvenței indicate de rezultate este egală cu: p*p*(1–p)*p = 0,1*0,1*0,9*0,1 = 0,0009. Dacă este necesar să se calculeze numărul de opțiuni X n elemente, ar trebui să utilizați formula de combinare (1):

unde n! \u003d n * (n -1) * (n - 2) * ... * 2 * 1 - factorial al numărului n, și 0! = 1 si 1! = 1 prin definiție.

Această expresie este adesea denumită . Astfel, dacă n = 4 și X = 3, numărul de secvențe format din trei elemente extrase dintr-un eșantion de dimensiunea 4 este dat de următoarea formulă:

Prin urmare, probabilitatea de a găsi trei ordine eronate se calculează după cum urmează:

(număr de secvențe posibile) *
(probabilitatea unei anumite secvențe) = 4 * 0,0009 = 0,0036

În mod similar, putem calcula probabilitatea ca dintre cele patru ordine, unul sau două să fie greșite, precum și probabilitatea ca toate ordinele să fie greșite sau ca toate să fie corecte. Cu toate acestea, pe măsură ce dimensiunea eșantionului crește n devine mai dificil să se determine probabilitatea unei anumite secvențe de rezultate. În acest caz, ar trebui aplicat un model matematic adecvat care să descrie distribuția binomială a numărului de opțiuni. X obiecte dintr-un eşantion care conţine n elemente.

Distribuție binomială

Unde P(X)- probabilitate X succes pentru o anumită dimensiune a eșantionului nși probabilitatea de succes R, X = 0, 1, … n.

Atenție la faptul că formula (2) este o formalizare a concluziilor intuitive. Valoare aleatoare X, respectând distribuția binomială, poate lua orice valoare întreagă în intervalul de la 0 la n. Muncă RX(1 - p)nX este probabilitatea ca o anumită secvență constând din X succese în eșantion, a cărui dimensiune este egală cu n. Valoarea determină numărul de combinații posibile constând din X succes in n teste. Prin urmare, pentru un număr dat de încercări nși probabilitatea de succes R probabilitatea unei secvenţe formate din X succesul este egal cu

P(X) = (numărul de secvențe posibile) * (probabilitatea unei anumite secvențe) =

Luați în considerare exemple care ilustrează aplicarea formulei (2).

1. Să presupunem că probabilitatea de a completa incorect formularul este 0,1. Care este probabilitatea ca trei din cele patru formulare completate să fie greșite? Folosind formula (2), obținem că probabilitatea de a găsi trei ordine eronate într-un eșantion de patru ordine este egală cu

2. Să presupunem că probabilitatea completării incorecte a formularului este de 0,1. Care este probabilitatea ca cel puțin trei din patru formulare completate să fie greșite? După cum se arată în exemplul anterior, probabilitatea ca trei dintre cele patru formulare completate să fie greșite este de 0,0036. Pentru a calcula probabilitatea ca cel puțin trei din cele patru formulare completate să fie completate incorect, trebuie să adăugați probabilitatea ca dintre cele patru formulare completate trei să fie greșite și probabilitatea ca dintre cele patru formulare completate toate să fie greșite. Probabilitatea celui de-al doilea eveniment este

Astfel, probabilitatea ca dintre cele patru formulare completate cel puțin trei să fie eronate este egală cu

P(X > 3) = P(X = 3) + P(X = 4) = 0,0036 + 0,0001 = 0,0037

3. Să presupunem că probabilitatea completării incorecte a formularului este de 0,1. Care este probabilitatea ca mai puțin de trei din patru formulare completate să fie greșite? Probabilitatea acestui eveniment

P(X< 3) = P(X = 0) + P(X = 1) + P(X = 2)

Folosind formula (2), calculăm fiecare dintre aceste probabilități:

Prin urmare, P(X< 3) = 0,6561 + 0,2916 + 0,0486 = 0,9963.

Probabilitatea P(X< 3) можно вычислить иначе. Для этого воспользуемся тем, что событие X < 3 является дополнительным по отношению к событию Х>3. Apoi P(X< 3) = 1 – Р(Х> 3) = 1 – 0,0037 = 0,9963.

Pe măsură ce dimensiunea eșantionului crește n calcule similare cu cele efectuate în exemplul 3 devin dificile. Pentru a evita aceste complicații, multe probabilități binomiale sunt tabulate din timp. Unele dintre aceste probabilități sunt prezentate în Fig. 1. De exemplu, pentru a obține probabilitatea ca X= 2 at n= 4 și p= 0,1, ar trebui să extrageți din tabel numărul de la intersecția dreptei X= 2 și coloane R = 0,1.

Orez. 1. Probabilitate binomială la n = 4, X= 2 și R = 0,1

Distribuția binomială poate fi calculată folosind Funcții Excel=BINOM.DIST() (Fig. 2), care are 4 parametri: numărul de succese - X, numărul de încercări (sau dimensiunea eșantionului) – n, probabilitatea de succes este R, parametru integrală, care ia valorile TRUE (în acest caz, probabilitatea este calculată macar X evenimente) sau FALS (în acest caz, probabilitatea de exact X evenimente).

Orez. 2. Parametrii funcției =BINOM.DIST()

Pentru cele trei exemple de mai sus, calculele sunt prezentate în fig. 3 (vezi și fișierul Excel). Fiecare coloană conține o formulă. Numerele arată răspunsurile la exemplele numărului corespunzător).

Orez. 3. Calculul distribuției binomiale în Excel pt n= 4 și p = 0,1

Proprietăţi ale distribuţiei binomiale

Distribuția binomială depinde de parametri nși R. Distribuția binomială poate fi fie simetrică, fie asimetrică. Dacă p = 0,05, distribuția binomială este simetrică indiferent de valoarea parametrului n. Totuși, dacă p ≠ 0,05, distribuția devine deformată. Cu cât valoarea parametrului este mai apropiată R la 0,05 și cu cât dimensiunea eșantionului este mai mare n, cu atât asimetria distribuției este mai slabă. Astfel, distribuția numărului de formulare completate incorect este deplasată spre dreapta, deoarece p= 0,1 (Fig. 4).

Orez. 4. Histograma distribuţiei binomiale pt n= 4 și p = 0,1

Aşteptarea matematică a distribuţiei binomiale este egal cu produsul mărimii eșantionului n cu privire la probabilitatea de succes R:

(3) M = E(X) =np

În medie, cu o serie suficient de lungă de teste într-un eșantion de patru comenzi, pot exista p \u003d E (X) \u003d 4 x 0,1 \u003d 0,4 formulare completate incorect.

Deviația standard de distribuție binomială

De exemplu, deviație standard numărul de formulare completate incorect în sistemul informațional contabil este egal cu:

Sunt folosite materiale din cartea Levin et al. Statistici pentru manageri. - M.: Williams, 2004. - p. 307–313



eroare: Conținutul este protejat!!