Distribuție binomială: definiție, formulă, exemple. Distribuția binomială a unei variabile aleatoare

Salutări tuturor cititorilor!

Analiza statistică, după cum știți, se ocupă de colectarea și prelucrarea datelor reale. Este util, și adesea profitabil, pentru că. concluziile corecte vă permit să evitați greșelile și pierderile în viitor și, uneori, să ghiciți corect acest viitor. Datele colectate reflectă starea unor fenomene observate. Datele sunt adesea (dar nu întotdeauna) numerice și pot fi manipulate cu diverse manipulări matematice pentru a extrage informații suplimentare.

Cu toate acestea, nu toate fenomenele sunt măsurate pe o scară cantitativă precum 1, 2, 3 ... 100500 ... Nu întotdeauna un fenomen poate lua un infinit sau un număr mare de stări diferite. De exemplu, genul unei persoane poate fi fie M, fie F. trăgătorul fie lovește ținta, fie ratează. Puteți vota fie „pentru”, fie „împotrivă”, etc. etc. Cu alte cuvinte, astfel de date reflectă starea unui atribut alternativ - fie „da” (evenimentul a avut loc), fie „nu” (evenimentul nu a avut loc). Evenimentul care urmează (rezultat pozitiv) se mai numește și „succes”. Astfel de fenomene pot fi, de asemenea, masive și întâmplătoare. Prin urmare, ele pot fi măsurate și se pot trage concluzii valide statistic.

Se numesc experimente cu astfel de date Schema Bernoulli, în onoarea celebrului matematician elvețian care a stabilit că atunci când în număr mare studii, raportul dintre rezultatele pozitive și numărul total de încercări tinde la probabilitatea ca acest eveniment să apară.

Variabilă alternativă de caracteristică

Pentru a utiliza aparatul matematic în analiză, rezultatele acestor observații trebuie notate în formă numerică. Pentru a face acest lucru, unui rezultat pozitiv i se atribuie numărul 1, unul negativ - 0. Cu alte cuvinte, avem de-a face cu o variabilă care poate lua doar două valori: 0 sau 1.

Ce beneficii se poate obține din asta? De fapt, nu mai puțin decât din date obișnuite. Deci, este ușor să numărăm numărul de rezultate pozitive - este suficient să însumăm toate valorile, de exemplu. toate 1 (succes). Puteți merge mai departe, dar pentru aceasta trebuie să introduceți câteva notații.

Primul lucru de remarcat este că rezultatele pozitive (care sunt egale cu 1) au o anumită probabilitate de a apărea. De exemplu, obținerea capetelor la aruncarea unei monede este ½ sau 0,5. Această probabilitate este indicată în mod tradițional Literă latină p. Prin urmare, probabilitatea ca un eveniment alternativ să se producă este 1-p, care se notează și prin q, acesta este q = 1 – p. Aceste denumiri pot fi sistematizate vizual sub forma unei plăci de distribuție variabilă X.

Acum avem o listă de valori posibile și probabilitățile acestora. Puteți începe să calculați astfel de caracteristici minunate variabilă aleatorie, Cum valorea estimatași dispersie. Permiteți-mi să vă reamintesc că așteptarea matematică este calculată ca suma produselor tuturor valorilor posibile și probabilitățile lor corespunzătoare:

Să calculăm valoarea așteptată folosind notația din tabelele de mai sus.

Se pare că așteptarea matematică a unui semn alternativ este egală cu probabilitatea acestui eveniment - p.

Acum să definim care este varianța unei caracteristici alternative. Permiteți-mi să vă reamintesc, de asemenea, că varianța este pătratul mediu al abaterilor de la așteptarea matematică. Formula generala(pentru date discrete) are forma:

De aici variația caracteristicii alternative:

Este ușor de observat că această dispersie are un maxim de 0,25 (at p=0,5).

Abaterea standard - rădăcina varianței:

Valoarea maximă nu depășește 0,5.

După cum puteți vedea, atât așteptarea matematică, cât și varianța semnului alternativ au o formă foarte compactă.

Distribuția binomială a unei variabile aleatoare

Acum luați în considerare situația dintr-un unghi diferit. Într-adevăr, cui îi pasă că pierderea medie de capete la o aruncare este de 0,5? Este chiar imposibil de imaginat. Este mai interesant să ridicăm problema numărului de capete care apar pentru un anumit număr de aruncări.

Cu alte cuvinte, cercetătorul este adesea interesat de probabilitatea ca un anumit număr de evenimente de succes să aibă loc. Acesta poate fi numărul de produse defecte din lotul testat (1 - defect, 0 - bun) sau numărul de recuperări (1 - sănătos, 0 - bolnav), etc. Numărul de astfel de „reușite” va fi egal cu suma tuturor valorilor variabilei X, adică numărul de rezultate unice.

Valoare aleatoare B se numește binom și ia valori de la 0 la n(la B= 0 - toate părțile sunt bune, cu B = n- toate piesele sunt defecte). Se presupune că toate valorile X independente unele de altele. Luați în considerare principalele caracteristici ale variabilei binomiale, adică vom stabili așteptările matematice, varianța și distribuția acesteia.

Așteptarea unei variabile binomiale este foarte ușor de obținut. Amintiți-vă că există o sumă de așteptări matematice pentru fiecare valoare adăugată și este aceeași pentru toată lumea, prin urmare:

De exemplu, așteptarea numărului de capete la 100 de aruncări este 100 × 0,5 = 50.

Acum derivăm formula pentru varianța variabilei binomiale. este suma varianțelor. De aici

Abaterea standard, respectiv

Pentru 100 de aruncări de monede, abaterea standard este

Și, în sfârșit, luați în considerare distribuția valoare binomială, adică probabilitatea ca variabila aleatoare B va lua diverse sensuri k, Unde 0≤k≤n. Pentru o monedă, această problemă ar putea suna așa: care este probabilitatea de a obține 40 de capete în 100 de aruncări?

Pentru a înțelege metoda de calcul, să ne imaginăm că moneda este aruncată doar de 4 ori. Oricare parte poate cădea de fiecare dată. Ne întrebăm: care este probabilitatea de a obține 2 capete din 4 aruncări. Fiecare aruncare este independentă una de cealaltă. Aceasta înseamnă că probabilitatea de a obține orice combinație va fi egală cu produsul dintre probabilitățile unui rezultat dat pentru fiecare aruncare individuală. Fie O capete și P cozi. Atunci, de exemplu, una dintre combinațiile care ni se potrivesc poate arăta ca OOPP, adică:

Probabilitatea unei astfel de combinații este egală cu produsul a două probabilități de a obține cap și a încă două probabilități de a nu apărea (evenimentul invers calculat ca 1-p), adică 0,5×0,5×(1-0,5)×(1-0,5)=0,0625. Aceasta este probabilitatea uneia dintre combinațiile care ni se potrivesc. Dar întrebarea era despre numărul total de vulturi, și nu despre o anumită ordine. Apoi trebuie să adăugați probabilitățile tuturor combinațiilor în care există exact 2 vulturi. Este clar că toate sunt la fel (produsul nu se schimbă de la schimbarea locurilor factorilor). Prin urmare, trebuie să calculați numărul lor și apoi să înmulțiți cu probabilitatea unei astfel de combinații. Să numărăm toate combinațiile de 4 aruncări a 2 vulturi: RROO, RORO, ROOR, ORRO, OROR, OORR. Doar 6 variante.

Prin urmare, probabilitatea dorită de a obține 2 capete după 4 aruncări este 6×0,0625=0,375.

Cu toate acestea, numărarea în acest fel este plictisitoare. Deja pentru 10 monede, va fi foarte dificil să obțineți numărul total de opțiuni prin forță brută. Prin urmare, oamenii inteligenți au inventat cu mult timp în urmă o formulă, cu ajutorul căreia calculează numărul de combinații diferite de n elemente prin k, Unde n este numărul total de elemente, k este numărul de elemente ale căror opțiuni de aranjare sunt calculate. Formula combinată a n elemente prin k este:

Lucruri similare au loc în secțiunea de combinatorie. Trimit acolo pe toți cei care doresc să-și îmbunătățească cunoștințele. De aici, apropo, numele distribuției binomiale (formula de mai sus este coeficientul de expansiune al binomului Newton).

Formula pentru determinarea probabilității poate fi generalizată cu ușurință la orice număr nși k. Ca rezultat, formula de distribuție binomială are următoarea formă.

Cu alte cuvinte: înmulțiți numărul de combinații potrivite cu probabilitatea uneia dintre ele.

Pentru uz practic este suficient doar să cunoaștem formula distribuției binomiale. Și poate nici nu știți - mai jos este cum să determinați probabilitatea folosind Excel. Dar e mai bine să știi.

Să folosim această formulă pentru a calcula probabilitatea de a obține 40 de capete în 100 de aruncări:

Sau doar 1,08%. Pentru comparație, probabilitatea așteptării matematice a acestui experiment, adică 50 de capete, este de 7,96%. Probabilitatea maximă a unei valori binomiale aparține valorii corespunzătoare așteptării matematice.

Calcularea probabilităților de distribuție binomială în Excel

Dacă utilizați doar hârtie și un calculator, atunci calcule folosind formula distribuție binomială, în ciuda absenței integralelor, sunt destul de dificile. De exemplu, o valoare de 100! - are mai mult de 150 de caractere. Este imposibil să calculați acest lucru manual. Anterior, și chiar acum, se foloseau formule aproximative pentru a calcula astfel de cantități. În acest moment, este recomandabil să folosiți software special, precum MS Excel. Astfel, orice utilizator (chiar și un umanist de educație) poate calcula cu ușurință probabilitatea valorii unei variabile aleatoare distribuite binomial.

Pentru a consolida materialul, vom folosi Excel deocamdată ca un calculator obișnuit, adică. Să facem un calcul pas cu pas folosind formula de distribuție binomială. Să calculăm, de exemplu, probabilitatea de a obține 50 de capete. Mai jos este o poză cu pașii de calcul și rezultatul final.

După cum puteți vedea, rezultatele intermediare sunt de o asemenea scară încât nu se potrivesc într-o celulă, deși funcții simple de tipul sunt folosite peste tot: FACTOR (calcul factorial), POWER (ridicarea unui număr la o putere), precum și ca operatori de înmulţire şi împărţire. Mai mult, acest calcul este destul de greoi, în orice caz nu este compact, deoarece multe celule implicate. Și da, este greu să-ți dai seama.

În general, Excel oferă o funcție gata făcută pentru calcularea probabilităților distribuției binomiale. Funcția se numește BINOM.DIST.

Numărul de succese este numărul de încercări reușite. Avem 50 dintre ele.

Numărul de încercări- număr de aruncări: de 100 de ori.

Probabilitatea de succes– probabilitatea de a obține capete la o aruncare este de 0,5.

Integral- este indicat fie 1, fie 0. Dacă 0, atunci probabilitatea este calculată P(B=k); dacă 1, atunci se calculează funcția de distribuție binomială, i.e. suma tuturor probabilităților de la B=0 inainte de B=k inclusiv.

Apăsăm OK și obținem același rezultat ca mai sus, doar totul a fost calculat de o singură funcție.

Foarte confortabil. De dragul experimentului, în loc de ultimul parametru 0, punem 1. Obținem 0,5398. Aceasta înseamnă că în 100 de aruncări de monede, probabilitatea de a obține capete între 0 și 50 este de aproape 54%. Și la început părea că ar trebui să fie de 50%. În general, calculele se fac ușor și rapid.

Un analist adevărat trebuie să înțeleagă cum se comportă funcția (care este distribuția ei), așa că haideți să calculăm probabilitățile pentru toate valorile de la 0 la 100. Adică să ne întrebăm: care este probabilitatea ca niciun vultur să nu cadă, că va cădea 1 vultur, 2, 3, 50, 90 sau 100. Calculul este prezentat în următoarea imagine în mișcare. Linia albastră este distribuția binomială în sine, punctul roșu este probabilitatea pentru un anumit număr de succese k.

S-ar putea întreba, nu este distribuția binomială similară cu... Da, foarte asemănătoare. Chiar și De Moivre (în 1733) spunea că cu eșantioane mari se apropie distribuția binomială (nu știu cum se numea atunci), dar nimeni nu l-a ascultat. Doar Gauss, și apoi Laplace, 60-70 de ani mai târziu, au redescoperit și studiat cu atenție legea distribuției normale. Graficul de mai sus arată clar că probabilitatea maximă cade pe așteptarea matematică și, pe măsură ce se abate de la aceasta, scade brusc. La fel ca legea normală.

Distribuția binomială este de mare importanță practică, apare destul de des. Prin utilizarea calcule Excel realizat rapid si usor. Așa că nu ezitați să-l utilizați.

În acest sens îmi propun să-mi iau rămas bun până la următoarea întâlnire. Toate cele bune, fiți sănătoși!


Desigur, atunci când se calculează funcția de distribuție cumulativă, ar trebui să se folosească relația menționată între distribuțiile binomiale și beta. Această metodă este cu siguranță mai bună decât însumarea directă atunci când n > 10.

În manualele clasice de statistică, pentru a obține valorile distribuției binomiale, se recomandă adesea utilizarea formulelor bazate pe teoreme limită (cum ar fi formula Moivre-Laplace). Trebuie remarcat faptul că din punct de vedere pur computaţional valoarea acestor teoreme este aproape de zero, mai ales acum, când există un computer puternic pe aproape fiecare masă. Principalul dezavantaj al aproximărilor de mai sus este acuratețea lor complet insuficientă pentru valorile lui n tipice pentru majoritatea aplicațiilor. Un dezavantaj nu mai mic este absența oricăror recomandări clare cu privire la aplicabilitatea uneia sau alteia aproximări (în textele standard sunt date doar formulări asimptotice, nu sunt însoțite de estimări de acuratețe și, prin urmare, sunt de puțin folos). Aș spune că ambele formule sunt valabile doar pentru n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Nu iau în considerare aici problema găsirii cuantilelor: pentru distribuțiile discrete, este banală, iar în acele probleme în care apar astfel de distribuții, ea, de regulă, nu este relevantă. Dacă mai sunt necesare cuantile, recomand reformularea problemei în așa fel încât să se lucreze cu valorile p (semnificații observate). Iată un exemplu: la implementarea unor algoritmi de enumerare, la fiecare pas este necesară verificarea ipoteza statistica despre o variabilă aleatoare binomială. Conform abordării clasice, la fiecare pas este necesar să se calculeze statisticile criteriului și să se compare valoarea acestuia cu limita mulțimii critice. Deoarece, totuși, algoritmul este enumerativ, este necesar să se determine din nou granița setului critic de fiecare dată (la urma urmei, dimensiunea eșantionului se schimbă de la pas la pas), ceea ce crește neproductiv costurile de timp. Abordare modernă recomandă calcularea semnificației observate și compararea acesteia cu nivel de încredere, economisind la căutarea cuantilelor.

Prin urmare, următoarele coduri nu calculează funcția inversă, în schimb, este dată funcția rev_binomialDF, care calculează probabilitatea p de succes într-o singură încercare având în vedere numărul n de încercări, numărul m de succese din acestea și valoarea y a probabilității de a obține aceste m succese. Aceasta folosește relația menționată mai sus dintre distribuțiile binomiale și beta.

De fapt, această funcție vă permite să obțineți limitele intervalelor de încredere. Într-adevăr, să presupunem că obținem m succese în n încercări binomiale. După cum știți, marginea stângă a unui cu două fețe interval de încredere pentru parametrul p cu un nivel de încredere este 0 dacă m = 0, iar pentru este soluția ecuației . În mod similar, limita dreaptă este 1 dacă m = n și pentru este o soluție a ecuației . Aceasta implică faptul că pentru a găsi limita stângă, trebuie să rezolvăm ecuația , și pentru a căuta cea potrivită - ecuația . Acestea sunt rezolvate în funcțiile binom_leftCI și binom_rightCI , care returnează limitele superioare și, respectiv, inferioare ale intervalului de încredere cu două fețe.

Vreau să observ că, dacă nu este necesară o precizie absolut incredibilă, atunci pentru n suficient de mare, puteți utiliza următoarea aproximare [B.L. van der Waerden, Statistica matematică. M: IL, 1960, cap. 2, sec. 7]: , unde g este cuantila distribuției normale. Valoarea acestei aproximări este că există aproximări foarte simple care vă permit să calculați cuantilele distribuției normale (vezi textul despre calcularea distribuției normale și secțiunea corespunzătoare a acestei referințe). În practica mea (în principal pentru n > 100), această aproximare a dat aproximativ 3-4 cifre, ceea ce, de regulă, este destul de suficient.

Calculele cu următoarele coduri necesită fișierele betaDF.h , betaDF.cpp (vezi secțiunea despre distribuția beta), precum și logGamma.h , logGamma.cpp (vezi anexa A). De asemenea, puteți vedea un exemplu de utilizare a funcțiilor.

fișier binomialDF.h

#ifndef __BINOMIAL_H__ #include "betaDF.h" binom dubluDF(încercări duble, succese duble, p dublu); /* * Să fie „încercări” de observații independente * cu probabilitatea „p” de succes în fiecare. * Calculați probabilitatea B(reușite|încercări,p) ca numărul * de succese să fie între 0 și „reușite” (inclusiv). */ double rev_binomialDF(încercări duble, succese duble, y dublu); /* * Fie cunoscută probabilitatea y de cel puțin m succese * în încercările schemei Bernoulli. Funcția găsește probabilitatea p * de succes într-o singură încercare. * * Următoarea relație este utilizată în calcule * * 1 - p = rev_Beta(încercări-reușite| succese+1, y). */ double binom_leftCI(double trials, double success, double level); /* Să fie „încercări” de observații independente * cu probabilitatea „p” de succes în fiecare * iar numărul de succese este „reușite”. * Limita stângă a intervalului de încredere cu două fețe * este calculată cu nivelul nivelului de semnificație. */ double binom_rightCI(double n, double succeses, double level); /* Să fie „încercări” de observații independente * cu probabilitatea „p” de succes în fiecare * iar numărul de succese este „reușite”. * Limita dreaptă a intervalului de încredere cu două fețe * este calculată cu nivelul nivelului de semnificație. */ #endif /* Se termină #ifndef __BINOMIAL_H__ */

fișier binomialDF.cpp

/************************************************ **** **********/ /* Distribuție binomială */ /**************************** **** ****************************/ #include #include #include "betaDF.h" ENTRY double binomDF(dublu n, dublu m, dublu p) /* * Fie "n" observații independente * cu probabilitatea "p" de succes în fiecare. * Calculați probabilitatea B(m|n,p) ca numărul de reușite să fie * între 0 și „m” (inclusiv), adică. * suma probabilităților binomiale de la 0 la m: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * Calculele nu implică o însumare stupidă - * se folosește următoarea relație cu distribuția beta centrală: * * B(m|n,p) = Beta(1-p|n-m,m+1). * * Argumentele trebuie să fie pozitive, cu 0<= p <= 1. */ { assert((n >0) && (p >= 0) && (p<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) întoarcere 1; altfel returnează BetaDF(n-m, m+1).valoare(1-p); )/* binomialDF */ ENTRY double rev_binomialDF(double n, double m, double y) /* * Fie cunoscută probabilitatea y de cel puțin m succese * în n încercări ale schemei Bernoulli. Funcția găsește probabilitatea p * de succes într-o singură încercare. * * Următoarea relație este utilizată în calcule * * 1 - p = rev_Beta(y|n-m,m+1). */ ( afirmă ((n > 0) && (m >= 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

Capitolul 7

Legile specifice de distribuție a variabilelor aleatoare

Tipuri de legi de distribuție a variabilelor aleatoare discrete

Fie ca o variabilă aleatorie discretă să ia valorile X 1 , X 2 , …, x n, … . Probabilitățile acestor valori pot fi calculate folosind diverse formule, de exemplu, folosind teoremele de bază ale teoriei probabilităților, formula lui Bernoulli sau alte formule. Pentru unele dintre aceste formule, legea distribuției are propriul nume.

Cele mai comune legi ale distribuției unei variabile aleatoare discrete sunt binomiale, geometrice, hipergeometrice, legea distribuției lui Poisson.

Legea distribuției binomiale

Lasă-l să fie produs n studii independente, în fiecare dintre acestea un eveniment poate sau nu să apară ȘI. Probabilitatea de apariție a acestui eveniment în fiecare încercare este constantă, nu depinde de numărul procesului și este egală cu R=R(ȘI). De aici probabilitatea ca evenimentul să nu se producă ȘIîn fiecare test este de asemenea constantă și egală cu q=1–R. Luați în considerare o variabilă aleatorie X egal cu numărul de apariţii ale evenimentului ȘIîn n teste. Este evident că valorile acestei cantități sunt egale cu

X 1 =0 - eveniment ȘIîn n testele nu au apărut;

X 2 =1 – eveniment ȘIîn n procesele au apărut o dată;

X 3 =2 - eveniment ȘIîn n procesele au apărut de două ori;

…………………………………………………………..

x n +1 = n- eveniment ȘIîn n testele au apărut totul n o singura data.

Probabilitățile acestor valori pot fi calculate folosind formula Bernoulli (4.1):

Unde la=0, 1, 2, …,n .

Legea distribuției binomiale X egal cu numărul de succese în nÎncercările Bernoulli, cu probabilitate de succes R.

Deci, o variabilă aleatorie discretă are o distribuție binomială (sau este distribuită conform legii binomiale) dacă valorile sale posibile sunt 0, 1, 2, …, n, iar probabilitățile corespunzătoare sunt calculate prin formula (7.1).

Distribuția binomială depinde de două parametrii Rși n.

Seria de distribuție a unei variabile aleatoare distribuite conform legii binomiale are forma:

X k n
R

Exemplu 7.1 . Trei focuri independente sunt trase în țintă. Probabilitatea de a lovi fiecare lovitură este de 0,4. Valoare aleatoare X- numărul de lovituri pe țintă. Construiți-i seria de distribuție.

Decizie. Valori posibile ale unei variabile aleatorii X sunt X 1 =0; X 2 =1; X 3 =2; X 4=3. Găsiți probabilitățile corespunzătoare folosind formula Bernoulli. Este ușor de demonstrat că aplicarea acestei formule aici este pe deplin justificată. Rețineți că probabilitatea de a nu lovi ținta cu o singură lovitură va fi egală cu 1-0,4=0,6. obține

Seria de distribuție are următoarea formă:

X
R 0,216 0,432 0,288 0,064

Este ușor de verificat dacă suma tuturor probabilităților este egală cu 1. Variabila aleatoare în sine X distribuite conform legii binomiale. ■

Să găsim așteptarea și varianța matematică a unei variabile aleatoare distribuite conform legii binomiale.

La rezolvarea exemplului 6.5, s-a arătat că așteptarea matematică a numărului de apariții ale unui eveniment ȘIîn n teste independente, dacă probabilitatea de apariție ȘIîn fiecare test este constantă și egală R, egal n· R

În acest exemplu, a fost folosită o variabilă aleatoare, distribuită conform legii binomiale. Prin urmare, soluția din Exemplul 6.5 este, de fapt, o demonstrație a următoarei teoreme.

Teorema 7.1. Așteptarea matematică a unei variabile aleatoare discrete distribuite conform legii binomiale este egală cu produsul dintre numărul de încercări și probabilitatea de „reușită”, i.e. M(X)=n· R.

Teorema 7.2. Varianta unei variabile aleatoare discrete distribuite conform legii binomiale este egală cu produsul dintre numărul de încercări cu probabilitatea de „reușit” și probabilitatea de „eșec”, i.e. D(X)=npq.

Deformarea și curtoza unei variabile aleatoare distribuite conform legii binomiale sunt determinate de formulele

Aceste formule pot fi obținute folosind conceptul de momente inițiale și centrale.

Legea distribuției binomiale stă la baza multor situații reale. Pentru valori mari n distribuția binomială poate fi aproximată prin alte distribuții, în special distribuția Poisson.

Distribuția Poisson

Să fie n Procesele Bernoulli, cu numărul de încercări n destul de mare. Anterior, s-a arătat că în acest caz (dacă, în plus, probabilitatea R evoluții ȘI foarte mic) pentru a afla probabilitatea ca un eveniment ȘI a aparea t odată ajuns la teste, puteți folosi formula Poisson (4.9). Dacă variabila aleatoare Xînseamnă numărul de apariții ale evenimentului ȘIîn nîncercări Bernoulli, apoi probabilitatea ca X va căpăta sensul k poate fi calculat prin formula

, (7.2)

Unde λ = np.

Legea distribuției Poisson se numește distribuția unei variabile aleatoare discrete X, pentru care valorile posibile sunt numere întregi nenegative și probabilitățile p t aceste valori se găsesc prin formula (7.2).

Valoare λ = np numit parametru Distribuția Poisson.

O variabilă aleatoare distribuită conform legii lui Poisson poate lua un număr infinit de valori. Deoarece pentru această distribuţie probabilitatea R apariția unui eveniment în fiecare proces este mică, atunci această distribuție este uneori numită legea fenomenelor rare.

Seria de distribuție a unei variabile aleatoare distribuită conform legii Poisson are forma

X t
R

Este ușor de verificat că suma probabilităților celui de-al doilea rând este egală cu 1. Pentru a face acest lucru, trebuie să ne amintim că funcția poate fi extinsă într-o serie Maclaurin, care converge pentru orice X. În acest caz avem

. (7.3)

După cum sa menționat, legea lui Poisson în anumite cazuri limită înlocuiește legea binomială. Un exemplu este o variabilă aleatorie X, ale căror valori sunt egale cu numărul de defecțiuni pentru o anumită perioadă de timp cu utilizarea repetată a unui dispozitiv tehnic. Se presupune că acest dispozitiv este de înaltă fiabilitate, adică probabilitatea de eșec într-o aplicație este foarte mică.

Pe lângă astfel de cazuri limitative, în practică există variabile aleatoare distribuite conform legii Poisson, care nu au legătură cu distribuția binomială. De exemplu, distribuția Poisson este adesea folosită atunci când se tratează numărul de evenimente care au loc într-o perioadă de timp (numărul de apeluri către centrala telefonică în timpul orei, numărul de mașini care au ajuns la spălătorie în timpul zilei, numărul de opriri ale mașinii pe săptămână etc.). Toate aceste evenimente trebuie să formeze așa-numitul flux de evenimente, care este unul dintre conceptele de bază ale teoriei cozilor. Parametru λ caracterizează intensitatea medie a fluxului de evenimente.

Distribuția binomială este una dintre cele mai importante distribuții de probabilitate pentru o variabilă aleatoare care se schimbă discret. Distribuția binomială este distribuția de probabilitate a unui număr m eveniment ȘIîn n observații reciproc independente. Adesea un eveniment ȘI numit „succes” al observației, iar evenimentul opus - „eșec”, dar această desemnare este foarte condiționată.

Termenii distribuției binomiale:

  • efectuate in totalitate n procese în care evenimentul ȘI poate sau nu să apară;
  • eveniment ȘIîn fiecare dintre încercări pot apărea cu aceeași probabilitate p;
  • testele sunt independente reciproc.

Probabilitatea ca în n eveniment de testare ȘI exact m ori, poate fi calculat folosind formula Bernoulli:

,

Unde p- probabilitatea producerii evenimentului ȘI;

q = 1 - p este probabilitatea ca evenimentul opus să se producă.

Să ne dăm seama de ce distribuția binomială este legată de formula Bernoulli în modul descris mai sus . Eveniment - numărul de succese la n testele sunt împărțite într-un număr de opțiuni, în fiecare dintre acestea succesul este obținut în mîncercări și eșec - în n - m teste. Luați în considerare una dintre aceste opțiuni - B1 . Conform regulii adunării probabilităților, înmulțim probabilitățile evenimentelor opuse:

,

iar dacă notăm q = 1 - p, apoi

.

Aceeași probabilitate va avea orice altă opțiune în care m succes și n - m eșecuri. Numărul de astfel de opțiuni este egal cu numărul de moduri în care este posibil n test get m succes.

Suma probabilităților tuturor m numărul evenimentului ȘI(numerele de la 0 la n) este egal cu unu:

unde fiecare termen este un termen al binomului Newton. Prin urmare, distribuția considerată se numește distribuție binomială.

În practică, este adesea necesar să se calculeze probabilitățile „cel mult m succes in n teste” sau „cel puțin m succes in n teste". Pentru aceasta se folosesc următoarele formule.

Funcția integrală, adică probabilitate F(m) că în n eveniment de observare ȘI nu va mai veni m o singura data, poate fi calculat folosind formula:

In schimb probabilitate F(≥m) că în n eveniment de observare ȘI vino măcar m o singura data, se calculează prin formula:

Uneori este mai convenabil să se calculeze probabilitatea ca în n eveniment de observare ȘI nu va mai veni m ori, prin probabilitatea evenimentului opus:

.

Care dintre formule să folosiți depinde de care dintre ele conține mai puțini termeni.

Caracteristicile distribuției binomiale se calculează folosind următoarele formule .

Valorea estimata: .

dispersie: .

Deviație standard: .

Distribuție binomială și calcule în MS Excel

Probabilitatea distribuției binomiale P n ( m) și valoarea funcției integrale F(m) poate fi calculat folosind funcția MS Excel BINOM.DIST. Fereastra pentru calculul corespunzător este prezentată mai jos (faceți clic pe butonul stâng al mouse-ului pentru a mări).


MS Excel vă solicită să introduceți următoarele date:

  • numărul de succese;
  • numărul de teste;
  • probabilitatea de succes;
  • integrală - valoare logică: 0 - dacă trebuie să calculați probabilitatea P n ( m) și 1 - dacă probabilitatea F(m).

Exemplul 1 Managerul companiei a rezumat informații despre numărul de camere vândute în ultimele 100 de zile. Tabelul rezumă informațiile și calculează probabilitățile ca un anumit număr de camere să fie vândute pe zi.

Ziua se încheie cu un profit dacă sunt vândute 13 sau mai multe camere. Probabilitatea ca ziua să fie calculată cu profit:

Probabilitatea ca ziua să fie lucrată fără profit:

Fie ca probabilitatea ca ziua să fie calculată cu profit să fie constantă și egală cu 0,61, iar numărul de camere vândute pe zi nu depinde de zi. Apoi puteți utiliza distribuția binomială, unde evenimentul ȘI- ziua va fi calculată cu profit, - fără profit.

Probabilitatea ca din 6 zile toate să fie rezolvate cu profit:

.

Obținem același rezultat folosind funcția MS Excel BINOM.DIST (valoarea valorii integrale este 0):

P 6 (6 ) = BINOM.DIST(6; 6; 0,61; 0) = 0,052.

Probabilitatea ca din 6 zile 4 sau mai multe zile să fie lucrate cu profit:

Unde ,

,

Folosind funcția MS Excel BINOM.DIST, calculăm probabilitatea ca din 6 zile nu mai mult de 3 zile să fie finalizate cu profit (valoarea valorii integrale este 1):

P 6 (≤3 ) = BINOM.DIST(3, 6, 0,61, 1) = 0,435.

Probabilitatea ca din 6 zile toate să fie rezolvate cu pierderi:

,

Calculăm același indicator folosind funcția MS Excel BINOM.DIST:

P 6 (0 ) = BINOM.DIST(0; 6; 0,61; 0) = 0,0035.

Rezolvați singur problema și apoi vedeți soluția

Exemplul 2 O urna contine 2 bile albe si 3 negre. Se scoate o minge din urna, se pune culoarea si se pune la loc. Încercarea se repetă de 5 ori. Numărul de apariții de bile albe este o variabilă aleatorie discretă X, distribuit conform legii binomului. Alcătuiți legea distribuției unei variabile aleatoare. Determinați modul, așteptările matematice și varianța.

Continuăm să rezolvăm problemele împreună

Exemplul 3 De la serviciul de curierat a mers la obiecte n= 5 curieri. Fiecare curier cu o probabilitate p= 0,3 este întârziat pentru obiect, indiferent de celelalte. Variabilă aleatoare discretă X- numarul de curieri intarziati. Construiți o serie de distribuție a acestei variabile aleatoare. Găsiți așteptările matematice, varianța, abaterea standard. Găsiți probabilitatea ca cel puțin doi curieri să întârzie obiectele.

Teoria probabilității este prezentă invizibil în viața noastră. Nu îi acordăm atenție, dar fiecare eveniment din viața noastră are una sau alta probabilitate. Având în vedere numărul mare de scenarii posibile, devine necesar să stabilim cel mai probabil și cel mai puțin probabil dintre ele. Cel mai convenabil este să analizați grafic astfel de date probabilistice. Distribuția ne poate ajuta în acest sens. Binomul este unul dintre cele mai simple și mai precise.

Înainte de a trece direct la matematică și teoria probabilității, să ne dăm seama cine a fost primul care a venit cu acest tip de distribuție și care este istoria dezvoltării aparatului matematic pentru acest concept.

Istorie

Conceptul de probabilitate este cunoscut din cele mai vechi timpuri. Cu toate acestea, matematicienii antici nu i-au acordat prea multă importanță și au putut doar să pună bazele unei teorii care a devenit ulterior teoria probabilității. Au creat niște metode combinatorii care i-au ajutat foarte mult pe cei care au creat și dezvoltat ulterior teoria în sine.

În a doua jumătate a secolului al XVII-lea a început formarea conceptelor și metodelor de bază ale teoriei probabilităților. Au fost introduse definiții ale variabilelor aleatoare, metode de calcul a probabilității unor evenimente simple și complexe independente și dependente. Un astfel de interes pentru variabilele aleatoare și probabilitățile a fost dictat de jocurile de noroc: fiecare persoană dorea să știe care sunt șansele sale de a câștiga jocul.

Următorul pas a fost aplicarea metodelor de analiză matematică în teoria probabilităților. Eminenți matematicieni precum Laplace, Gauss, Poisson și Bernoulli au preluat această sarcină. Ei au fost cei care au avansat în această zonă a matematicii nou nivel. James Bernoulli a fost cel care a descoperit legea binomială distributie. Apropo, după cum vom afla mai târziu, pe baza acestei descoperiri, s-au făcut mai multe, care au făcut posibilă crearea legii distribuției normale și multe altele.

Acum, înainte de a începe să descriem distribuția binomială, ne vom reîmprospăta puțin în memoria conceptelor de teoria probabilităților, probabil deja uitate de la banca școlii.

Fundamentele teoriei probabilităților

Vom lua în considerare astfel de sisteme, în urma cărora sunt posibile doar două rezultate: „succes” și „eșec”. Acest lucru este ușor de înțeles cu un exemplu: aruncăm o monedă, bănuind că vor cădea cozi. Probabilitățile fiecăruia dintre evenimentele posibile (căderea cozilor – „succes”, căderea capetelor – „nu succes”) sunt egale cu 50 la sută dacă moneda este perfect echilibrată și nu există alți factori care pot afecta experimentul.

A fost cel mai simplu eveniment. Dar există și sisteme complexe în care sunt efectuate acțiuni secvențiale, iar probabilitățile rezultatelor acestor acțiuni vor diferi. De exemplu, luați în considerare următorul sistem: într-o cutie al cărei conținut nu îl putem vedea, există șase bile absolut identice, trei perechi de albastre, roșii și flori albe. Trebuie să luăm câteva bile la întâmplare. Prin urmare, scoțând mai întâi una dintre bile albe, vom reduce de câteva ori probabilitatea ca următoarea să obținem și o bilă albă. Acest lucru se întâmplă deoarece numărul de obiecte din sistem se modifică.

În secțiunea următoare, ne vom uita la concepte matematice mai complexe care ne apropie de ceea ce cuvintele " distributie normala"," distribuție binomială "și altele asemenea.

Elemente de statistică matematică

În statistică, care este unul dintre domeniile de aplicare a teoriei probabilității, există multe exemple în care datele pentru analiză nu sunt date în mod explicit. Adică nu în numere, ci sub formă de împărțire în funcție de caracteristici, de exemplu, în funcție de gen. Pentru a aplica un aparat matematic unor astfel de date și pentru a trage unele concluzii din rezultatele obținute, este necesară convertirea datelor inițiale într-un format numeric. De regulă, pentru a implementa acest lucru, unui rezultat pozitiv i se atribuie o valoare de 1, iar unui rezultat negativ i se atribuie o valoare de 0. Astfel, obținem date statistice care pot fi analizate folosind metode matematice.

Următorul pas în înțelegerea distribuției binomiale a unei variabile aleatoare este de a determina varianța variabilei aleatoare și așteptarea matematică. Vom vorbi despre asta în secțiunea următoare.

Valorea estimata

De fapt, înțelegerea a ceea ce este așteptarea matematică nu este dificilă. Luați în considerare un sistem în care există multe evenimente diferite cu propriile lor probabilități diferite. Așteptările matematice se vor numi o valoare egală cu suma produselor valorilor acestor evenimente (în forma matematică despre care am vorbit în ultima secțiune) și probabilitatea apariției lor.

Așteptările matematice ale distribuției binomiale se calculează conform aceleiași scheme: luăm valoarea unei variabile aleatoare, o înmulțim cu probabilitatea unui rezultat pozitiv și apoi rezumăm datele obținute pentru toate variabilele. Este foarte convenabil să prezentați aceste date grafic - în acest fel diferența dintre așteptările matematice ale diferitelor valori este mai bine percepută.

În secțiunea următoare, vă vom spune puțin despre un concept diferit - varianța unei variabile aleatoare. De asemenea, este strâns legat de un astfel de concept precum distribuția de probabilitate binomială și este caracteristica acestuia.

Varianta distributiei binomiale

Această valoare este strâns legată de cea anterioară și, de asemenea, caracterizează distribuția datelor statistice. Reprezintă pătratul mediu al abaterilor valorilor de la așteptările lor matematice. Adică, varianța unei variabile aleatoare este suma diferențelor pătrate dintre valoarea variabilei aleatoare și a acesteia. așteptări matematiceînmulțit cu probabilitatea acestui eveniment.

În general, acesta este tot ce trebuie să știm despre varianță pentru a înțelege care este distribuția de probabilitate binomială. Acum să trecem la subiectul nostru principal. Și anume, ce se află în spatele unei astfel de expresii aparent destul de complicate „legea distribuției binomiale”.

Distribuție binomială

Să înțelegem mai întâi de ce această distribuție este binomială. Provine de la cuvântul „binom”. Poate că ați auzit de binomul lui Newton - o formulă care poate fi folosită pentru a extinde suma oricăror două numere a și b la orice putere nenegativă a lui n.

După cum probabil ați ghicit deja, formula binomială a lui Newton și formula de distribuție binomială sunt aproape aceleași formule. Cu singura excepție că al doilea are o valoare aplicată pentru cantități specifice, iar primul este doar un instrument matematic general, ale cărui aplicații în practică pot fi diferite.

Formule de distribuție

Funcția de distribuție binomială poate fi scrisă ca suma următorilor termeni:

(n!/(n-k)!k!)*p k *q n-k

Aici n este numărul de experimente aleatoare independente, p este numărul de rezultate reușite, q este numărul de rezultate nereușite, k este numărul experimentului (poate lua valori de la 0 la n)! - desemnarea unui factorial, o astfel de funcție a unui număr, a cărui valoare este egală cu produsul tuturor numerelor care merg până la el (de exemplu, pentru numărul 4: 4!=1*2*3*4= 24).

În plus, funcția de distribuție binomială poate fi scrisă ca o funcție beta incompletă. Cu toate acestea, aceasta este mai mult definiție complexă, care este folosit numai la rezolvarea unor probleme statistice complexe.

Distribuția binomială, exemple din care am examinat mai sus, este una dintre cele mai multe specii simple distribuții în teoria probabilităților. Există și o distribuție normală, care este un tip de distribuție binomială. Este cel mai des folosit și cel mai ușor de calculat. Există și o distribuție Bernoulli, o distribuție Poisson, o distribuție condiționată. Toate acestea caracterizează grafic zonele de probabilitate ale unui anumit proces în diferite condiții.

În secțiunea următoare, vom lua în considerare aspecte legate de aplicarea acestui aparat matematic în viata reala. La prima vedere, desigur, se pare că acesta este un alt lucru matematic, care, ca de obicei, nu își găsește aplicație în viața reală și, în general, nu este nevoie de nimeni, cu excepția matematicienilor înșiși. Cu toate acestea, acesta nu este cazul. La urma urmei, toate tipurile de distribuții și reprezentările lor grafice au fost create exclusiv în scopuri practice și nu ca un capriciu al oamenilor de știință.

Aplicație

De departe, cea mai importantă aplicație a distribuțiilor este în statistică, unde este necesară o analiză complexă a unei multitudini de date. După cum arată practica, foarte multe matrice de date au aproximativ aceleași distribuții de valori: regiunile critice cu valori foarte scăzute și foarte mari, de regulă, conțin mai puține elemente decât valorile medii.

Analiza matricelor mari de date este necesară nu numai în statistică. Este indispensabil, de exemplu, în chimia fizică. În această știință, este folosit pentru a determina multe cantități care sunt asociate cu vibrații aleatorii și mișcări ale atomilor și moleculelor.

În secțiunea următoare, vom discuta cât de important este folosirea acestora concepte statistice, ca un binom distribuția unei variabile aleatoare în Viata de zi cu zi pentru tine si mine.

De ce am nevoie de el?

Mulți oameni își pun această întrebare când vine vorba de matematică. Și apropo, matematica nu este degeaba numită regina științelor. Este baza fizicii, chimiei, biologiei, economiei, iar în fiecare dintre aceste științe se folosește și un fel de distribuție: indiferent dacă este o distribuție binomială discretă sau una normală, nu contează. Și dacă aruncăm o privire mai atentă asupra lumii din jurul nostru, vom vedea că matematica este folosită peste tot: în viața de zi cu zi, la locul de muncă și chiar relațiile umane pot fi prezentate sub formă de date statistice și analizate (aceasta, de altfel , se realizeaza de catre cei care lucreaza in organizatii speciale implicate in colectarea informatiilor).

Acum haideți să vorbim puțin despre ce să faceți dacă aveți nevoie să știți mult mai multe despre acest subiect decât ceea ce am subliniat în acest articol.

Informațiile pe care le-am oferit în acest articol sunt departe de a fi complete. Există multe nuanțe cu privire la forma pe care o poate lua distribuția. Distribuția binomială, așa cum am aflat deja, este unul dintre principalele tipuri pe care se bazează toate statisticile matematice și teoria probabilității.

Dacă devii interesat, sau în legătură cu munca ta, trebuie să știi mult mai multe pe această temă, va trebui să studiezi literatura de specialitate. Ar trebui să începi cu un curs universitar de analiză matematică și să mergi acolo la secțiunea despre teoria probabilității. De asemenea, cunoștințele în domeniul seriei vor fi utile, deoarece distribuția de probabilitate binomială nu este altceva decât o serie de termeni succesivi.

Concluzie

Înainte de a termina articolul, am dori să vă mai spunem un lucru interesant. Se referă direct la subiectul articolului nostru și la întreaga matematică în general.

Mulți oameni spun că matematica este o știință inutilă și nimic din ceea ce au învățat la școală nu le-a fost de folos. Dar cunoașterea nu este niciodată de prisos, iar dacă ceva nu îți este de folos în viață, înseamnă că pur și simplu nu-ți amintești. Dacă ai cunoștințe, ei te pot ajuta, dar dacă nu le ai, atunci nu te poți aștepta la ajutor de la ei.

Deci, am examinat conceptul de distribuție binomială și toate definițiile asociate cu acesta și am vorbit despre modul în care este aplicat în viața noastră.



eroare: Conținutul este protejat!!