Odaberite Stranica

Zakon binomne distribucije. Binomna distribucija

Pozdrav svim čitaocima!

Statistička analiza se, kao što znamo, bavi prikupljanjem i obradom stvarnih podataka. Posao je koristan, a često i profitabilan, jer... ispravni zaključci vam omogućavaju da izbjegnete greške i gubitke u budućnosti, a ponekad i ispravno pogodite ovu budućnost. Prikupljeni podaci odražavaju stanje neke uočene pojave. Podaci su često (ali ne uvijek) numerički i mogu se matematički manipulirati kako bi se izdvojile dodatne informacije.

Međutim, ne mjere se svi fenomeni na kvantitativnoj skali kao što je 1, 2, 3 ... 100500 ... Fenomen ne može uvijek poprimiti beskonačan ili veliki broj različitih stanja. Na primjer, spol osobe može biti ili M ili F. Strijelac ili pogađa metu ili promašuje. Možete glasati ili "za" ili "protiv" itd. itd. Drugim riječima, takvi podaci odražavaju stanje alternativnog atributa - ili "da" (događaj se dogodio) ili "ne" (događaj se nije dogodio). Događaj koji se dogodio (pozitivan ishod) naziva se i „uspjeh“. Takve pojave također mogu biti rasprostranjene i nasumične. Stoga se mogu izmjeriti i izvući statistički valjani zaključci.

Eksperimenti sa takvim podacima se nazivaju Bernoullijeva šema, u čast poznatog švajcarskog matematičara koji je to ustanovio kada velike količine testova, odnos pozitivnih ishoda i ukupnog broja testova teži verovatnoći nastanka ovog događaja.

Alternativna karakteristična varijabla

Da bi se u analizi koristio matematički aparat, rezultate takvih opažanja treba zapisati u numeričkom obliku. Da bi se to postiglo, pozitivnom ishodu se dodeljuje broj 1, negativnom - 0. Drugim rečima, radi se o promenljivoj koja može imati samo dve vrednosti: 0 ili 1.

Kakva korist se može izvući iz ovoga? Zapravo, ništa manje nego iz običnih podataka. Dakle, lako je izračunati broj pozitivnih ishoda - samo zbrojite sve vrijednosti, tj. sve 1 (uspjeh). Možete ići dalje, ali ovo će zahtijevati uvođenje nekoliko oznaka.

Prva stvar koju treba primijetiti je da pozitivni ishodi (koji su jednaki 1) imaju izvjesnu vjerovatnoću da će se dogoditi. Na primjer, dobijanje glave prilikom bacanja novčića je ½ ili 0,5. Ova vjerovatnoća se tradicionalno označava latinično pismo str. Stoga je vjerovatnoća da se dogodi alternativni događaj jednaka 1 - str, što je takođe označeno sa q, odnosno q = 1 – str. Ove notacije se mogu jasno sistematizirati u obliku tablice varijabilne distribucije X.

Sada imamo listu mogućih vrijednosti i njihove vjerovatnoće. Možemo početi da izračunavamo tako izuzetne karakteristike slučajne varijable kao što je matematičko očekivanje I disperzija. Da vas podsjetim da se matematičko očekivanje izračunava kao zbir proizvoda svih mogućih vrijednosti i njihovih odgovarajućih vjerovatnoća:

Izračunajmo očekivanje koristeći notaciju u gornjim tabelama.

Ispada da je matematičko očekivanje alternativnog znaka jednako vjerovatnoći ovog događaja - str.

Hajde sada da definišemo šta je varijansa alternativnog atributa. Da vas podsjetim i da je disperzija prosječan kvadrat odstupanja od matematičko očekivanje. Opća formula(za diskretne podatke) ima oblik:

Otuda varijansa alternativnog atributa:

Lako je vidjeti da ova disperzija ima maksimum od 0,25 (sa p=0,5).

Standardna devijacija je korijen varijanse:

Maksimalna vrijednost ne prelazi 0,5.

Kao što možete vidjeti, i matematičko očekivanje i varijansa alternativnog atributa imaju vrlo kompaktan oblik.

Binomna distribucija slučajne varijable

Sada pogledajmo situaciju iz drugog ugla. Zaista, koga briga što je prosječan gubitak glava po bacanju 0,5? To je nemoguće ni zamisliti. Zanimljivije je postaviti pitanje o broju glava koje se javljaju za dati broj bacanja.

Drugim riječima, istraživača često zanima vjerovatnoća da će se desiti određeni broj uspješnih događaja. To može biti broj neispravnih proizvoda u testiranoj seriji (1 - neispravan, 0 - dobar) ili broj oporavljenih (1 - zdrav, 0 - bolestan) itd. Broj takvih "uspjeha" bit će jednak zbroju svih vrijednosti varijable X, tj. broj pojedinačnih ishoda.

Slučajna varijabla B naziva se binom i uzima vrijednosti od 0 do n(kod B= 0 - svi dijelovi su prikladni, sa B = n– svi dijelovi su neispravni). Pretpostavlja se da su sve vrijednosti x nezavisni jedno od drugog. Razmotrimo glavne karakteristike binomske varijable, odnosno ustanovićemo njeno matematičko očekivanje, disperziju i distribuciju.

Očekivanje binomske varijable je vrlo lako dobiti. Podsjetimo da postoji zbir matematičkih očekivanja svake dodane vrijednosti i da je isti za sve, dakle:

Na primjer, matematičko očekivanje broja ispuštenih glava u 100 bacanja je 100 × 0,5 = 50.

Sada izvodimo formulu za disperziju binomne varijable. je zbir varijansi. Odavde

Standardna devijacija, respektivno

Za 100 bacanja novčića, standardna devijacija je

Konačno, razmotrite distribuciju binomne vrijednosti, tj. vjerovatnoća da slučajna varijabla Bće prihvatiti različita značenja k, Gdje 0≤k≤n. Za novčić, ovaj problem može izgledati ovako: Kolika je vjerovatnoća da dobijete 40 grla na 100 bacanja?

Da biste razumjeli metodu izračuna, zamislite da se novčić baci samo 4 puta. Svaka strana može ispasti svaki put. Pitamo se kolika je vjerovatnoća da dobijemo 2 glave od 4 bacanja. Svako bacanje je nezavisno jedno od drugog. To znači da će vjerovatnoća dobivanja bilo koje kombinacije biti jednaka proizvodu vjerovatnoće datog ishoda za svako pojedinačno bacanje. Neka su O glave i P repovi. Tada, na primjer, jedna od kombinacija koja nam odgovara može izgledati kao OOPP, odnosno:

Vjerovatnoća takve kombinacije jednaka je umnošku dvije vjerovatnoće da se dobiju glave i još dvije vjerovatnoće da se ne dobiju glave (obrnuti događaj, izračunat kao 1 - str), tj. 0,5×0,5×(1-0,5)×(1-0,5)=0,0625. Ovo je vjerovatnoća jedne od kombinacija koja nam odgovara. Ali pitanje je bilo o ukupnom broju orlova, a ne o nekom konkretnom redu. Zatim morate sabrati vjerovatnoće svih kombinacija u kojima postoje tačno 2 glave. Jasno je da su svi isti (proizvod se ne mijenja kada se promijene faktori). Stoga morate izračunati njihov broj, a zatim pomnožiti s vjerovatnoćom bilo koje takve kombinacije. Izbrojimo sve kombinacije od 4 bacanja po 2 glave: RROO, RORO, ROOR, ORRO, OROR, OORR. Ukupno ima 6 opcija.

Dakle, željena vjerovatnoća da dobijete 2 glave nakon 4 bacanja je 6×0,0625=0,375.

Međutim, brojanje na ovaj način je zamorno. Već za 10 novčića bit će vrlo teško dobiti ukupan broj opcija grubom silom. Stoga su pametni ljudi davno izmislili formulu po kojoj izračunavaju iznos razne kombinacije od n elementi po k, Gdje n– ukupan broj elemenata, k– broj elemenata čije se opcije rasporeda broje. Kombinacija formule od n elementi po k je ovo:

Slične stvari se dešavaju u sekciji kombinatorike. Saljem tamo sve koji zele da unaprede svoje znanje. Otuda, usput rečeno, naziv binomne distribucije (gornja formula je koeficijent u ekspanziji Newtonovog binoma).

Formula za određivanje vjerovatnoće može se lako generalizirati na bilo koju veličinu n I k. Kao rezultat, formula za binomnu distribuciju ima sljedeći oblik.

Riječima: broj kombinacija koje ispunjavaju uvjet pomnožen vjerovatnoćom jedne od njih.

Za praktična upotreba Dovoljno je samo znati formulu za binomnu distribuciju. Ili možda čak i ne znate - u nastavku pokazujemo kako odrediti vjerovatnoću koristeći Excel. Ali bolje je znati.

Koristeći ovu formulu, izračunavamo vjerovatnoću da dobijemo 40 glava u 100 bacanja:

Ili samo 1,08%. Poređenja radi, vjerovatnoća matematičkog očekivanja ovog eksperimenta, odnosno 50 grla, iznosi 7,96%. Maksimalna vjerovatnoća binomske vrijednosti pripada vrijednosti koja odgovara matematičkom očekivanju.

Izračunavanje vjerovatnoće binomne distribucije u Excelu

Ako koristite samo papir i kalkulator, tada su izračuni pomoću formule binomne distribucije, unatoč odsustvu integrala, prilično teški. Na primjer, vrijednost je 100! – ima više od 150 karaktera. Ovo je nemoguće izračunati ručno. Ranije, pa čak i sada, za izračunavanje takvih količina korištene su približne formule. Trenutno je preporučljivo koristiti poseban softver, kao što je MS Excel. Dakle, svaki korisnik (čak i humanista po obrazovanju) može lako izračunati vjerovatnoću vrijednosti binomno raspoređene slučajne varijable.

Za konsolidaciju gradiva koristićemo za sada Excel kao običan kalkulator, tj. Izvršimo izračun korak po korak koristeći formulu binomne distribucije. Izračunajmo, na primjer, vjerovatnoću da dobijemo 50 grla. Ispod je slika sa koracima proračuna i konačnim rezultatom.

Kao što vidite, međurezultati su takve skale da se ne uklapaju u ćeliju, iako se svuda koriste jednostavne funkcije vrste: FACTOR (izračunavanje faktorijala), POWER (podizanje broja na stepen), kao i operatori množenja i dijeljenja. Štaviše, ova kalkulacija je prilično glomazna u svakom slučaju, nije kompaktna, jer; uključene su mnoge ćelije. Da, i malo je teško shvatiti odmah.

Općenito, Excel pruža gotovu funkciju za izračunavanje vjerovatnoće binomne distribucije. Funkcija se zove BINOM.DIST.

Broj uspjeha– broj uspješnih testova. Imamo ih 50.

Broj testova– broj bacanja: 100 puta.

Vjerovatnoća uspjeha– vjerovatnoća dobijanja glave u jednom bacanju je 0,5.

Integral– naznačeno je ili 1 ili 0. Ako je 0, tada se izračunava vjerovatnoća P(B=k); ako je 1, tada će se izračunati funkcija binomne distribucije, tj. zbir svih vjerovatnoća iz B=0 to B=k inkluzivno.

Kliknite OK i dobijete isti rezultat kao gore, samo što je sve izračunato pomoću jedne funkcije.

Vrlo povoljno. Radi eksperimentiranja, umjesto posljednjeg parametra 0, stavljamo 1. Dobijamo 0,5398. To znači da je sa 100 bacanja novčića vjerovatnoća da dobijete glave između 0 i 50 skoro 54%. Ali u početku se činilo da bi trebalo da bude 50%. Općenito, proračuni se rade brzo i jednostavno.

Pravi analitičar mora razumjeti kako se funkcija ponaša (kakva je njena distribucija), pa ćemo izračunati vjerovatnoće za sve vrijednosti od 0 do 100. Odnosno, postavićemo pitanje: kolika je vjerovatnoća da nijedna glava će se pojaviti, da će se pojaviti 1 orao, 2, 3 , 50, 90 ili 100. Izračun je prikazan na sljedećoj samopokretnoj slici. Plava linija je sama binomna distribucija, crvena tačka je vjerovatnoća za određeni broj uspjeha k.

Moglo bi se zapitati da li je binomna distribucija slična... Da, vrlo slična. Čak je i Moivre (1733.) rekao da se binomna distribucija sa velikim uzorcima približava (ne znam kako se tada zvala), ali ga niko nije slušao. Tek su Gaus, a potom i Laplace 60-70 godina kasnije, ponovo otkrili i pažljivo proučili zakon normalne raspodjele. Gornji grafikon jasno pokazuje da maksimalna vjerovatnoća pada na matematičko očekivanje, a kako odstupa od njega, naglo opada. Baš kao i normalan zakon.

Binomna distribucija Od velike je praktične važnosti i javlja se prilično često. Korišćenjem Excel proračuni izvode se lako i brzo. Tako da ga možete bezbedno koristiti.

Ovim predlažem da se pozdravimo do sljedećeg sastanka. Svaka cast, ostanite zdravi!

Poglavlje 7.

Specifični zakoni distribucije slučajnih varijabli

Vrste zakona raspodjele diskretnih slučajnih varijabli

Neka diskretna slučajna varijabla uzme vrijednosti X 1 , X 2 , …, x n,…. Vjerovatnoće ovih vrijednosti mogu se izračunati iz razne formule, na primjer, koristeći osnovne teoreme teorije vjerovatnoće, Bernoullijevu formulu ili neke druge formule. Za neke od ovih formula zakon raspodjele ima svoje ime.

Najčešći zakoni distribucije diskretne slučajne varijable su binomni, geometrijski, hipergeometrijski i Poissonov zakon raspodjele.

Zakon binomne distribucije

Neka se proizvede n nezavisna ispitivanja, u svakom od kojih se događaj može pojaviti ili ne mora A. Vjerovatnoća da se ovaj događaj dogodi u svakom pojedinačnom pokušaju je konstantna, ne ovisi o broju pokušaja i jednaka je r=R(A). Otuda je vjerovatnoća da se događaj ne dogodi A u svakom testu je takođe konstantan i jednak q=1–r. Uzmite u obzir slučajnu varijablu X jednak broju pojavljivanja događaja A V n testovi. Očigledno, vrijednosti ove količine su jednake

X 1 =0 – događaj A V n testovi se nisu pojavili;

X 2 =1 – događaj A V n pojavio se jednom u suđenjima;

X 3 =2 – događaj A V n testovi su se pojavili dva puta;

…………………………………………………………..

x n +1 = n- događaj A V n sve se pokazalo tokom testova n jednom.

Vjerojatnosti ovih vrijednosti mogu se izračunati korištenjem Bernoullijeve formule (4.1):

Gdje To=0, 1, 2, …,n .

Zakon binomne distribucije X, jednako broju uspjeha u n Bernulijevi testovi, sa vjerovatnoćom uspjeha r.

Dakle, diskretna slučajna varijabla ima binomnu distribuciju (ili je distribuirana prema binomskom zakonu) ako su njene moguće vrijednosti 0, 1, 2, ..., n, a odgovarajuće vjerovatnoće se izračunavaju pomoću formule (7.1).

Binomna distribucija zavisi od dva parametri r I n.

Red distribucije slučajne varijable raspoređene prema binomskom zakonu ima oblik:

X k n
R

Primjer 7.1 . Tri nezavisna hica se ispaljuju u metu. Vjerovatnoća da ćete pogoditi svaki metak je 0,4. Slučajna varijabla X– broj pogodaka u metu. Konstruirajte njegovu distribucijsku seriju.

Rješenje. Moguće vrijednosti slučajne varijable X su X 1 =0; X 2 =1; X 3 =2; X 4 =3. Nađimo odgovarajuće vjerovatnoće koristeći Bernoullijevu formulu. Nije teško pokazati da je upotreba ove formule ovdje potpuno opravdana. Imajte na umu da će vjerovatnoća da jednim udarcem ne pogodite metu biti jednaka 1-0,4=0,6. Dobili smo

Serija distribucije ima sljedeći oblik:

X
R 0,216 0,432 0,288 0,064

Lako je provjeriti da je zbir svih vjerovatnoća jednak 1. Sama slučajna varijabla X distribuiraju prema binomskom zakonu. ■

Nađimo matematičko očekivanje i varijansu slučajne varijable distribuirane prema binomskom zakonu.

Prilikom rješavanja primjera 6.5 pokazalo se da matematičko očekivanje broja pojavljivanja događaja A V n nezavisni testovi, ako je vjerovatnoća pojave A u svakom testu je konstantan i jednak r, jednako n· r

U ovom primjeru korištena je slučajna varijabla distribuirana prema binomskom zakonu. Stoga je rješenje primjera 6.5 u suštini dokaz sljedeće teoreme.

Teorema 7.1. Matematičko očekivanje diskretne slučajne varijable raspoređene prema binomskom zakonu jednako je proizvodu broja pokušaja i vjerovatnoće “uspjeha”, tj. M(X)=n· r.

Teorema 7.2. Varijanca diskretne slučajne varijable raspoređene prema binomskom zakonu jednaka je proizvodu broja pokušaja sa vjerovatnoćom “uspjeha” i vjerovatnoćom “neuspjeha”, tj. D(X)=nrq.

Asimetrija i kurtozis slučajne varijable raspoređene prema binomskom zakonu određuju se formulama

Ove formule se mogu dobiti koristeći koncept početnih i centralnih momenata.

Zakon binomne distribucije je u osnovi mnogih situacija iz stvarnog života. Za velike vrijednosti n Binomna distribucija se može aproksimirati korištenjem drugih distribucija, posebno Poissonove distribucije.

Poissonova distribucija

Neka bude n Bernulijevi testovi, sa brojem testova n dovoljno veliki. Ranije je pokazano da u ovom slučaju (ako je, štaviše, vjerovatnoća r događaji A vrlo mala) da se pronađe vjerovatnoća da će događaj A pojaviti T Kada ste u testovima, možete koristiti Poissonovu formulu (4.9). Ako je slučajna varijabla X znači broj pojavljivanja događaja A V n Bernulijevim testovima, onda vjerovatnoća da Xće uzeti vrijednost k može se izračunati pomoću formule

, (7.2)

Gdje λ = nr.

Poissonov zakon distribucije se naziva distribucija diskretne slučajne varijable X, za koje su moguće vrijednosti nenegativni cijeli brojevi i vjerovatnoće r t ove vrijednosti se nalaze pomoću formule (7.2).

Magnituda λ = nr pozvao parametar Poissonove distribucije.

Slučajna varijabla distribuirana prema Poissonovom zakonu može poprimiti beskonačan broj vrijednosti. Budući da je za ovu distribuciju vjerovatnoća r Pojava događaja u svakom ispitivanju je mala, tada se ova distribucija ponekad naziva zakonom rijetkih događaja.

Red raspodjele slučajne varijable raspoređene prema Poissonovom zakonu ima oblik

X T
R

Lako je provjeriti da je zbir vjerovatnoća drugog reda jednak 1. Da biste to učinili, morate zapamtiti da se funkcija može proširiti u Maclaurinov niz, koji konvergira za bilo koji X. U ovom slučaju imamo

. (7.3)

Kao što je navedeno, Poissonov zakon zamjenjuje binomni zakon u određenim ograničavajućim slučajevima. Primjer je slučajna varijabla X, čije su vrijednosti jednake broju kvarova u određenom vremenskom periodu uz ponovnu upotrebu tehnički uređaj. Pretpostavlja se da se radi o visoko pouzdanom uređaju, tj. Vjerovatnoća neuspjeha u jednoj aplikaciji je vrlo mala.

Pored ovakvih ograničavajućih slučajeva, u praksi postoje slučajne varijable raspoređene prema Poissonovom zakonu koje nisu povezane sa binomskom distribucijom. Na primjer, Poissonova distribucija se često koristi kada se radi o broju događaja koji se dešavaju u određenom vremenskom periodu (broj poziva primljenih na telefonskoj centrali tokom jednog sata, broj automobila koji stignu u autopraonicu tokom dana, broj zaustavljanja mašine sedmično, itd.). Svi ovi događaji bi trebali formirati takozvani tok događaja, što je jedan od osnovnih koncepata teorije čekanja. Parametar λ karakteriše prosečan intenzitet toka događaja.

Razmotrimo binomnu distribuciju, izračunajmo njeno matematičko očekivanje, varijansu i mod. Koristeći MS EXCEL funkciju BINOM.DIST(), napravićemo grafove funkcije distribucije i gustine vjerovatnoće. Procijenimo parametar distribucije p, matematičko očekivanje distribucije i standardnu ​​devijaciju. Uzmimo u obzir i Bernulijevu distribuciju.

Definicija. Neka se održe n suđenja, u svakom od kojih se mogu desiti samo 2 događaja: događaj „uspjeh“ s vjerovatnoćom str ili događaj „neuspjeha“ s vjerovatnoćom q =1-p (tzv Bernoullijeva šema,Bernoullisuđenja).

Verovatnoća da dobijete tačno x uspjeh u ovim n testovi je jednak:

Broj uspjeha u uzorku x je slučajna varijabla koja ima Binomna distribucija(engleski) Binomdistribucija) str I n su parametri ove distribucije.

Molimo zapamtite da to koristite Bernoullijeve šeme i shodno tome binomna distribucija, moraju biti ispunjeni sljedeći uslovi:

  • Svaki test mora imati tačno dva ishoda, konvencionalno nazvana "uspjeh" i "neuspjeh".
  • rezultat svakog testa ne treba da zavisi od rezultata prethodnih testova (nezavisnost testa).
  • vjerovatnoća uspjeha str mora biti konstantan za sve testove.

Binomna distribucija u MS EXCEL-u

U MS EXCEL-u, počevši od verzije 2010, za Binomna distribucija postoji funkcija BINOM.DIST(), engleski naziv- BINOM.DIST(), koji vam omogućava da izračunate vjerovatnoću da će uzorak tačno sadržavati X"uspjeh" (tj. funkcija gustoće vjerovatnoće p(x), vidi formulu iznad), i kumulativna funkcija distribucije(vjerovatnoća da će uzorak imati x ili manje "uspjeha", uključujući 0).

Prije MS EXCEL 2010, EXCEL je imao funkciju BINOMDIST(), koja vam također omogućava da izračunate funkcija distribucije I gustina vjerovatnoće p(x). BINOMIST() je ostavljen u MS EXCEL 2010 radi kompatibilnosti.

Datoteka primjera sadrži grafikone distribucija gustine vjerovatnoće I .

Binomna distribucija ima oznaku B(n; str) .

Napomena: Za gradnju kumulativna funkcija distribucije savršen dijagram tipa Raspored, Za gustina distribucijeHistogram sa grupisanjem. Za više informacija o kreiranju grafikona pročitajte članak Osnovne vrste grafikona.

Napomena: Radi praktičnosti pisanja formula, imena za parametre su kreirana u datoteci primjera Binomna distribucija: n i str.

Datoteka primjera prikazuje različite izračune vjerovatnoće pomoću MS EXCEL funkcija:

Kao što možete vidjeti na gornjoj slici, pretpostavlja se da:

  • Beskonačna populacija iz koje je uzet uzorak sadrži 10% (ili 0,1) validnih elemenata (parametar str, treći argument funkcije = BINOM.DIST() )
  • Za izračunavanje vjerovatnoće da će u uzorku od 10 elemenata (parametar n, drugi argument funkcije) bit će točno 5 valjanih elemenata (prvi argument), potrebno je napisati formulu: =BINOM.DIST(5, 10, 0.1, FALSE)
  • Poslednji, četvrti element je postavljen = FALSE, tj. vraća vrijednost funkcije gustina distribucije.

Ako je vrijednost četvrtog argumenta TRUE, tada funkcija BINOM.DIST() vraća vrijednost kumulativna funkcija distribucije ili samo Funkcija distribucije. U ovom slučaju možete izračunati vjerovatnoću da će broj dobrih elemenata u uzorku biti iz određenog raspona, na primjer, 2 ili manje (uključujući 0).

Da biste to učinili morate napisati formulu:
= BINOM.DIST(2; 10; 0,1; TRUE)

Napomena: Za necijelobrojnu vrijednost x, . Na primjer, sljedeće formule će vratiti istu vrijednost:
=BINOM.DIST( 2 ; 10; 0,1; ISTINA)
=BINOM.DIST( 2,9 ; 10; 0,1; ISTINA)

Napomena: U primjeru datoteke gustina vjerovatnoće I funkcija distribucije također izračunato korištenjem definicije i funkcije NUMBERCOMB() .

Pokazatelji distribucije

IN primjer datoteke na radnom listu Primjer Postoje formule za izračunavanje nekih indikatora distribucije:

  • =n*p;
  • (standardna devijacija na kvadrat) = n*p*(1-p);
  • = (n+1)*p;
  • =(1-2*p)*ROOT(n*p*(1-p)).

Hajde da izvedemo formulu matematičko očekivanje Binomna distribucija koristeći Bernoullijevo kolo.

Po definiciji, slučajna varijabla X je Bernoullijeva šema(Bernoullijeva slučajna varijabla) ima funkcija distribucije:

Ova distribucija se zove Bernulijeva distribucija.

Napomena: Bernulijeva distribucija– poseban slučaj Binomna distribucija sa parametrom n=1.

Hajde da generišemo 3 niza od po 100 brojeva sa različitim verovatnoćama uspeha: 0,1; 0,5 i 0,9. Da biste to učinili u prozoru Generisanje slučajnih brojeva Postavimo sljedeće parametre za svaku vjerovatnoću p:

Napomena: Ako postavite opciju Slučajno rasipanje (Random Seed), tada možete odabrati određeni nasumični skup generiranih brojeva. Na primjer, postavljanjem ove opcije =25, možete generirati iste skupove slučajnih brojeva na različitim računarima (ako su, naravno, drugi parametri distribucije isti). Vrijednost opcije može imati cjelobrojne vrijednosti od 1 do 32,767 Slučajno rasipanje može biti zbunjujuće. Bilo bi bolje da se to prevede kao Birajte broj sa slučajnim brojevima.

Kao rezultat, imaćemo 3 kolone od 100 brojeva, na osnovu kojih možemo, na primjer, procijeniti vjerovatnoću uspjeha str prema formuli: Broj uspjeha/100(cm. primjer lista datoteka GenerationBernoulli).

Napomena: Za Bernoullijeve distribucije sa p=0,5 možete koristiti formulu =RANDBETWEEN(0;1) koja odgovara .

Generisanje slučajnih brojeva. Binomna distribucija

Pretpostavimo da u uzorku ima 7 neispravnih proizvoda. To znači da je “vrlo vjerovatno” da se udio neispravnih proizvoda promijenio str, što je karakteristika našeg proizvodnog procesa. Iako je takva situacija “vrlo vjerovatna”, postoji mogućnost (alfa rizik, greška tipa 1, “lažna uzbuna”) da str je ostao nepromijenjen, a povećan broj neispravnih proizvoda uzrokovan je slučajnim uzorkovanjem.

Kao što se može vidjeti na donjoj slici, 7 je broj neispravnih proizvoda koji je prihvatljiv za proces sa p=0,21 pri istoj vrijednosti Alpha. Ovo ilustruje da kada se prekorači granična vrijednost neispravnih predmeta u uzorku, str„najvjerovatnije“ se povećao. Izraz “najvjerovatnije” znači da postoji samo 10% vjerovatnoće (100%-90%) da je odstupanje procenta neispravnih proizvoda iznad praga samo zbog slučajnih razloga.

Dakle, prekoračenje graničnog broja neispravnih proizvoda u uzorku može poslužiti kao signal da se proces poremetio i da je počeo proizvoditi rabljene proizvode. O veći procenat neispravnih proizvoda.

Napomena: Prije MS EXCEL 2010, EXCEL je imao funkciju CRITBINOM(), koja je ekvivalentna BINOM.INV(). CRITBINOM() je ostavljen u MS EXCEL 2010 i novijim radi kompatibilnosti.

Odnos binomske distribucije prema drugim distribucijama

Ako je parametar n Binomna distribucija teži beskonačnosti, i str teži 0, tada u ovom slučaju Binomna distribucija može se aproksimirati.
Možemo formulisati uslove kada je aproksimacija Poissonova distribucija radi dobro:

  • str<0,1 (što manje str i više n, što je tačnija aproksimacija);
  • str>0,9 (s obzirom na to q=1- str, proračuni u ovom slučaju moraju se izvršiti do kraja q(A X potrebno je zamijeniti sa n- x). Dakle, što manje q i više n, to je tačnija aproksimacija).

Na 0,1<=p<=0,9 и n*p>10 Binomna distribucija može se aproksimirati.

zauzvrat, Binomna distribucija može poslužiti kao dobra aproksimacija kada je veličina populacije N Hipergeometrijska distribucija mnogo veći od veličine uzorka n (tj. N>>n ili n/N<<1).

Više detalja o odnosu između gore navedenih distribucija možete pronaći u članku. Tu su i primjeri aproksimacije, te su objašnjeni uslovi kada je to moguće i sa kojom tačnošću.

SAVJET: O drugim MS EXCEL distribucijama možete pročitati u članku.

Distribucije vjerovatnoće diskretnih slučajnih varijabli. Binomna distribucija. Poissonova distribucija. Geometrijska distribucija. Generirajuća funkcija.

6. Distribucije vjerovatnoće diskretnih slučajnih varijabli

6.1. Binomna distribucija

Neka se proizvede n nezavisnih suđenja, u svakom od kojih događaj A Može se pojaviti ili ne mora. Vjerovatnoća str pojava događaja A u svim testovima je konstantan i ne mijenja se od testa do testa. Uzmite u obzir slučajnu varijablu X broj pojavljivanja događaja A u ovim testovima. Formula za pronalaženje vjerovatnoće da će se događaj dogoditi A glatko k jednom svaki n testovi su, kao što je poznato, opisani Bernulijeva formula

Raspodjela vjerovatnoće definirana Bernoullijevom formulom naziva se binom .

Ovaj zakon se naziva "binom" jer se desna strana može smatrati općim pojmom u proširenju Newtonovog binoma

Zapišimo binomni zakon u obliku tabele

str n

n.p. n –1 q

q n

Nađimo numeričke karakteristike ove distribucije.

Po definiciji matematičkog očekivanja za DSV, imamo

.

Zapišimo jednakost, koja je Njutnova binarna

.

i razlikovati ga u odnosu na str. Kao rezultat dobijamo

.

Pomnožite lijevu i desnu stranu sa str:

.

S obzirom na to str+ q=1, imamo

(6.2)

dakle, matematičko očekivanje broja pojavljivanja događaja unnezavisnih pokušaja jednak je proizvodu broja pokušajanna vjerovatnoćustrpojava događaja u svakom ispitivanju.

Izračunajmo varijansu koristeći formulu

.

Za ovo ćemo naći

.

Hajde da prvo diferenciramo Newtonovu binomnu formulu dvaput u odnosu na str:

i pomnožite obje strane jednakosti sa str 2:

dakle,

Dakle, varijansa binomne distribucije je

. (6.3)

Ovi rezultati se takođe mogu dobiti iz čisto kvalitativnog zaključivanja. Ukupan broj X pojavljivanja događaja A u svim ispitivanjima je zbir broja pojavljivanja događaja u pojedinačnim ispitivanjima. Dakle, ako je X 1 broj pojavljivanja događaja u prvom pokušaju, X 2 – u drugom, itd., tada je ukupan broj pojavljivanja događaja A u svim pokušajima jednak X = X 1 +X 2 +…+X n. Prema svojstvu matematičkog očekivanja:

Svaki od članova na desnoj strani jednakosti je matematičko očekivanje broja događaja u jednom ogledu, koji je jednak vjerovatnoći događaja. dakle,

Prema svojstvu disperzije:

Budući da , i matematičko očekivanje slučajne varijable , koji može uzeti samo dvije vrijednosti, odnosno 1 2 s vjerovatnoćom str i 0 2 sa vjerovatnoćom q, To
. dakle,
Kao rezultat, dobijamo

Koristeći koncept početnih i centralnih momenata, možemo dobiti formule za asimetriju i eksces:

. (6.4)

Rice. 6.1

Poligon binomne distribucije ima sljedeći oblik (vidi sliku 6.1). VjerojatnostP n (k) prvo raste sa povećanjem k, dostiže svoju najveću vrijednost, a zatim počinje opadati. Binomna distribucija je iskrivljena osim za slučaj str=0,5. Imajte na umu da sa velikim brojem testova n Binomna distribucija je vrlo blizu normalnoj. (Razlog za ovaj prijedlog povezan je s lokalnom teoremom Moivre-Laplacea.)

Brojm 0 pojava događaja se zovenajvjerovatnije , ako je vjerovatnoća da će se događaj dogoditi određeni broj puta u ovoj seriji testova najveća (maksimum u poligonu distribucije). Za binomnu distribuciju

Komentar. Ova nejednakost se može dokazati korištenjem rekurentne formule za binomske vjerovatnoće:

(6.6)

Primjer 6.1. Učešće premium proizvoda u ovom preduzeću je 31%. Koja su matematička očekivanja i varijansa, kao i najvjerovatniji broj premium proizvoda u nasumično odabranoj seriji od 75 proizvoda?

Rješenje. Pošto str=0,31, q=0,69, n=75, dakle

M[ X] = n.p.= 750,31 = 23,25; D[ X] = npq = 750,310,69 = 16,04.

Da pronađemo najvjerovatniji broj m 0, napravimo dvostruku nejednakost

Iz toga slijedi m 0 = 23.

U ovom i narednih nekoliko postova ćemo se osvrnuti na matematičke modele slučajnih događaja. Matematički model je matematički izraz koji predstavlja slučajnu varijablu. Za diskretne slučajne varijable, ovaj matematički izraz je poznat kao funkcija distribucije.

Ako vam problem dozvoljava da eksplicitno napišete matematički izraz koji predstavlja slučajnu varijablu, možete izračunati tačnu vjerovatnoću bilo koje od njenih vrijednosti. U ovom slučaju možete izračunati i navesti sve vrijednosti funkcije distribucije. Različite distribucije slučajnih varijabli susrećemo se u poslovnim, sociološkim i medicinskim aplikacijama. Jedna od najkorisnijih distribucija je binom.

Binomna distribucija koristi se za simulaciju situacija koje karakteriziraju sljedeće karakteristike.

  • Uzorak se sastoji od fiksnog broja elemenata n, koji predstavlja rezultate određenog testa.
  • Svaki element uzorka pripada jednoj od dvije međusobno isključive kategorije koje iscrpljuju cijeli prostor uzorka. Obično se ove dvije kategorije nazivaju uspjehom i neuspjehom.
  • Vjerovatnoća uspjeha r je konstantan. Stoga je vjerovatnoća neuspjeha 1 – str.
  • Ishod (tj. uspjeh ili neuspjeh) bilo kojeg suđenja ne zavisi od ishoda drugog ispitivanja. Da bi se osigurala neovisnost ishoda, elementi uzorka se obično dobivaju korištenjem dvije različite metode. Svaki element u uzorku je nasumično izvučen iz beskonačne populacije bez reverzije ili iz konačne populacije sa reverzijom.

Preuzmite bilješku u formatu ili, primjere u formatu

Binomna distribucija se koristi za procjenu broja uspjeha u uzorku koji se sastoji od n zapažanja. Uzmimo naručivanje kao primjer. Za naručivanje, kupci kompanije Saxon mogu koristiti interaktivni elektronski obrazac i poslati ga kompaniji. Informacijski sistem zatim provjerava greške, nepotpune ili netačne informacije u nalozima. Svaka narudžba u pitanju je označena i uključena u dnevni izvještaj o izuzetcima. Podaci koje je kompanija prikupila pokazuju da je vjerovatnoća greške u narudžbi 0,1. Kompanija bi želela da zna kolika je verovatnoća pronalaženja određenog broja pogrešnih naloga u datom uzorku. Na primjer, recimo da kupci popune četiri elektronska obrasca. Kolika je vjerovatnoća da će sve narudžbe biti bez grešaka? Kako izračunati ovu vjerovatnoću? Pod uspjehom ćemo shvatiti grešku prilikom popunjavanja obrasca, a svi ostali ishodi će se smatrati neuspjehom. Podsjetimo da nas zanima broj pogrešnih naloga u datom uzorku.

Koje rezultate možemo uočiti? Ako se uzorak sastoji od četiri reda, jedan, dva, tri ili sva četiri mogu biti netačni, a svi mogu biti tačni. Može li slučajna varijabla koja opisuje broj pogrešno popunjenih obrazaca poprimiti bilo koju drugu vrijednost? To nije moguće jer broj neispravnih obrazaca ne može premašiti veličinu uzorka n ili biti negativan. Dakle, slučajna varijabla koja poštuje zakon binomne distribucije uzima vrijednosti od 0 do n.

Pretpostavimo da su na uzorku od četiri reda uočeni sljedeći ishodi:

Kolika je vjerovatnoća pronalaženja tri pogrešna naloga u uzorku od četiri naloga, u navedenom redoslijedu? Budući da je preliminarna istraživanja pokazala da je vjerovatnoća greške prilikom popunjavanja obrasca 0,10, vjerovatnoće gore navedenih ishoda izračunavaju se na sljedeći način:

Pošto ishodi ne zavise jedan od drugog, verovatnoća navedenog niza ishoda je jednaka: p*p*(1–p)*p = 0,1*0,1*0,9*0,1 = 0,0009. Ako trebate izračunati broj izbora X n elemenata, trebali biste koristiti formulu kombinacije (1):

gdje n! = n * (n –1) * (n – 2) * … * 2 * 1 - faktorijel broja n, i 0! = 1 i 1! = 1 po definiciji.

Ovaj izraz se često naziva . Dakle, ako je n = 4 i X = 3, broj sekvenci koje se sastoje od tri elementa ekstrahirane iz uzorka veličine 4 određuje se sljedećom formulom:

Stoga se vjerovatnoća otkrivanja tri pogrešna naloga izračunava na sljedeći način:

(Broj mogućih sekvenci) *
(vjerovatnoća određenog niza) = 4 * 0,0009 = 0,0036

Slično, možete izračunati vjerovatnoću da će između četiri naloga biti jedan ili dva pogrešna, kao i vjerovatnoću da su svi nalozi pogrešni ili da su svi tačni. Međutim, sa povećanjem veličine uzorka n određivanje vjerovatnoće određenog niza ishoda postaje teže. U ovom slučaju, trebali biste primijeniti odgovarajući matematički model koji opisuje binomnu distribuciju broja izbora X objekata iz selekcije koja sadrži n elementi.

Binomna distribucija

Gdje P(X)- vjerovatnoća X uspjeh za datu veličinu uzorka n i vjerovatnoća uspjeha r, X = 0, 1, … n.

Imajte na umu da je formula (2) formalizacija intuitivnih zaključaka. Slučajna varijabla X, koji se povinuje binomnoj distribuciji, može uzeti bilo koju cjelobrojnu vrijednost u rasponu od 0 do n. Posao rX(1 – str)nX predstavlja vjerovatnoću određenog niza koji se sastoji od X uspjeh u veličini uzorka jednaka n. Vrijednost određuje broj mogućih kombinacija koje se sastoje od X uspjeh u n testovi. Dakle, za dati broj testova n i vjerovatnoća uspjeha r vjerovatnoća niza koji se sastoji od X uspjeh, jednak

P(X) = (broj mogućih nizova) * (vjerovatnoća određenog niza) =

Razmotrimo primjere koji ilustruju primjenu formule (2).

1. Pretpostavimo da je vjerovatnoća pogrešnog popunjavanja formulara 0,1. Kolika je vjerovatnoća da će od četiri popunjena formulara tri biti netačna? Koristeći formulu (2), nalazimo da je vjerovatnoća otkrivanja tri pogrešna reda u uzorku koji se sastoji od četiri reda jednaka

2. Pretpostavimo da je vjerovatnoća pogrešnog popunjavanja formulara 0,1. Kolika je vjerovatnoća da će od četiri popunjena obrasca najmanje tri biti netačna? Kao što je prikazano u prethodnom primjeru, vjerovatnoća da će od četiri popunjena obrasca tri biti netačna je 0,0036. Da biste izračunali vjerovatnoću da će od četiri popunjena obrasca najmanje tri biti netačna, morate dodati vjerovatnoću da će između četiri popunjena obrasca tri biti netačna i vjerovatnoću da će između četiri popunjena obrasca svi biti netačni. Vjerovatnoća drugog događaja je

Dakle, vjerovatnoća da će od četiri popunjena formulara najmanje tri biti netačna jednaka je

P(X > 3) = P(X = 3) + P(X = 4) = 0,0036 + 0,0001 = 0,0037

3. Pretpostavimo da je vjerovatnoća pogrešnog popunjavanja formulara 0,1. Kolika je vjerovatnoća da će od četiri popunjena obrasca manje od tri biti netačna? Vjerovatnoća ovog događaja

P(X< 3) = P(X = 0) + P(X = 1) + P(X = 2)

Koristeći formulu (2), izračunavamo svaku od ovih vjerovatnoća:

Prema tome, P(X< 3) = 0,6561 + 0,2916 + 0,0486 = 0,9963.

Verovatnoća P(X< 3) можно вычислить иначе. Для этого воспользуемся тем, что событие X < 3 является дополнительным по отношению к событию Х>3. Tada je P(X< 3) = 1 – Р(Х> 3) = 1 – 0,0037 = 0,9963.

Kako se veličina uzorka povećava n proračuni slični onima koji su izvedeni u primjeru 3 postaju teški. Da bi se izbjegle ove komplikacije, mnoge binomne vjerovatnoće su unaprijed tablične. Neke od ovih vjerovatnoća prikazane su na Sl. 1. Na primjer, da dobijete vjerovatnoću da X= 2 at n= 4 i str= 0.1, treba izdvojiti iz tabele broj na preseku prave X= 2 i kolone r = 0,1.

Rice. 1. Binomna vjerovatnoća pri n = 4, X= 2 i r = 0,1

Binomna distribucija se može izračunati pomoću Excel funkcije=BINOM.DIST() (slika 2), koji ima 4 parametra: broj uspjeha – X, broj testova (ili veličina uzorka) – n, vjerovatnoća uspjeha – r, parametar integral, koji uzima vrijednost TRUE (u ovom slučaju se izračunava vjerovatnoća ni manje ni više X događaji) ili LAŽNO (u ovom slučaju se izračunava vjerovatnoća tačno X događaji).

Rice. 2. Parametri funkcije =BINOM.DIST()

Za gornja tri primjera, proračuni su prikazani na Sl. 3 (pogledajte i Excel datoteku). Svaka kolona sadrži jednu formulu. Brojevi pokazuju odgovore na primjere odgovarajućeg broja).

Rice. 3. Proračun binomne distribucije u Excelu za n= 4 i str = 0,1

Svojstva binomne distribucije

Binomna distribucija zavisi od parametara n I r. Binomna distribucija može biti ili simetrična ili asimetrična. Ako je p = 0,05, binomna distribucija je simetrična bez obzira na vrijednost parametra n. Međutim, ako je p ≠ 0,05, distribucija postaje iskrivljena. Što je bliža vrijednost parametra r do 0,05 i što je veća veličina uzorka n, manje je izražena asimetrija distribucije. Dakle, distribucija broja pogrešno popunjenih obrazaca je nagnuta udesno jer str= 0,1 (slika 4).

Rice. 4. Histogram binomne distribucije na n= 4 i str = 0,1

Očekivanje binomne distribucije jednak proizvodu veličine uzorka n na vjerovatnoću uspjeha r:

(3) M = E(X) =n.p.

U prosjeku, uz dovoljno dugu seriju testova u uzorku koji se sastoji od četiri reda, može postojati p = E(X) = 4 x 0,1 = 0,4 pogrešno popunjenih obrazaca.

Standardna devijacija binomske distribucije

na primjer, standardna devijacija broj pogrešno popunjenih obrazaca u računovodstvenom informacionom sistemu jednak je:

Korišteni su materijali iz knjige Levin i dr. Statistika za menadžere. – M.: Williams, 2004. – str. 307–313





greška: Sadržaj zaštićen!!