Odaberite Stranica

Binomna distribucija: definicija, formula, primjeri. Binomna distribucija slučajne varijable

Pozdrav svim čitaocima!

Statistička analiza se, kao što znate, bavi prikupljanjem i obradom stvarnih podataka. To je korisno, a često i isplativo, jer. pravi zaključci vam omogućavaju da izbjegnete greške i gubitke u budućnosti, a ponekad i ispravno pogodite ovu budućnost. Prikupljeni podaci odražavaju stanje neke uočene pojave. Podaci su često (ali ne uvijek) numerički i njima se može manipulirati raznim matematičkim manipulacijama kako bi se izvukle dodatne informacije.

Međutim, ne mjere se svi fenomeni u kvantitativnoj skali kao što je 1, 2, 3... 100500... Ne može uvijek pojava poprimiti beskonačan ili veliki broj različitih stanja. Na primjer, spol osobe može biti ili M ili F. Strijelac ili pogađa metu ili promašuje. Možete glasati ili "za" ili "protiv" itd. itd. Drugim riječima, takvi podaci odražavaju stanje alternativnog atributa - ili "da" (događaj se dogodio) ili "ne" (događaj se nije dogodio). Nadolazeći događaj (pozitivan ishod) naziva se i "uspjeh". Takve pojave takođe mogu biti masovne i nasumične. Stoga se mogu izmjeriti i izvući statistički valjani zaključci.

Eksperimenti sa takvim podacima se nazivaju Bernoullijeva šema, u čast poznatog švajcarskog matematičara koji je to ustanovio kada u velikom broju ispitivanja, omjer pozitivnih ishoda i ukupnog broja ispitivanja teži vjerovatnoći da se ovaj događaj dogodi.

Alternativna varijabla funkcije

Da bi se u analizi koristio matematički aparat, rezultate takvih opažanja treba zapisati u numeričkom obliku. Da bi se to postiglo, pozitivnom ishodu se dodeljuje broj 1, negativnom - 0. Drugim rečima, radi se o promenljivoj koja može imati samo dve vrednosti: 0 ili 1.

Kakva korist se može izvući iz ovoga? Zapravo, ništa manje nego iz običnih podataka. Dakle, lako je izbrojati broj pozitivnih ishoda – dovoljno je sabrati sve vrijednosti, tj. sve 1 (uspjeh). Možete ići dalje, ali za ovo morate uvesti nekoliko oznaka.

Prva stvar koju treba primijetiti je da pozitivni ishodi (koji su jednaki 1) imaju izvjesnu vjerovatnoću da će se dogoditi. Na primjer, dobijanje glave pri bacanju novčića je ½ ili 0,5. Ova vjerovatnoća se tradicionalno označava latinično pismo str. Stoga je vjerovatnoća da se dogodi alternativni događaj 1-p, što je takođe označeno sa q, to je q = 1 – str. Ove oznake se mogu vizualno sistematizirati u obliku promjenjive distribucijske ploče X.

Sada imamo listu mogućih vrijednosti i njihove vjerovatnoće. Možete početi računati tako divne karakteristike slučajna varijabla, Kako očekivanu vrijednost i disperzija. Da vas podsjetim da se matematičko očekivanje izračunava kao zbir proizvoda svih mogućih vrijednosti i njihovih odgovarajućih vjerovatnoća:

Izračunajmo očekivanu vrijednost koristeći notaciju u gornjim tabelama.

Ispada da je matematičko očekivanje alternativnog znaka jednako vjerovatnoći ovog događaja - str.

Hajde sada da definišemo šta je varijansa alternativne karakteristike. Dozvolite mi također da vas podsjetim da je varijansa srednji kvadrat odstupanja od matematičkog očekivanja. Opća formula(za diskretne podatke) ima oblik:

Otuda varijansa alternativne karakteristike:

Lako je vidjeti da ova disperzija ima maksimum od 0,25 (at p=0,5).

Standardna devijacija - korijen varijanse:

Maksimalna vrijednost ne prelazi 0,5.

Kao što možete vidjeti, i matematičko očekivanje i varijansa alternativnog znaka imaju vrlo kompaktan oblik.

Binomna distribucija slučajne varijable

Sada razmotrite situaciju iz drugog ugla. Zaista, koga briga što je prosječan gubitak glava pri jednom bacanju 0,5? To je čak nemoguće i zamisliti. Zanimljivije je postaviti pitanje o broju glava koje dolaze za dati broj bacanja.

Drugim riječima, istraživača često zanima vjerovatnoća da će se desiti određeni broj uspješnih događaja. To može biti broj neispravnih proizvoda u testiranoj seriji (1 - neispravan, 0 - dobar) ili broj oporavljenih (1 - zdrav, 0 - bolestan) itd. Broj takvih "uspjeha" bit će jednak zbroju svih vrijednosti varijable X, tj. broj pojedinačnih ishoda.

Slučajna vrijednost B naziva se binom i uzima vrijednosti od 0 do n(kod B= 0 - svi dijelovi su dobri, sa B = n- svi dijelovi su neispravni). Pretpostavlja se da su sve vrijednosti x nezavisni jedno od drugog. Razmotrimo glavne karakteristike binomske varijable, odnosno ustanovićemo njeno matematičko očekivanje, varijansu i distribuciju.

Očekivanje binomske varijable je vrlo lako dobiti. Podsjetimo da postoji zbir matematičkih očekivanja svake dodane vrijednosti i da je isti za sve, dakle:

Na primjer, očekivanje broja glava na 100 bacanja je 100 × 0,5 = 50.

Sada izvodimo formulu za varijansu binomske varijable. je zbir varijansi. Odavde

Standardna devijacija, respektivno

Za 100 bacanja novčića, standardna devijacija je

I na kraju, razmotrite distribuciju binomna vrijednost, tj. vjerovatnoća da je slučajna varijabla Bće uzeti razna značenja k, gdje 0≤k≤n. Za novčić, ovaj problem bi mogao zvučati ovako: kolika je vjerovatnoća da dobijete 40 grla u 100 bacanja?

Da bismo razumjeli način izračunavanja, zamislimo da se novčić baci samo 4 puta. Svaka strana može ispasti svaki put. Pitamo se: kolika je vjerovatnoća da dobijemo 2 glave od 4 bacanja. Svako bacanje je nezavisno jedno od drugog. To znači da će vjerovatnoća dobivanja bilo koje kombinacije biti jednaka proizvodu vjerovatnoće datog ishoda za svako pojedinačno bacanje. Neka su O glave i P repovi. Tada, na primjer, jedna od kombinacija koja nam odgovara može izgledati kao OOPP, odnosno:

Vjerovatnoća takve kombinacije jednaka je umnošku dvije vjerovatnoće izbijanja i još dvije vjerovatnoće neuspjeha (obrnuti događaj izračunat kao 1-p), tj. 0,5×0,5×(1-0,5)×(1-0,5)=0,0625. Ovo je vjerovatnoća jedne od kombinacija koja nam odgovara. Ali pitanje je bilo o ukupnom broju orlova, a ne o nekom posebnom redu. Zatim trebate sabrati vjerovatnoće svih kombinacija u kojima se nalaze tačno 2 orla. Jasno je da su svi isti (proizvod se ne mijenja od promjene mjesta faktora). Stoga morate izračunati njihov broj, a zatim pomnožiti s vjerovatnoćom bilo koje takve kombinacije. Izbrojimo sve kombinacije od 4 bacanja 2 orla: RROO, RORO, ROOR, ORRO, OROR, OORR. Samo 6 opcija.

Dakle, željena vjerovatnoća da dobijete 2 glave nakon 4 bacanja je 6×0,0625=0,375.

Međutim, brojanje na ovaj način je zamorno. Već za 10 novčića bit će vrlo teško dobiti ukupan broj opcija grubom silom. Stoga su pametni ljudi davno izmislili formulu uz pomoć koje izračunavaju broj različitih kombinacija n elementi po k, gdje n je ukupan broj elemenata, k je broj elemenata čije su opcije rasporeda izračunate. Kombinovana formula od n elementi po k je:

Slične stvari se dešavaju u sekciji kombinatorike. Saljem tamo sve koji zele da unaprede svoje znanje. Otuda, uzgred, naziv binomne distribucije (gornja formula je koeficijent u ekspanziji Newtonovog binoma).

Formula za određivanje vjerovatnoće može se lako generalizirati na bilo koji broj n i k. Kao rezultat, formula binomne distribucije ima sljedeći oblik.

Drugim riječima: pomnožite broj odgovarajućih kombinacija vjerovatnoćom jedne od njih.

Za praktična upotreba dovoljno je samo znati formulu binomne distribucije. A možda čak i ne znate - u nastavku je kako odrediti vjerovatnoću koristeći Excel. Ali bolje je znati.

Koristimo ovu formulu da izračunamo vjerovatnoću da dobijemo 40 glava u 100 bacanja:

Ili samo 1,08%. Poređenja radi, vjerovatnoća matematičkog očekivanja ovog eksperimenta, odnosno 50 grla je 7,96%. Maksimalna vjerovatnoća binomske vrijednosti pripada vrijednosti koja odgovara matematičkom očekivanju.

Izračunavanje vjerovatnoće binomne distribucije u Excelu

Ako koristite samo papir i kalkulator, onda izračunajte pomoću formule binomna distribucija, uprkos odsustvu integrala, prilično su teške. Na primjer, vrijednost od 100! - ima više od 150 karaktera. Ovo je nemoguće izračunati ručno. Ranije, pa čak i sada, za izračunavanje takvih količina korištene su približne formule. Trenutno je preporučljivo koristiti poseban softver, kao što je MS Excel. Dakle, svaki korisnik (čak i humanista po obrazovanju) može lako izračunati vjerovatnoću vrijednosti binomno raspoređene slučajne varijable.

Za konsolidaciju gradiva koristićemo za sada Excel kao običan kalkulator, tj. Napravimo korak po korak izračunavanje koristeći formulu binomne distribucije. Izračunajmo, na primjer, vjerovatnoću da dobijemo 50 grla. Ispod je slika sa koracima proračuna i konačnim rezultatom.

Kao što vidite, međurezultati su takve skale da ne stanu u ćeliju, iako se posvuda koriste jednostavne funkcije tipa: FAKTOR (faktorski proračun), POWER (podizanje broja na stepen), kao i kao operatori množenja i dijeljenja. Štaviše, ovaj proračun je prilično glomazan, u svakom slučaju nije kompaktan, jer uključene mnoge ćelije. I da, teško je to shvatiti.

Općenito, Excel pruža gotovu funkciju za izračunavanje vjerovatnoće binomne distribucije. Funkcija se zove BINOM.DIST.

Broj uspjeha je broj uspješnih pokušaja. Imamo ih 50.

Broj pokušaja- broj bacanja: 100 puta.

Vjerovatnoća uspjeha– vjerovatnoća dobijanja glave pri jednom bacanju je 0,5.

Integral- naznačeno je ili 1 ili 0. Ako je 0, tada se izračunava vjerovatnoća P(B=k); ako je 1, onda se izračunava funkcija binomne distribucije, tj. zbir svih vjerovatnoća iz B=0 prije B=k inkluzivno.

Pritisnemo OK i dobijemo isti rezultat kao gore, samo što je sve izračunato po jednoj funkciji.

Vrlo udobno. Eksperimenta radi, umjesto posljednjeg parametra 0 stavljamo 1. Dobijamo 0,5398. To znači da je u 100 bacanja novčića vjerovatnoća da dobijete glave između 0 i 50 skoro 54%. I u početku se činilo da bi trebalo da bude 50%. Općenito, proračuni se rade lako i brzo.

Pravi analitičar mora razumjeti kako se funkcija ponaša (kakva je njena distribucija), pa izračunajmo vjerovatnoće za sve vrijednosti od 0 do 100. Odnosno, zapitajmo se: kolika je vjerovatnoća da nijedan orao neće pasti, da će 1 orao pasti, 2, 3, 50, 90 ili 100. Izračun je prikazan na sljedećoj samopokretnoj slici. Plava linija je sama binomna distribucija, crvena tačka je vjerovatnoća za određeni broj uspjeha k.

Moglo bi se zapitati, nije li binomna distribucija slična... Da, vrlo slična. Čak je i De Moivre (1733.) rekao da se sa velikim uzorcima približava binomska distribucija (ne znam kako se tada zvala), ali ga niko nije slušao. Tek su Gaus, a potom i Laplace, 60-70 godina kasnije, ponovo otkrili i pažljivo proučili zakon normalne raspodjele. Gornji grafikon jasno pokazuje da maksimalna vjerovatnoća pada na matematičko očekivanje, a kako odstupa od njega, naglo opada. Baš kao normalan zakon.

Binomna distribucija je od velike praktične važnosti, javlja se prilično često. Korišćenjem Excel proračuni izvode brzo i lako. Stoga ga slobodno koristite.

Na ovome predlažem da se pozdravimo do sljedećeg sastanka. Sve najbolje, budite zdravi!


Naravno, pri izračunavanju funkcije kumulativne distribucije treba koristiti pomenuti odnos između binomne i beta distribucije. Ova metoda je svakako bolja od direktnog zbrajanja kada je n > 10.

U klasičnim udžbenicima iz statistike, za dobivanje vrijednosti binomne distribucije, često se preporučuje korištenje formula zasnovanih na graničnim teoremama (kao što je Moivre-Laplaceova formula). Treba napomenuti da sa čisto računske tačke gledišta vrijednost ovih teorema je blizu nule, pogotovo sada, kada je moćan kompjuter na skoro svakom stolu. Glavni nedostatak gornjih aproksimacija je njihova potpuno nedovoljna tačnost za vrijednosti n tipične za većinu aplikacija. Ništa manji nedostatak je nepostojanje bilo kakvih jasnih preporuka o primjenjivosti jedne ili druge aproksimacije (u standardnim tekstovima date su samo asimptotske formulacije, nisu praćene procjenama tačnosti i stoga su od male koristi). Rekao bih da obje formule vrijede samo za n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Ovdje ne razmatram problem pronalaženja kvantila: za diskretne distribucije on je trivijalan, au onim problemima gdje se takve distribucije javljaju, po pravilu nije relevantan. Ako su kvantili i dalje potrebni, preporučujem da se problem preformuliše na takav način da radi sa p-vrijednostima (uočene značajnosti). Evo primjera: kada se implementiraju neki algoritami nabrajanja, u svakom koraku potrebno je provjeriti statistička hipoteza o binomnoj slučajnoj varijabli. Prema klasičnom pristupu, na svakom koraku potrebno je izračunati statistiku kriterija i uporediti njegovu vrijednost sa granicom kritičnog skupa. Kako je, međutim, algoritam enumerativan, potrebno je svaki put iznova odrediti granicu kritičnog skupa (na kraju krajeva, veličina uzorka se mijenja iz koraka u korak), što neproduktivno povećava vremenske troškove. Moderan pristup preporučuje izračunavanje uočene važnosti i poređenje sa nivo samopouzdanja, štedeći na potrazi za kvantilima.

Stoga, sljedeći kodovi ne izračunavaju inverznu funkciju, umjesto toga, data je funkcija rev_binomialDF, koja izračunava vjerovatnoću p uspjeha u jednom pokušaju s obzirom na broj n pokušaja, broj m uspjeha u njima i vrijednost y vjerovatnoće da ćete postići ove m uspjeha. Ovo koristi gore spomenuti odnos između binomne i beta distribucije.

Zapravo, ova funkcija vam omogućava da dobijete granice intervala povjerenja. Zaista, pretpostavimo da dobijemo m uspjeha u n binomnih pokušaja. Kao što znate, lijeva granica je dvostrana interval povjerenja za parametar p sa nivoom poverenja je 0 ako je m = 0, a za je rešenje jednadžbe . Slično, desna granica je 1 ako je m = n, a za je rješenje jednadžbe . To implicira da da bismo pronašli lijevu granicu, moramo riješiti jednačinu , a za traženje pravog - jednačina . Oni su riješeni u funkcijama binom_leftCI i binom_rightCI, koje vraćaju gornju i donju granicu dvostranog intervala povjerenja, respektivno.

Želim napomenuti da ako nije potrebna apsolutno nevjerojatna tačnost, onda za dovoljno veliko n možete koristiti sljedeću aproksimaciju [B.L. van der Waerden, Matematička statistika. M: IL, 1960, Ch. 2, sek. 7]: , gdje je g kvantil normalne distribucije. Vrijednost ove aproksimacije je u tome što postoje vrlo jednostavne aproksimacije koje vam omogućavaju da izračunate kvantile normalne distribucije (pogledajte tekst o izračunavanju normalne distribucije i odgovarajući dio ove reference). U mojoj praksi (uglavnom za n > 100) ova aproksimacija je dala oko 3-4 cifre, što je po pravilu sasvim dovoljno.

Izračuni sa sljedećim kodovima zahtijevaju datoteke betaDF.h, betaDF.cpp (pogledajte odjeljak o beta distribuciji), kao i logGamma.h, logGamma.cpp (pogledajte dodatak A). Također možete vidjeti primjer korištenja funkcija.

binomialDF.h fajl

#ifndef __BINOMIAL_H__ #include "betaDF.h" dvostruki binomni DF (dvostruki pokušaji, dvostruki uspjesi, dvostruki p); /* * Neka postoje "pokusi" nezavisnih zapažanja * sa vjerovatnoćom "p" uspjeha u svakom. * Izračunajte vjerovatnoću B(uspjesi|pokušaji,p) da je broj * uspjeha između 0 i "uspjeha" (uključivo). */ double rev_binomialDF(dvostruki pokušaji, dvostruki uspjesi, dvostruki y); /* * Neka je vjerovatnoća y od najmanje m uspjeha * poznata u ispitivanjima Bernoullijeve šeme. Funkcija pronalazi vjerovatnoću p * uspjeha u jednom pokušaju. * * U proračunima se koristi sljedeća relacija * * 1 - p = rev_Beta(pokušaji-uspjesi| uspjesi+1, y). */ double binom_leftCI(dvostruki pokušaji, dvostruki uspjesi, dvostruki nivo); /* Neka postoje "pokusi" nezavisnih zapažanja * sa vjerovatnoćom "p" uspjeha u svakom * i broj uspjeha je "uspjesi". * Lijeva granica dvostranog intervala povjerenja * izračunava se sa nivoom značaja. */ double binom_rightCI(dvostruki n, dvostruki uspjesi, dvostruki nivo); /* Neka postoje "pokusi" nezavisnih zapažanja * sa vjerovatnoćom "p" uspjeha u svakom * i broj uspjeha je "uspjesi". * Desna granica dvostranog intervala pouzdanosti * izračunava se sa nivoom značaja. */ #endif /* Završava #ifndef __BINOMIAL_H__ */

binomialDF.cpp fajl

/************************************************** **** **********/ /* Binomna distribucija */ /****************************** **** **************************/ #include #include #include "betaDF.h" ENTRY dvostruki binom DF(dvostruki n, dupli m, dupli p) /* * Neka postoji "n" nezavisnih zapažanja * sa vjerovatnoćom "p" uspjeha u svakom. * Izračunajte vjerovatnoću B(m|n,p) da je broj uspjeha * između 0 i "m" (uključivo), tj. * zbir binomnih vjerovatnoća od 0 do m: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * Izračuni ne podrazumijevaju glupo zbrajanje - * se koristi sledeći odnos sa centralnom beta distribucijom: * * B(m|n,p) = Beta(1-p|n-m,m+1). * * Argumenti moraju biti pozitivni, sa 0<= p <= 1. */ { assert((n >0) && (p >= 0) && (str<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) vrati 1; inače vraća BetaDF(n-m, m+1).value(1-p); )/* binomialDF */ ENTRY double rev_binomialDF(double n, double m, double y) /* * Neka je vjerovatnoća y od najmanje m uspjeha * poznata u n pokušaja Bernoullijeve šeme. Funkcija pronalazi vjerovatnoću p * uspjeha u jednom pokušaju. * * U proračunima se koristi sljedeća relacija * * 1 - p = rev_Beta(y|n-m,m+1). */ ( tvrditi((n > 0) && (m >= 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

Poglavlje 7

Specifični zakoni distribucije slučajnih varijabli

Vrste zakona raspodjele diskretnih slučajnih varijabli

Neka diskretna slučajna varijabla uzme vrijednosti X 1 , X 2 , …, x n, … . Vjerojatnosti ovih vrijednosti mogu se izračunati koristeći različite formule, na primjer, koristeći osnovne teoreme teorije vjerojatnosti, Bernoullijevu formulu ili neke druge formule. Za neke od ovih formula zakon raspodjele ima svoje ime.

Najčešći zakoni distribucije diskretne slučajne varijable su binomni, geometrijski, hipergeometrijski, Poissonov zakon raspodjele.

Zakon binomne distribucije

Neka se proizvede n nezavisna ispitivanja, u svakom od kojih se događaj može, ali ne mora dogoditi I. Vjerovatnoća pojave ovog događaja u svakom pojedinačnom pokušaju je konstantna, ne ovisi o broju pokušaja i jednaka je R=R(I). Otuda je vjerovatnoća da se događaj neće dogoditi I u svakom testu je također konstantan i jednak q=1–R. Uzmite u obzir slučajnu varijablu X jednak broju pojavljivanja događaja I in n testovi. Očigledno je da su vrijednosti ove količine jednake

X 1 =0 - događaj I in n testovi se nisu pojavili;

X 2 =1 – događaj I in n suđenja su se pojavila jednom;

X 3 =2 - događaj I in n suđenja su se pojavila dva puta;

…………………………………………………………..

x n +1 = n- događaj I in n testovi su se pojavili sve n jednom.

Vjerojatnosti ovih vrijednosti mogu se izračunati korištenjem Bernoullijeve formule (4.1):

gdje to=0, 1, 2, …,n .

Zakon binomne distribucije X jednak broju uspjeha u n Bernulijevi pokušaji, sa vjerovatnoćom uspjeha R.

Dakle, diskretna slučajna varijabla ima binomnu distribuciju (ili je distribuirana prema binomskom zakonu) ako su njene moguće vrijednosti 0, 1, 2, …, n, a odgovarajuće vjerovatnoće se izračunavaju po formuli (7.1).

Binomna distribucija zavisi od dva parametri R i n.

Red distribucije slučajne varijable raspoređene prema binomskom zakonu ima oblik:

X k n
R

Primjer 7.1 . Tri nezavisna hica se ispaljuju u metu. Vjerovatnoća da ćete pogoditi svaki metak je 0,4. Slučajna vrijednost X- broj pogodaka u metu. Konstruirajte njegovu distribucijsku seriju.

Odluka. Moguće vrijednosti slučajne varijable X su X 1 =0; X 2 =1; X 3 =2; X 4=3. Pronađite odgovarajuće vjerovatnoće koristeći Bernoullijevu formulu. Lako je pokazati da je primjena ove formule ovdje potpuno opravdana. Imajte na umu da će vjerovatnoća da jednim udarcem ne pogodite metu biti jednaka 1-0,4=0,6. Get

Serija distribucije ima sljedeći oblik:

X
R 0,216 0,432 0,288 0,064

Lako je provjeriti da je zbir svih vjerovatnoća jednak 1. Sama slučajna varijabla X distribuiraju prema binomskom zakonu. ■

Nađimo matematičko očekivanje i varijansu slučajne varijable distribuirane prema binomskom zakonu.

Prilikom rješavanja primjera 6.5 pokazalo se da matematičko očekivanje broja pojavljivanja događaja I in n nezavisni testovi, ako je vjerovatnoća pojave I u svakom testu je konstantan i jednak R, jednako n· R

U ovom primjeru korištena je slučajna varijabla, raspoređena prema binomskom zakonu. Stoga je rješenje primjera 6.5, u stvari, dokaz sljedeće teoreme.

Teorema 7.1. Matematičko očekivanje diskretne slučajne varijable raspoređene prema binomskom zakonu jednako je proizvodu broja pokušaja i vjerovatnoće "uspjeha", tj. M(X)=n· R.

Teorema 7.2. Varijanca diskretne slučajne varijable raspoređene prema binomskom zakonu jednaka je proizvodu broja pokušaja sa vjerovatnoćom "uspjeha" i vjerovatnoćom "neuspjeha", tj. D(X)=npq.

Skewness i kurtosis slučajne varijable raspoređene prema binomskom zakonu određuju se formulama

Ove formule se mogu dobiti koristeći koncept početnih i centralnih momenata.

Zakon binomne distribucije je u osnovi mnogih stvarnih situacija. Za velike vrijednosti n binomna distribucija se može aproksimirati drugim distribucijama, posebno Poissonovom distribucijom.

Poissonova distribucija

Neka bude n Bernulijevih suđenja, sa brojem suđenja n dovoljno velika. Ranije je pokazano da u ovom slučaju (ako je, pored toga, vjerovatnoća R razvoj događaja I vrlo mala) da se pronađe vjerovatnoća da će neki događaj I da se pojavi t jednom u testovima, možete koristiti Poissonovu formulu (4.9). Ako je slučajna varijabla X znači broj pojavljivanja događaja I in n Bernulijevim suđenjima, onda verovatnoća da X poprimiće značenje k može se izračunati po formuli

, (7.2)

gdje λ = np.

Poissonov zakon distribucije se naziva distribucija diskretne slučajne varijable X, za koje su moguće vrijednosti nenegativni cijeli brojevi i vjerovatnoće p t ove vrijednosti se nalaze po formuli (7.2).

Vrijednost λ = np pozvao parametar Poissonova distribucija.

Slučajna varijabla distribuirana prema Poissonovom zakonu može poprimiti beskonačan broj vrijednosti. Budući da je za ovu distribuciju vjerovatnoća R pojava događaja u svakom ispitivanju je mala, tada se ova raspodjela ponekad naziva zakonom rijetkih fenomena.

Red raspodjele slučajne varijable raspoređene prema Poissonovom zakonu ima oblik

X t
R

Lako je provjeriti da je zbir vjerovatnoća drugog reda jednak 1. Da bismo to učinili, moramo zapamtiti da se funkcija može proširiti u Maclaurinov red, koji konvergira za bilo koji X. U ovom slučaju imamo

. (7.3)

Kao što je navedeno, Poissonov zakon u određenim graničnim slučajevima zamjenjuje binomni zakon. Primjer je slučajna varijabla X, čije su vrijednosti jednake broju kvarova u određenom vremenskom periodu uz ponovnu upotrebu tehničkog uređaja. Pretpostavlja se da je ovaj uređaj visoke pouzdanosti, tj. vjerovatnoća neuspjeha u jednoj aplikaciji je vrlo mala.

Pored ovakvih ograničavajućih slučajeva, u praksi postoje slučajne varijable raspoređene prema Poissonovom zakonu, a ne vezane za binomsku distribuciju. Na primjer, Poissonova distribucija se često koristi kada se radi o broju događaja koji se dešavaju u određenom vremenskom periodu (broj poziva na telefonsku centralu u toku sata, broj automobila koji su stigli u autopraonicu tokom dana, broj zaustavljanja mašine sedmično, itd.). Svi ovi događaji moraju formirati takozvani tok događaja, što je jedan od osnovnih koncepata teorije čekanja. Parametar λ karakteriše prosečan intenzitet toka događaja.

Binomna distribucija je jedna od najvažnijih distribucija vjerovatnoće za slučajnu varijablu koja se diskretno mijenja. Binomna distribucija je raspodjela vjerovatnoće nekog broja m događaj I in n međusobno nezavisna zapažanja. Često događaj I naziva "uspjeh" posmatranja, a suprotan događaj - "neuspjeh", ali je ova oznaka vrlo uslovna.

Uvjeti binomne distribucije:

  • izvršeno ukupno n suđenja u kojima je događaj I može se dogoditi ili ne mora;
  • događaj I u svakom od pokusa može se dogoditi sa istom vjerovatnoćom str;
  • testovi su međusobno nezavisni.

Verovatnoća da u n test događaj I upravo m puta, može se izračunati korištenjem Bernoullijeve formule:

,

gdje str- vjerovatnoća da će se događaj dogoditi I;

q = 1 - str je vjerovatnoća da se dogodi suprotan događaj.

Hajde da to shvatimo zašto je binomna distribucija povezana sa Bernulijevom formulom na gore opisan način . Događaj - broj uspjeha na n testovi su podijeljeni na više opcija, u svakoj od kojih se postiže uspjeh u m iskušenja, a neuspjeh - u n - m testovi. Razmotrite jednu od ovih opcija - B1 . Prema pravilu sabiranja vjerovatnoća, množimo vjerovatnoće suprotnih događaja:

,

i ako označimo q = 1 - str, onda

.

Istu vjerovatnoću imat će bilo koja druga opcija u kojoj m uspjeh i n - m neuspjesi. Broj takvih opcija jednak je broju načina na koje je to moguće n test get m uspjeh.

Zbir vjerovatnoća svih m broj događaja I(brojevi od 0 do n) je jednako jedan:

gdje je svaki član član Njutnovog binoma. Stoga se razmatrana raspodjela naziva binomna distribucija.

U praksi je često potrebno izračunati vjerovatnoće „najviše m uspjeh u n testovi" ili "barem m uspjeh u n testovi". Za to se koriste sljedeće formule.

Integralna funkcija, tj vjerovatnoća F(m) to u n događaj posmatranja I više neće doći m jednom, može se izračunati pomoću formule:

Zauzvrat vjerovatnoća F(≥m) to u n događaj posmatranja I dođi barem m jednom, izračunava se po formuli:

Ponekad je zgodnije izračunati vjerovatnoću da in n događaj posmatranja I više neće doći m puta, kroz vjerovatnoću suprotnog događaja:

.

Koju od formula koristiti ovisi o tome koja od njih sadrži manje pojmova.

Karakteristike binomne distribucije se izračunavaju korištenjem sljedećih formula .

Očekivana vrijednost: .

disperzija: .

Standardna devijacija: .

Binomna distribucija i proračuni u MS Excel-u

Vjerojatnost binomne distribucije P n ( m) i vrijednost integralne funkcije F(m) može se izračunati pomoću MS Excel funkcije BINOM.DIST. Prozor za odgovarajući proračun je prikazan ispod (kliknite levi taster miša za uvećanje).


MS Excel zahtijeva da unesete sljedeće podatke:

  • broj uspjeha;
  • broj testova;
  • vjerovatnoća uspjeha;
  • integral - logička vrijednost: 0 - ako treba izračunati vjerovatnoću P n ( m) i 1 - ako je vjerovatnoća F(m).

Primjer 1 Direktor kompanije sumirao je podatke o broju prodatih kamera u proteklih 100 dana. U tabeli su sumirane informacije i izračunate vjerovatnoće da će se određeni broj kamera dnevno prodati.

Dan završava profitom ako se proda 13 ili više kamera. Verovatnoća da će dan biti odrađen sa profitom:

Vjerovatnoća da će dan biti odrađen bez dobiti:

Neka je vjerovatnoća da je dan odrađen sa profitom konstantna i jednaka 0,61, a broj prodatih kamera dnevno ne ovisi o danu. Tada možete koristiti binomnu distribuciju, gdje je događaj I- dan će biti odrađen sa profitom, - bez dobiti.

Verovatnoća da će od 6 dana sve biti rešeno sa profitom:

.

Isti rezultat dobijamo koristeći MS Excel funkciju BINOM.DIST (vrijednost integralne vrijednosti je 0):

P 6 (6 ) = BINOM.DIST(6; 6; 0,61; 0) = 0,052.

Verovatnoća da će od 6 dana 4 ili više dana biti odrađeno sa profitom:

gdje ,

,

Koristeći MS Excel funkciju BINOM.DIST, izračunavamo vjerovatnoću da od 6 dana ne više od 3 dana bude završeno sa profitom (vrijednost integralne vrijednosti je 1):

P 6 (≤3 ) = BINOM.DIST(3, 6, 0,61, 1) = 0,435.

Verovatnoća da će od 6 dana sve biti rešeno sa gubicima:

,

Isti indikator izračunavamo koristeći MS Excel funkciju BINOM.DIST:

P 6 (0 ) = BINOM.DIST(0; 6; 0,61; 0) = 0,0035.

Riješite problem sami, a zatim pogledajte rješenje

Primjer 2 Urna sadrži 2 bijele kugle i 3 crne. Iz urne se vadi kugla, postavlja se boja i vraća nazad. Pokušaj se ponavlja 5 puta. Broj pojavljivanja bijelih kuglica je diskretna slučajna varijabla X, distribuiran prema binomskom zakonu. Sastavite zakon raspodjele slučajne varijable. Odredite mod, matematičko očekivanje i varijansu.

Nastavljamo da zajedno rješavamo probleme

Primjer 3 Od kurirske službe otišao do objekata n= 5 kurira. Svaki kurir sa vjerovatnoćom str= 0,3 kasni za objekat bez obzira na ostale. Diskretna slučajna varijabla X- broj kasnih kurira. Konstruirajte seriju distribucije ove slučajne varijable. Pronađite njegovo matematičko očekivanje, varijansu, standardnu ​​devijaciju. Pronađite vjerovatnoću da će najmanje dva kurira zakasniti na objekte.

Teorija vjerovatnoće nevidljivo je prisutna u našim životima. Ne obraćamo pažnju na to, ali svaki događaj u našem životu ima jednu ili drugu vjerovatnoću. S obzirom na ogroman broj mogućih scenarija, postaje neophodno da odredimo najvjerovatniji i najmanje vjerovatni od njih. Najpogodnije je takve vjerovatnoće analizirati grafički. Distribucija nam može pomoći u tome. Binom je jedan od najlakših i najpreciznijih.

Prije nego što pređemo direktno na matematiku i teoriju vjerovatnoće, hajde da shvatimo ko je prvi došao do ove vrste distribucije i kakva je istorija razvoja matematičkog aparata za ovaj koncept.

istorija

Koncept vjerovatnoće poznat je od davnina. Međutim, stari matematičari tome nisu pridavali veliki značaj i mogli su samo da postave temelje za teoriju koja je kasnije postala teorija vjerovatnoće. Stvorili su neke kombinatorne metode koje su uvelike pomogle onima koji su kasnije stvorili i razvili samu teoriju.

U drugoj polovini sedamnaestog veka počelo je formiranje osnovnih pojmova i metoda teorije verovatnoće. Uvedene su definicije slučajnih varijabli, metode za izračunavanje vjerovatnoće jednostavnih i nekih složenih nezavisnih i zavisnih događaja. Takav interes za slučajne varijable i vjerovatnoće diktiralo je kockanje: svaka osoba je željela znati kakve su mu šanse za pobjedu.

Sljedeći korak bila je primjena metoda matematičke analize u teoriji vjerovatnoće. Eminentni matematičari kao što su Laplace, Gauss, Poisson i Bernoulli preuzeli su ovaj zadatak. Upravo su oni unaprijedili ovu oblast matematike novi nivo. James Bernoulli je bio taj koji je otkrio binomni zakon raspodjele. Inače, kako ćemo kasnije saznati, na osnovu ovog otkrića napravljeno je još nekoliko, što je omogućilo stvaranje zakona normalne raspodjele i mnogih drugih.

Sada, prije nego što počnemo opisivati ​​binomnu distribuciju, malo ćemo osvježiti sjećanje na pojmove teorije vjerovatnoće, vjerovatno već zaboravljene iz školske klupe.

Osnove teorije vjerovatnoće

Razmotrit ćemo takve sisteme, kao rezultat kojih su moguća samo dva ishoda: "uspjeh" i "neuspjeh". To je lako razumjeti na primjeru: bacamo novčić, nagađajući da će repovi ispasti. Vjerovatnoće svakog od mogućih događaja (padanje repova - "uspjeh", padanje glava - "ne uspjeh") jednake su 50 posto ako je novčić savršeno izbalansiran i nema drugih faktora koji mogu utjecati na eksperiment.

Bio je to najjednostavniji događaj. Ali postoje i složeni sistemi u kojima se izvode sekvencijalne radnje, a vjerovatnoće ishoda tih radnji će se razlikovati. Na primjer, razmotrite sljedeći sistem: u kutiji čiji sadržaj ne možemo vidjeti, nalazi se šest apsolutno identičnih loptica, tri para plave, crvene i bijelo cvijeće. Moramo nasumce dobiti nekoliko loptica. Shodno tome, tako što ćemo prvo izvući jednu od bijelih loptica, smanjit ćemo za nekoliko puta vjerovatnoću da ćemo i sljedeću dobiti bijelu loptu. To se događa jer se broj objekata u sistemu mijenja.

U sljedećem odjeljku ćemo pogledati složenije matematičke koncepte koji nas približavaju onome što su riječi " normalna distribucija"," binomna distribucija "i slično.

Elementi matematičke statistike

U statistici, koja je jedno od područja primjene teorije vjerovatnoće, postoji mnogo primjera gdje podaci za analizu nisu dati eksplicitno. Odnosno, ne u brojevima, već u obliku podjele prema karakteristikama, na primjer, prema spolu. Da bi se na takve podatke primijenio matematički aparat i iz dobivenih rezultata izveli neki zaključci, potrebno je početne podatke pretvoriti u numerički format. Po pravilu, da bi se ovo sprovelo, pozitivnom ishodu se dodeljuje vrednost 1, a negativnom vrednost 0. Tako se dobijaju statistički podaci koji se mogu analizirati matematičkim metodama.

Sljedeći korak u razumijevanju binomske distribucije slučajne varijable je određivanje varijanse slučajne varijable i matematičkog očekivanja. O tome ćemo govoriti u sljedećem odjeljku.

Očekivana vrijednost

Zapravo, nije teško razumjeti šta je matematičko očekivanje. Zamislite sistem u kojem postoji mnogo različitih događaja sa svojim različitim vjerovatnoćama. Matematičko očekivanje nazvat ćemo vrijednost jednaku zbroju proizvoda vrijednosti ovih događaja (u matematičkom obliku o kojem smo govorili u prošlom odjeljku) i vjerojatnosti njihovog nastanka.

Matematičko očekivanje binomske distribucije izračunava se prema istoj shemi: uzimamo vrijednost slučajne varijable, množimo je sa vjerovatnoćom pozitivnog ishoda, a zatim sumiramo dobijene podatke za sve varijable. Vrlo je zgodno ove podatke prikazati grafički - na taj način se bolje uočava razlika između matematičkih očekivanja različitih vrijednosti.

U sljedećem dijelu ćemo vam reći nešto o drugom konceptu - varijansi slučajne varijable. Takođe je blisko povezan sa konceptom kao što je binomna distribucija verovatnoće i predstavlja njegovu karakteristiku.

Varijanca binomne distribucije

Ova vrijednost je usko povezana sa prethodnom i također karakterizira distribuciju statističkih podataka. Predstavlja srednji kvadrat odstupanja vrijednosti od njihovog matematičkog očekivanja. Odnosno, varijansa slučajne varijable je zbir kvadrata razlika između vrijednosti slučajne varijable i njene matematičko očekivanje pomnoženo sa vjerovatnoćom ovog događaja.

Uopšteno govoreći, ovo je sve što treba da znamo o varijansi da bismo razumeli šta je binomna distribucija verovatnoće. Pređimo sada na našu glavnu temu. Naime, šta se krije iza ovako naizgled prilično komplicirane fraze "zakon binomne distribucije".

Binomna distribucija

Hajde da prvo shvatimo zašto je ova distribucija binomna. Dolazi od riječi "binom". Možda ste čuli za Newtonov binom – formulu koja se može koristiti za proširenje zbira bilo koja dva broja a i b na bilo koji nenegativni stepen n.

Kao što ste vjerovatno već pretpostavili, Newtonova binomna formula i formula binomne distribucije su gotovo iste formule. Uz jedini izuzetak što drugi ima primijenjenu vrijednost za određene veličine, a prvi je samo opći matematički alat, čija primjena u praksi može biti različita.

Formule distribucije

Funkcija binomne distribucije može se napisati kao zbir sljedećih članova:

(n!/(n-k)!k!)*p k *q n-k

Ovdje je n broj nezavisnih nasumičnih eksperimenata, p je broj uspješnih ishoda, q je broj neuspješnih ishoda, k je broj eksperimenta (može imati vrijednosti od 0 do n),! - oznaka faktorijala, takve funkcije broja, čija je vrijednost jednaka umnošku svih brojeva koji idu do njega (na primjer, za broj 4: 4!=1*2*3*4= 24).

Dodatno, funkcija binomne distribucije može se napisati kao nepotpuna beta funkcija. Međutim, ovo je više složena definicija, koji se koristi samo pri rješavanju složenih statističkih problema.

Binomna distribucija, čije smo primjere prethodno ispitali, jedna je od najčešćih jednostavne vrste distribucije u teoriji vjerovatnoće. Postoji i normalna distribucija, koja je vrsta binomne distribucije. To se najčešće koristi i najlakše je izračunati. Postoji i Bernoullijeva distribucija, Poissonova distribucija, uslovna distribucija. Svi oni grafički karakterišu oblasti verovatnoće određenog procesa u različitim uslovima.

U sljedećem dijelu ćemo razmotriti aspekte koji se odnose na primjenu ovog matematičkog aparata u pravi zivot. Na prvi pogled, naravno, čini se da je to još jedna matematička stvar, koja, kao i obično, ne nalazi primjenu u stvarnom životu i uglavnom nikome nije potrebna osim samim matematičarima. Međutim, to nije slučaj. Uostalom, sve vrste distribucija i njihovi grafički prikazi stvoreni su isključivo u praktične svrhe, a ne kao hir naučnika.

Aplikacija

Daleko najvažnija primjena distribucija je u statistici, gdje je potrebna kompleksna analiza mnoštva podataka. Kao što pokazuje praksa, vrlo mnogo nizova podataka ima približno iste raspodjele vrijednosti: kritična područja vrlo niskih i vrlo visokih vrijednosti, po pravilu, sadrže manje elemenata od prosječnih vrijednosti.

Analiza velikih nizova podataka potrebna je ne samo u statistici. Neophodan je, na primjer, u fizičkoj hemiji. U ovoj nauci se koristi za određivanje mnogih veličina koje su povezane sa nasumičnim vibracijama i kretanjima atoma i molekula.

U sljedećem dijelu ćemo razgovarati o tome koliko je važno koristiti takve statistički koncepti, kao binom distribucija slučajne varijable u Svakodnevni život za tebe i mene.

Zašto mi treba?

Mnogi ljudi sebi postavljaju ovo pitanje kada je matematika u pitanju. I uzgred, matematiku ne nazivaju uzalud kraljicom nauka. To je osnova fizike, hemije, biologije, ekonomije, a u svakoj od ovih nauka koristi se i neka vrsta distribucije: da li je diskretna binomna raspodela ili normalna, nije bitno. A ako bolje pogledamo svijet oko nas, vidjet ćemo da se matematika koristi svuda: u svakodnevnom životu, na poslu, pa čak i međuljudski odnosi mogu biti predstavljeni u obliku statističkih podataka i analizirani (ovo, inače, , rade oni koji rade u posebnim organizacijama koje se bave prikupljanjem informacija).

Hajde da sada malo porazgovaramo o tome šta učiniti ako trebate znati mnogo više o ovoj temi od onoga što smo naveli u ovom članku.

Informacije koje smo dali u ovom članku daleko su od potpune. Postoji mnogo nijansi o tome kakav bi oblik distribucije mogao imati. Binomna distribucija, kao što smo već saznali, jedan je od glavnih tipova na kojima se zasniva sva matematička statistika i teorija vjerovatnoće.

Ako se zainteresujete, ili u vezi sa svojim radom, trebate znati mnogo više o ovoj temi, morat ćete proučiti specijaliziranu literaturu. Trebalo bi da počnete sa univerzitetskim kursom matematičke analize i tamo pređete na odeljak o teoriji verovatnoće. Takođe će biti korisno znanje iz oblasti nizova, jer binomna distribucija verovatnoće nije ništa drugo do niz uzastopnih članova.

Zaključak

Prije nego što završimo članak, htjeli bismo vam reći još jednu zanimljivost. To se direktno tiče teme našeg članka i cjelokupne matematike općenito.

Mnogi ljudi kažu da je matematika beskorisna nauka i ništa što su naučili u školi im nije bilo od koristi. Ali znanje nikada nije suvišno, a ako vam nešto ne koristi u životu, to znači da se toga jednostavno ne sjećate. Ako imate znanje, oni vam mogu pomoći, ali ako ih nemate, onda ne možete očekivati ​​pomoć od njih.

Dakle, ispitali smo koncept binomne distribucije i sve definicije povezane s njom i razgovarali o tome kako se primjenjuje u našim životima.



greška: Sadržaj je zaštićen!!