Odaberite Stranica

Intervali povjerenja za matematička očekivanja, varijansu, vjerovatnoću. Rješenja problema

Neka CB X formira opštu populaciju i neka je β nepoznati parametar CB X. Ako je statistička procjena u * konzistentna, onda što je veća veličina uzorka, točnije dobijamo vrijednost β. Međutim, u praksi nemamo baš velike uzorke, pa ne možemo garantovati veću tačnost.

Neka je b* statistička procjena za c. Vrijednost |in* - in| naziva se tačnost procjene. Jasno je da je tačnost CB, pošto je β* slučajna varijabla. Navedite mali pozitivan broj 8 i zahtijevamo da je tačnost procjene |v* - v| bio manji od 8, tj. | u* - u |< 8.

Pouzdanost g ili verovatnoća poverenja procjene u po in * je vjerovatnoća g sa kojom je nejednakost |in * - in|< 8, т. е.

Obično je pouzdanost g specificirana unaprijed, a g se uzima kao broj blizu 1 (0,9; 0,95; 0,99; ...).

Budući da je nejednakost |in * - in|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Interval (u * - 8, u * + 5) naziva se interval pouzdanosti, tj. interval povjerenja pokriva nepoznati parametar in sa vjerovatnoćom y. Imajte na umu da su krajevi intervala pouzdanosti nasumični i variraju od uzorka do uzorka, pa je tačnije reći da interval (u * - 8, u * + 8) pokriva nepoznati parametar u, umjesto da pripada ovom interval.

Neka stanovništva je dato slučajnom varijablom X, raspoređenom prema normalnom zakonu, a standardna devijacija a je poznata. Nepoznato je matematičko očekivanje a = M (X). Potrebno je pronaći interval pouzdanosti za a za datu pouzdanost y.

Uzorak srednji

je statistička procjena za xg = a.

Teorema. Slučajna vrijednost xB ima normalna distribucija, ako X ima normalnu distribuciju, a M (XB) = a,

A (XB) = a, gdje je a = y/B (X), a = M (X). l/i

Interval pouzdanosti za a ima oblik:

Nalazimo 8.

Koristeći omjer

gdje je F(r) Laplaceova funkcija, imamo:

P ( | XB - a |<8} = 2Ф

tablicu vrijednosti Laplaceove funkcije nalazimo vrijednost t.

Nakon što je odredio

T, dobijamo F(t) = g Pošto je g zadato, onda po

Iz jednakosti nalazimo da je procjena tačna.

To znači da interval pouzdanosti za a ima oblik:

S obzirom na uzorak iz populacije X

ng za" X2 Xm
n. n1 n2 nm

n = U1 + ... + nm, tada će interval pouzdanosti biti:

Primjer 6.35. Pronađite interval pouzdanosti za procjenu matematičkog očekivanja a normalne distribucije sa pouzdanošću od 0,95, znajući srednju vrijednost uzorka Xb = 10,43, veličinu uzorka n = 100 i standardnu ​​devijaciju s = 5.

Koristimo formulu

Interval pouzdanosti za matematička očekivanja - ovo je interval izračunat iz podataka koji sa poznatom vjerovatnoćom sadrži matematičko očekivanje opće populacije. Prirodna procjena za matematičko očekivanje je aritmetička sredina njegovih promatranih vrijednosti. Zbog toga ćemo tokom čitave lekcije koristiti pojmove „prosjek“ i „prosječna vrijednost“. U problemima izračunavanja intervala pouzdanosti, odgovor koji se najčešće traži je nešto poput „Interval pouzdanosti prosječnog broja [vrijednosti u određenom problemu] je od [manje vrijednosti] do [veće vrijednosti].“ Koristeći interval pouzdanosti, možete procijeniti ne samo prosječne vrijednosti, već i udio određene karakteristike opće populacije. O prosječnim vrijednostima, disperziji, standardnoj devijaciji i grešci, kroz koje ćemo doći do novih definicija i formula, govori se u lekciji Karakteristike uzorka i populacije .

Tačkaste i intervalne procjene srednje vrijednosti

Ako je prosječna vrijednost populacije procijenjena brojem (bodom), tada se kao procjena nepoznate prosječne vrijednosti populacije uzima određeni prosjek, koji se izračunava iz uzorka opservacija. U ovom slučaju, vrijednost uzorka srednje vrijednosti - slučajne varijable - ne poklapa se sa srednjom vrijednošću opće populacije. Stoga, kada pokazujete srednju vrijednost uzorka, morate istovremeno naznačiti grešku uzorkovanja. Mjera greške uzorkovanja je standardna greška, koja se izražava u istim jedinicama kao i srednja vrijednost. Stoga se često koristi sljedeća notacija: .

Ako procjenu prosjeka treba povezati sa određenom vjerovatnoćom, onda se parametar od interesa u populaciji mora procijeniti ne jednim brojem, već intervalom. Interval pouzdanosti je interval u kojem, sa određenom vjerovatnoćom P nalazi se vrijednost indikatora procijenjenog stanovništva. Interval povjerenja u kojem je vjerovatno P = 1 - α pronađena je slučajna varijabla, izračunata na sljedeći način:

,

α = 1 - P, koji se može naći u dodatku gotovo svake knjige o statistici.

U praksi, populacijska srednja vrijednost i varijansa nisu poznate, pa se varijansa populacije zamjenjuje varijansom uzorka, a populacijska srednja vrijednost uzorkom. Stoga se interval pouzdanosti u većini slučajeva izračunava na sljedeći način:

.

Formula intervala pouzdanosti može se koristiti za procjenu srednje vrijednosti populacije ako

  • poznata je standardna devijacija populacije;
  • ili je standardna devijacija populacije nepoznata, ali je veličina uzorka veća od 30.

Srednja vrijednost uzorka je nepristrasna procjena srednje vrijednosti populacije. Zauzvrat, varijansa uzorka nije nepristrasna procjena varijanse populacije. Da bi se dobila nepristrasna procjena varijanse populacije u formuli varijanse uzorka, veličina uzorka n treba zamijeniti sa n-1.

Primjer 1. Od 100 nasumično odabranih kafića u određenom gradu prikupljena je informacija da je prosječan broj zaposlenih u njima 10,5 sa standardnom devijacijom od 4,6. Odredite interval pouzdanosti od 95% za broj zaposlenih u kafiću.

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,05 .

Tako se interval povjerenja od 95% za prosječan broj zaposlenih u kafiću kretao od 9,6 do 11,4.

Primjer 2. Za slučajni uzorak iz populacije od 64 opservacije, izračunate su sljedeće ukupne vrijednosti:

zbir vrijednosti u zapažanjima,

zbir kvadrata odstupanja vrijednosti od prosjeka .

Izračunajte 95% interval pouzdanosti za matematičko očekivanje.

Izračunajmo standardnu ​​devijaciju:

,

Izračunajmo prosječnu vrijednost:

.

Zamjenjujemo vrijednosti u izraz za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,05 .

Dobijamo:

Tako se interval pouzdanosti od 95% za matematičko očekivanje ovog uzorka kretao od 7,484 do 11,266.

Primjer 3. Za slučajni uzorak populacije od 100 opservacija, izračunata srednja vrijednost je 15,2, a standardna devijacija je 3,2. Izračunajte interval pouzdanosti od 95% za očekivanu vrijednost, a zatim 99% interval pouzdanosti. Ako snaga uzorka i njena varijacija ostanu nepromijenjene, a koeficijent pouzdanosti raste, hoće li se interval povjerenja suziti ili proširiti?

Ove vrijednosti zamjenjujemo u izraz za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,05 .

Dobijamo:

.

Tako se interval pouzdanosti od 95% za srednju vrijednost ovog uzorka kretao od 14,57 do 15,82.

Ponovo zamjenjujemo ove vrijednosti u izraz za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,01 .

Dobijamo:

.

Tako se interval pouzdanosti od 99% za srednju vrijednost ovog uzorka kretao od 14,37 do 16,02.

Kao što vidimo, kako se koeficijent pouzdanosti povećava, tako se povećava i kritična vrijednost standardne normalne distribucije, pa se početna i završna tačka intervala nalaze dalje od srednje vrijednosti, a samim tim raste i interval povjerenja za matematičko očekivanje. .

Tačkaste i intervalne procjene specifične težine

Udio nekog atributa uzorka može se tumačiti kao bodovna procjena udjela str iste karakteristike u opštoj populaciji. Ako ovu vrijednost treba povezati s vjerovatnoćom, tada treba izračunati interval pouzdanosti specifične težine str karakteristika u populaciji sa vjerovatnoćom P = 1 - α :

.

Primjer 4. U nekom gradu postoje dva kandidata A I B kandiduju se za gradonačelnika. Anketirano je nasumično 200 stanovnika grada, od kojih je 46% odgovorilo da bi glasalo za kandidata A, 26% - za kandidata B a 28% ne zna za koga će glasati. Odredite interval povjerenja od 95% za udio stanovnika grada koji podržavaju kandidata A.

Često procjenitelj mora analizirati tržište nekretnina segmenta u kojem se nekretnina koja se procjenjuje nalazi. Ako je tržište razvijeno, može biti teško analizirati cijeli skup prikazanih objekata, pa se za analizu koristi uzorak objekata. Ovaj uzorak ne ispada uvijek homogen, ponekad ga je potrebno očistiti od ekstremnih tačaka - previsokih ili preniskih tržišnih ponuda. U tu svrhu se koristi interval povjerenja. Svrha ovog istraživanja je da se izvrši komparativna analiza dvije metode za izračunavanje intervala povjerenja i izbor optimalne opcije proračuna pri radu sa različitim uzorcima u sistemu estimatica.pro.

Interval pouzdanosti je interval vrijednosti atributa koji se izračunava na osnovu uzorka, koji sa poznatom vjerovatnoćom sadrži procijenjeni parametar opće populacije.

Smisao izračunavanja intervala povjerenja je da se takav interval konstruiše na osnovu podataka uzorka tako da se sa datom vjerovatnoćom može konstatovati da je vrijednost procijenjenog parametra u ovom intervalu. Drugim riječima, interval povjerenja sadrži nepoznatu vrijednost procijenjene vrijednosti sa određenom vjerovatnoćom. Što je interval širi, to je veća nepreciznost.

Postoje različite metode za određivanje intervala pouzdanosti. U ovom članku ćemo pogledati 2 metode:

  • kroz medijanu i standardnu ​​devijaciju;
  • kroz kritičnu vrijednost t-statistike (Studentov koeficijent).

Faze uporedne analize različitih metoda za izračunavanje CI:

1. formirati uzorak podataka;

2. obrađujemo statističkim metodama: izračunavamo prosječnu vrijednost, medijan, varijansu itd.;

3. izračunati interval pouzdanosti na dva načina;

4. analizirati očišćene uzorke i rezultirajuće intervale pouzdanosti.

Faza 1. Uzorkovanje podataka

Uzorak je formiran pomoću sistema estimatica.pro. Uzorak je uključivao 91 ponudu za prodaju jednosobnih stanova u 3. zoni cijena sa tipom rasporeda „Hruščov“.

Tabela 1. Početni uzorak

Cijena 1 m2, jed

Fig.1. Početni uzorak



Faza 2. Obrada početnog uzorka

Obrada uzorka pomoću statističkih metoda zahtijeva izračunavanje sljedećih vrijednosti:

1. Aritmetička sredina

2. Medijan je broj koji karakteriše uzorak: tačno polovina elemenata uzorka je veća od medijane, druga polovina je manja od medijane

(za uzorak sa neparnim brojem vrijednosti)

3. Raspon - razlika između maksimalne i minimalne vrijednosti u uzorku

4. Varijanca - koristi se za precizniju procjenu varijacije podataka

5. Standardna devijacija uzorka (u daljem tekstu - SD) je najčešći indikator disperzije vrednosti podešavanja oko aritmetičke sredine.

6. Koeficijent varijacije - odražava stepen rasipanja vrednosti podešavanja

7. koeficijent oscilacije - odražava relativnu fluktuaciju ekstremnih vrijednosti cijene u uzorku oko prosjeka

Tabela 2. Statistički pokazatelji originalnog uzorka

Koeficijent varijacije, koji karakteriše homogenost podataka, iznosi 12,29%, ali je koeficijent oscilacije previsok. Dakle, možemo reći da originalni uzorak nije homogen, pa prijeđimo na izračunavanje intervala povjerenja.

Faza 3. Proračun intervala povjerenja

Metoda 1. Proračun korištenjem medijane i standardne devijacije.

Interval pouzdanosti se određuje na sljedeći način: minimalna vrijednost - standardna devijacija se oduzima od medijane; maksimalna vrijednost - standardna devijacija se dodaje medijani.

Dakle, interval povjerenja (47179 CU; 60689 CU)

Rice. 2. Vrijednosti koje spadaju u interval pouzdanosti 1.



Metoda 2. Konstruiranje intervala povjerenja korištenjem kritične vrijednosti t-statistike (Student koeficijent)

S.V. Gribovsky u svojoj knjizi “Matematičke metode za procjenu vrijednosti svojstva” opisuje metodu za izračunavanje intervala povjerenja preko Studentovog koeficijenta. Prilikom izračunavanja pomoću ove metode, procjenitelj mora sam postaviti nivo značajnosti ∝, koji određuje vjerovatnoću sa kojom će se konstruirati interval povjerenja. Obično se koriste nivoi značajnosti od 0,1; 0,05 i 0,01. Oni odgovaraju vjerovatnoći pouzdanosti od 0,9; 0,95 i 0,99. Ovom metodom se pretpostavlja da su prave vrijednosti matematičkog očekivanja i varijanse praktički nepoznate (što je gotovo uvijek tačno kada se rješavaju praktični problemi procjene).

Formula intervala povjerenja:

n - veličina uzorka;

Kritična vrijednost t-statistike (Studentova distribucija) sa nivoom značajnosti ∝, brojem stupnjeva slobode n-1, koji se utvrđuje iz posebnih statističkih tabela ili korištenjem MS Excel-a (→"Statistički"→ STUDIST);

∝ - nivo značajnosti, uzmite ∝=0,01.

Rice. 2. Vrijednosti koje spadaju u interval pouzdanosti 2.

Faza 4. Analiza različitih metoda za izračunavanje intervala povjerenja

Dvije metode izračunavanja intervala povjerenja - kroz medijanu i Studentov koeficijent - dovele su do različitih vrijednosti intervala. Shodno tome, dobili smo dva različita očišćena uzorka.

Tabela 3. Statistika za tri uzorka.

Indeks

Početni uzorak

1 opcija

Opcija 2

Prosječna vrijednost

Disperzija

Coef. varijacije

Coef. oscilacije

Broj penzionisanih objekata, kom.

Na osnovu izvršenih proračuna možemo reći da se vrijednosti intervala povjerenja dobivene različitim metodama ukrštaju, tako da možete koristiti bilo koju od metoda proračuna prema nahođenju procjenitelja.

Međutim, smatramo da je pri radu u sistemu estimatica.pro preporučljivo odabrati metodu za izračunavanje intervala povjerenja u zavisnosti od stepena razvijenosti tržišta:

  • ako je tržište nerazvijeno, koristite metodu obračuna koristeći medijanu i standardnu ​​devijaciju, jer je broj penzionisanih objekata u ovom slučaju mali;
  • ako je tržište razvijeno, proračun primijeniti kroz kritičnu vrijednost t-statistike (Studentov koeficijent), jer je moguće formirati veliki početni uzorak.

U pripremi članka korišteno je sljedeće:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matematičke metode za procjenu vrijednosti imovine. Moskva, 2014

2. Sistemski podaci estimatica.pro

U statistici postoje dvije vrste procjena: tačka i interval. Tačka procjena je statistika jednog uzorka koja se koristi za procjenu parametra populacije. Na primjer, srednja vrijednost uzorka je tačkasta procjena matematičkog očekivanja populacije i varijanse uzorka S 2- bodovna procjena varijanse populacije σ 2. pokazalo se da je srednja vrijednost uzorka nepristrasna procjena matematičkog očekivanja populacije. Srednja vrijednost uzorka se naziva nepristrasna jer je prosjek svih srednjih vrijednosti uzorka (sa istom veličinom uzorka) n) jednak je matematičkom očekivanju opće populacije.

U cilju varijanse uzorka S 2 postala nepristrasna procjena varijanse stanovništva σ 2, nazivnik varijanse uzorka treba postaviti jednakim n – 1 , ali ne n. Drugim riječima, varijansa populacije je prosjek svih mogućih varijansi uzorka.

Prilikom procjene parametara populacije, treba imati na umu da statistika uzorka kao npr , ovise o konkretnim uzorcima. Uzeti ovu činjenicu u obzir, dobiti intervalna procjena matematičko očekivanje opće populacije, analizirati distribuciju srednjih vrijednosti uzorka (za više detalja vidjeti). Konstruisani interval karakteriše određeni nivo pouzdanosti, koji predstavlja verovatnoću da je pravi parametar populacije tačno procenjen. Slični intervali pouzdanosti mogu se koristiti za procjenu udjela karakteristike R i glavna rasprostranjena masa stanovništva.

Preuzmite bilješku u formatu ili, primjere u formatu

Izgradnja intervala povjerenja za matematičko očekivanje populacije sa poznatom standardnom devijacijom

Izgradnja intervala povjerenja za udio neke karakteristike u populaciji

Ovaj odjeljak proširuje koncept intervala povjerenja na kategoričke podatke. Ovo nam omogućava da procijenimo udio ove karakteristike u populaciji R koristeći udio uzorka RS= X/n. Kao što je naznačeno, ako količine nR I n(1 – str) prelazi broj 5, binomna distribucija se može aproksimirati kao normalna. Dakle, procijeniti udio neke karakteristike u populaciji R moguće je konstruisati interval čiji je nivo pouzdanosti jednak (1 – α)h100%.


Gdje strS- proporcija uzorka karakteristike jednaka X/n, tj. broj uspjeha podijeljen s veličinom uzorka, R- udio karakteristike u opštoj populaciji, Z- kritična vrijednost standardizirane normalne distribucije, n- veličina uzorka.

Primjer 3. Pretpostavimo da je uzorak koji se sastoji od 100 faktura popunjenih tokom prošlog mjeseca izvučen iz informacionog sistema. Recimo da je 10 ovih faktura sastavljeno sa greškama. dakle, R= 10/100 = 0,1. Nivo pouzdanosti od 95% odgovara kritičnoj vrijednosti Z = 1,96.

Dakle, vjerovatnoća da između 4,12% i 15,88% računa sadrži greške iznosi 95%.

Za datu veličinu uzorka, interval pouzdanosti koji sadrži udio karakteristike u populaciji izgleda širi nego za kontinuiranu slučajnu varijablu. To je zato što mjerenja kontinuirane slučajne varijable sadrže više informacija nego mjerenja kategoričkih podataka. Drugim riječima, kategorički podaci koji uzimaju samo dvije vrijednosti ne sadrže dovoljno informacija za procjenu parametara njihove distribucije.

INizračunavanje procjena ekstrahovanih iz konačne populacije

Procjena matematičkog očekivanja. Korekcioni faktor za konačnu populaciju ( fpc) je korišten za smanjenje standardne greške za faktor. Prilikom izračunavanja intervala pouzdanosti za procjene parametara populacije, faktor korekcije se primjenjuje u situacijama kada se uzorci uzimaju bez vraćanja. Dakle, interval pouzdanosti za matematičko očekivanje ima nivo pouzdanosti jednak (1 – α)h100%, izračunava se po formuli:

Primjer 4. Da bismo ilustrovali upotrebu faktora korekcije za konačnu populaciju, vratimo se problemu izračunavanja intervala pouzdanosti za prosječan iznos faktura, o čemu se govorilo u primjeru 3. Pretpostavimo da kompanija izdaje 5.000 faktura mjesečno, i =110,27 dolara, S= 28,95 dolara, N = 5000, n = 100, α = 0,05, t 99 = 1,9842. Koristeći formulu (6) dobijamo:

Procjena udjela neke karakteristike. Prilikom odabira bez povrata, interval pouzdanosti za udio atributa koji ima nivo pouzdanosti jednak (1 – α)h100%, izračunava se po formuli:

Intervali povjerenja i etička pitanja

Prilikom uzorkovanja populacije i izvođenja statističkih zaključaka često se javljaju etička pitanja. Glavni je način na koji se intervali povjerenja i procjene tačaka statistike uzorka slažu. Objavljivanje procjena tačaka objavljivanja bez specificiranja povezanih intervala pouzdanosti (obično na nivou pouzdanosti od 95%) i veličine uzorka iz kojeg su izvedene može stvoriti zabunu. Ovo može dati korisniku utisak da je bodovna procjena upravo ono što mu je potrebno da predvidi svojstva cjelokupne populacije. Stoga je potrebno shvatiti da u svakom istraživanju fokus ne treba biti na tačkastim procjenama, već na procjenama intervala. Osim toga, posebnu pažnju treba posvetiti pravilnom odabiru veličina uzoraka.

Predmet statističke manipulacije najčešće su rezultati socioloških istraživanja stanovništva o određenim političkim temama. Istovremeno, rezultati istraživanja se objavljuju na naslovnim stranicama novina, a greška uzorkovanja i metodologija statističke analize se objavljuju negdje u sredini. Da bi se dokazala validnost dobijenih tačaka, potrebno je navesti veličinu uzorka na osnovu koje su dobijene, granice intervala poverenja i nivo njegove značajnosti.

Sledeća napomena

Korišteni su materijali iz knjige Levin i dr. Statistika za menadžere. – M.: Williams, 2004. – str. 448–462

Centralna granična teorema navodi da se sa dovoljno velikom veličinom uzorka distribucija uzorka srednjih vrijednosti može aproksimirati normalnom distribucijom. Ovo svojstvo ne zavisi od vrste distribucije stanovništva.

Za početak, podsjetimo se sljedeće definicije:

Razmotrimo sljedeću situaciju. Neka varijante populacije imaju normalnu distribuciju sa matematičkim očekivanjem $a$ i standardnom devijacijom $\sigma$. Srednja vrijednost uzorka u ovom slučaju će se smatrati slučajnom varijablom. Kada je količina $X$ normalno raspoređena, srednja vrijednost uzorka također će biti normalno raspoređena s parametrima

Nađimo interval pouzdanosti koji pokriva vrijednost $a$ sa pouzdanošću od $\gamma $.

Da bismo to učinili, potrebna nam je jednakost

Od toga dobijamo

Odavde možemo lako pronaći $t$ iz tablice vrijednosti funkcije $F\left(t\right)$ i, kao posljedicu, pronaći $\delta $.

Prisjetimo se tablice vrijednosti funkcije $F\left(t\right)$:

Slika 1. Tabela vrijednosti funkcije $F\left(t\right).$

Integral pouzdanosti za procjenu matematičkog očekivanja za nepoznati $(\mathbf \sigma )$

U ovom slučaju koristićemo ispravljenu vrijednost varijanse $S^2$. Zamjenom $\sigma $ sa $S$ u gornjoj formuli dobijamo:

Primjeri problema za pronalaženje intervala povjerenja

Primjer 1

Neka veličina $X$ ima normalnu distribuciju sa varijansom $\sigma =4$. Neka veličina uzorka bude $n=64$, a pouzdanost $\gamma =0,95$. Pronađite interval pouzdanosti za procjenu matematičkog očekivanja ove distribucije.

Moramo pronaći interval ($\overline(x)-\delta ,\overline(x)+\delta)$.

Kao što smo vidjeli gore

\[\delta =\frac(\sigma t)(\sqrt(n))=\frac(4t)(\sqrt(64))=\frac(\t)(2)\]

Parametar $t$ se može naći iz formule

\[F\left(t\right)=\frac(\gamma )(2)=\frac(0.95)(2)=0.475\]

Iz tabele 1 nalazimo da je $t=1.96$.



greška: Sadržaj zaštićen!!