Odaberite Stranica

Interval pouzdanosti za varijansu kada je srednja vrijednost poznata. Interval pouzdanosti za varijansu normalne distribucije

Ovdje se srednja vrijednost smatra poznatim fiksnim brojem, a varijansa djeluje kao nepoznati parametar. Hajde da stavimo

Pošto --, ima standardnu ​​normalnu distribuciju. Dakle, funkcija ima -distribuciju sa stupnjevima slobode, koja ni na koji način ne zavisi od nepoznatog parametra. Označavanje kroz kvantile ove distribucije i fiksiranje nekih, tako da , dolazimo do nejednakosti

što je ispunjeno sa vjerovatnoćom . Odakle dobijamo interval pouzdanosti za:

Interval pouzdanosti za varijansu s nepoznatom srednjom vrijednosti

Imajte na umu da je funkcija definirana na način da za dati uzorak njene vrijednosti zavise samo od parametra. Što se tiče distribucije slučajne varijable , onda je prema Fisherovoj teoremi (vidi 8.3) to -distribucija sa stupnjevima slobode i, prema tome, ne zavisi od nepoznatih parametara. Popravljanje tako da , i argumentirajući kao u (47), dolazimo do sljedećeg intervala povjerenja za:

koji se, koristeći notaciju (30), može prepisati kao

Interval pouzdanosti za srednju vrijednost s nepoznatom varijansom

Kao iu prethodnom paragrafu, pretpostavlja se da su oba parametra nepoznata, dok su parametar smetnji. Prema Fišerovoj teoremi

I

su nezavisne i imaju raspodjelu u-distribucije sa stupnjevima slobode, respektivno. Dakle, omjer

ima Studentovu distribuciju sa stepenom slobode. Odaberimo funkciju jednako desnoj strani (48):

gdje je varijansa uzorka definirana formulom (30). Funkcija ne ovisi eksplicitno o interferirajućem parametru. Označavajući kvantil Studentove distribucije sa stepenom slobode, dobijamo da je nejednakost

urađeno sa vjerovatnoćom. Odavde dobijamo interval pouzdanosti za:

Kako je Studentova raspodjela simetrična, prema prijedlogu 3.3

Stoga se interval pouzdanosti može zapisati kao

Dakle, srednja vrijednost uzorka je sredina ovog intervala.

Primjer 8.2

Pogledajmo primjer 6.4. Pretpostavimo iz kojeg je uzet svaki od uzoraka normalno distribucija sa nepoznato parametri --i, respektivno. (O osnovu na kojoj se ova pretpostavka može napraviti kasnije u 9.5.)

Naš cilj je pronaći intervale povjerenja za teoretski sadržaj ugljika i vlačnu čvrstoću GS50 čelika. Podsjetimo da je volumen svakog od uzoraka. Hajde da popravimo nivo samopouzdanja, blizu jedinstva, recimo. Prema Studentovoj tabeli raspodjele na str., otprilike to utvrđujemo. Prisjećajući se vrijednosti pronađenih u primjeru 6.5 na str., izračunavamo

i, koristeći formulu (49), dobijamo -interval pouzdanosti za procenat sadržaj ugljenika

i - interval povjerenja za vrijednost zatezna čvrstoća

Laboratorijski rad №12. Osnove teorije evaluacije

Statističar se bavi podacima podložnim slučajnim varijacijama. Njihovo ponašanje karakteriše određeni zakon raspodjele vjerovatnoće. Takav zakon, po pravilu, sadrži nepoznate veličine, koje se smatraju parametrima zakona. Zbog slučajne varijabilnosti posmatranih podataka, nemoguće je na osnovu njih naznačiti potpuno tačnu vrijednost parametara. Moramo se zadovoljiti samo približnim vrijednostima. Dakle, matematički statističar radi sa sljedećim veličinama: - slučajna varijabla koju nikada ne opaža, ali koju smatra "dušom" podataka koje proučava, razlogom koji je doveo do njih. Ovu vrijednost određuju neki parametri; - proučavani podaci, koji se dobijaju kao realizacija slučajne varijable. Na primjer, slučajna varijabla je tačno vrijeme. Njegove implementacije su očitanja sata dostupna za statistiku. Zadatak statističara je da postavi vrijeme što je moguće preciznije koristeći očitanja n satova t 1 ,...,t n . Pored toga, on je dužan da okarakteriše tačnost zadate vrednosti. Procjenjuje željenu vrijednost u obliku t = t 0 + ξ(a,σ), gdje je t 0 pravo vrijeme u vrijeme istraživanja, ξ(a,σ) - slučajna vrijednost karakterišući odstupanje od prave vrednosti, t 0 , a, σ - parametara, vrednost ξ karakteriše zakon raspodele, verovatnoće da ona poprima različite vrednosti. Procjena u statistici je pravilo za izračunavanje približne vrijednosti parametra na osnovu posmatranih podataka. Procjena je približna vrijednost parametra koji se nalazi iz posmatranih podataka. Prilikom izrade procjena za praktičnu upotrebu, postoje tri glavna zahtjeva za procjene:

    tačnost, odnosno blizina pravoj vrednosti parametra, u primeru ξ(a,σ) treba da bude mala;

    nepristrasnost, odnosno zahtev da očekivanje procene bude jednako pravoj vrednosti parametra, u primeru ξ(a,σ) u proseku treba da bude nula;

    konzistentnost, odnosno zahtjev da sa povećanjem broja opservacija, procjena vjerovatno konvergira pravoj vrijednosti parametra. U primjeru, za veliki broj sati n, vrijednost ξ(a,σ) mora težiti nuli sa vjerovatnoćom koja teži jedan.

Ne postoje najbolje procjene u svim aspektima. Na primjer, aritmetička sredina, široko prihvaćena procjena srednje vrijednosti slučajne varijable, ima svojstvo optimalnosti za normalno raspoređene podatke. Međutim, dolazi do grešaka ako među podacima ima odstupanja, odnosno odstupanja. Takve emisije u privredi generišu se grubim greškama u merenjima ili greškama u kucanju, u kojima tačka između rublje i kopejki može nestati, a plate porastu sto puta. Razmotrimo slučajni proces povezan s istorijom iscrtavanja na karti Velike Britanije preciznih granica njenih posjeda rasutih po cijelom svijetu. Poznato je da bilo koju tačku na Zemlji karakteriziraju dvije koordinate - geografska širina i dužina. Danas je svaki školarac čuo za satelitske instrumente koji postavljaju bilo koju tačku na Zemlji s tačnošću do metra. Međutim, u to vrijeme čak ni takav instrument ne bi pomogao mornarima, jer ne bi pronašao niti jedan "referentni" satelit na nebu. Geografska širina je određena direktno iz visine svjetiljki iznad horizonta pomoću uređaja "sextan", sličnog modernom teodoliti (spiglas plus mjerač kuta). Geografska dužina je ugao rotacije globusa, pod kojim se kombinuju lokalni meridijan i Griniški meridijan izabran kao uslovna nula. Zemlja se okrene za 360° za skoro jedan dan, odnosno za 15° se okrene za sat, a 1° za 4 minuta. Da biste odredili geografsku dužinu, morate tačno znati lokalno i Greenwich vrijeme. Ako navigator kaže kapetanu: "Lokalno podne, gospodine", a kapetan zna vrijeme u tom trenutku u Greenwichu, tada vremenska razlika, podijeljena sa 4 minute, određuje geografsku dužinu područja u stepenima. Danas bi sve bilo jednostavno - nazovite Greenwich i saznajte koliko je sati. Ali tada radio još nije bio izmišljen. Kada bi brod imao kvarcni sat koji radi djelić minute godišnje, ni to ne bi bilo problema, ali najbolji kronometri koji su tada postojali nisu davali potrebnu tačnost za mjerenje geografske dužine. Za nekoliko mjeseci plovidbe, točno vrijeme su ostavili za desetine minuta. A kada je 1831. godine brod "Bigl" krenuo na put oko sveta da bi napravio karte, kapetan broda, Fitz Roy, prosvećeni čovek i naučnik, poneo je sa sobom 24 (!) marinska hronometra. Svaki hronometar je pokazivao svoje "greenvičko vrijeme". U ovoj studiji, slučajna varijabla je trenutak kada je navigator odredio tačno lokalno vrijeme koristeći neko nebesko tijelo. "Duša" izmjerene slučajne varijable je pravo vrijeme u Greenwichu u tom trenutku. Ovu veličinu označavamo sa ξ. Vrijednost ove količine nikada nije poznata. Uočene vrijednosti slučajne varijable su očitanja (različitih) hronometara. Svaki od njih je donekle bio u zabludi, ali općenito su slijedili zajedničku "dušu", namećući svoju slučajna greška. Procjena slučajne varijable je GMT koji je kapetan pretpostavio iz posmatranih podataka. Neka su slučajne varijable x i , i = 1,...,n, realizacije jedne slučajne varijable ξ, odnosno imaju istu distribuciju (jedna "duša"), a za bilo koje i prosječna vrijednost očitavanja je jednaka na isti broj: E( x i) = E(ξ). Značenje ove izjave je sljedeće: svi satovi ne mogu jednoglasno zaostajati ili žuriti zbog problema s dizajnom. U prosjeku, jednako je vjerovatno da žure ili zaostaju. Takođe, neka budu nezavisni. Drugim riječima, nemaju ništa zajedničko u grupama. Dakle, mornar koji bilježi očitanja sata mogao bi ih snimiti u jednom nizu. Tada bi posljednja očitanja bila snimljena minut kasnije od prvog. Ili bi mogli da vise na toplom mestu nekoliko sati i da žure zajedno sa grejanja. Pretpostavka da takav fenomen ne postoji odgovara uslovu nezavisnosti indikacija u različitim ispitivanjima. Najjednostavniji problem procjene je odrediti vjerovatnoću nekog događaja, na primjer, da će pravi (ne nužno ispravan) novčić pasti licem nadole. Gotovo nikada nije moguće direktno odrediti vjerovatnoću događaja. Ne postoji univerzalna metoda koja bi omogućila da proizvoljni događaj ukaže na njegovu vjerovatnoću. Moguće je procijeniti vjerovatnoću događaja A ako je moguće provesti nezavisne ponovljene testove tokom kojih se ovaj događaj javlja sa konstantnom vjerovatnoćom. Pretpostavimo da u svakom od n pokušaja vjerovatnoća p = P(A) događaja A ostaje nepromijenjena i da je rezultat svakog pokušaja nezavisan od ostalih. Označite sa m nasumični broj onih ispitivanja iz ukupan broj n u kojem se dogodio događaj A. Kaže se da je m broj "uspjeha" u n Bernulijevim suđenjima. Prema statističkoj definiciji vjerovatnoće, za veliki n, relativna frekvencija m / n događaja A približno je jednaka vjerovatnoći događaja pojave događaja A, odnosno m / n ~ p, gdje je p = P (A). Dokažimo da ovo slijedi iz Kolmogorovljeve aksiomatike. U matematičkoj analizi koristi se strogi koncept granice niza: za dovoljno veliki broj članova niza, njegova se vrijednost može proizvoljno približiti graničnoj vrijednosti. Ova definicija se ne uklapa pravi zivot gdje se rijetko dešavaju apsolutno nevjerovatni događaji. Na primjer, iz primordijalne haotične supe nastaje bakterija sposobna da se sama razmnožava. Ili riba stvara nešto što joj u početku nije potrebno milionima godina (ali se razvija), a onda postaje krilo. Ili je cijeli grad (ili država) poplavljen. U teoriji vjerovatnoće, pojam granice se tumači na drugačiji način od onog koji se u njega stavlja u matematičkoj analizi. Definicija teorije vjerovatnoće je bliža životu. To ne zabranjuje činjenicu da će u nekom trenutku u nizu biti broj koji se oštro razlikuje od ostalih. Niz slučajnih varijabli u n konvergira vjerovatnoćom u p ako je za bilo koji broj ε > 0 vjerovatnoća da je modul razlike |u n - p| kako n → ∞ manje od ε teži jedinici:

U teoriji vjerovatnoće nijedan događaj nije siguran, ali događaj: |u n - p| ≤ ε je gotovo sigurno za dovoljno veliko n. Dokažimo Čebiševljevu nejednakost. Neka je ξ slučajna varijabla sa matematičkim očekivanjem E(ξ) = a i varijansom D(ξ) = σ², ε je pozitivan broj. Tada se vjerovatnoća događaja sastoji u činjenici da centrirana (E (ξ) - a) i normalizirana slučajna varijabla prelazi ε manje od ε -2:

Zaista, σ² = E(ξ - a)². Prilikom izračunavanja prosjeka na desnoj strani, biramo dva raspona vrijednosti ξ. Za one ξ za koje |ξ - a|< εσ, сумма (или интеграл) соответствующих произведений неотрицателен. Для тех ξ, у которых |ξ - а| >εσ, zbir (ili integral):

Zanimljiv poseban slučaj: σ = 0. Štaviše, jasno je da je |ξ - a| = 0, odnosno ξ = a. Dokažimo Čebiševljevu teoremu. Neka su h 1 ,...,h n nezavisne identično raspoređene slučajne varijable koje imaju matematičko očekivanje i varijansu. To jest, svaki x i je realizacija slučajne varijable ξ, a E(ξ) = E(x i) = a, D(ξ) = D(x i) = σ². Tada za bilo koje ε > 0:

Dokaz. Aritmetička srednja disperzija:

Razmotrimo slučajnu varijablu η n , koja je aritmetička sredina n opservacija. Njegova srednja vrijednost i varijansa . Uočene realizacije η n su . U skladu sa Čebiševljevom nejednakošću za slučajnu varijablu η n , vjerovatnoća njenog odstupanja od srednje vrijednosti za iznos veći od teži nuli:

Vjerovatnoća suprotnog događaja teži 1 za veliko n: P(|η n - a|) → 1. Dakle, niz slučajnih varijabli n konvergira vjerovatnoćom u a. Vratimo se na mjerenje vremena na Beagleu. Očitavanje svakog hronometra x i , i = 1,...,n je mjerenje nezavisno od drugih instrumenata. Podrazumijeva se da je dizajn hronometra takav da nema sistematske greške u njegovom radu. To znači da neki primjerci kronometara mogu "ići naprijed", drugi "zaostajati", ali su te greške slučajne, povezane s proizvodnjom ovog uzorka. Matematički, to znači da je prosječno vrijeme tačno. Kvalitetu dizajna i tehnologije izrade hronometara karakterizira koliko je ujednačena točnost kretanja svih proizvoda u cjelini. Matematički se to izražava širenjem očitavanja pojedinih instrumenata, tj. disperzija slučajnih varijabli x i . Varijanca prosjeka je n = 24 puta manja od varijanse pojedinačnog hronometra. Stoga je "srednje vrijeme" određeno sa 24 hronometra u prosjeku bliže pravom vremenu skoro 5 puta od vremena bilo kojeg pojedinačnog hronometra.

možeš koristiti ovaj obrazac potražite pravi zadatak. Unesite riječ, frazu iz zadatka ili njegov broj ako ga znate.


Pretražujte samo u ovoj sekciji


Intervali pouzdanosti: Lista rješenja problema

Intervali povjerenja: teorija i problemi

Razumijevanje intervala povjerenja

Hajde da ukratko predstavimo koncept intervala poverenja, koji
1) procjenjuje neki parametar numeričkog uzorka direktno iz podataka samog uzorka,
2) pokriva vrijednost ovog parametra sa vjerovatnoćom γ.

Interval povjerenja za parametar X(sa vjerovatnoćom γ) naziva se interval oblika , takav da , a vrijednosti se na neki način izračunavaju iz uzorka.

Obično se u primijenjenim problemima vjerovatnoća pouzdanosti uzima jednakom γ = 0,9; 0,95; 0,99.

Razmotrimo neki uzorak veličine n, napravljen od stanovništva, raspoređene po svoj prilici prema normalnom zakonu distribucije . Hajde da pokažemo po kojim formulama se nalaze intervali povjerenja za parametre distribucije - matematičko očekivanje i disperzija (standardna devijacija).

Interval pouzdanosti za matematička očekivanja

Slučaj 1 Varijanca distribucije je poznata i jednaka je . Zatim interval pouzdanosti za parametar a izgleda kao:
t se određuje iz Laplaceove tabele raspodjele omjerom

Slučaj 2 Varijanca distribucije je nepoznata; tačkasta procjena varijanse je izračunata iz uzorka. Zatim interval pouzdanosti za parametar a izgleda kao:
, gdje je srednja vrijednost uzorka izračunata iz uzorka, parametar t utvrđeno iz Studentove tabele raspodjele

Primjer. Na osnovu podataka 7 mjerenja određene količine, utvrdili smo prosječni rezultati mjerenja jednaka 30 i varijanse uzorka jednaka 36. Odrediti granice u kojima je sadržana prava vrijednost mjerene veličine sa pouzdanošću od 0,99.

Rješenje. Hajde da nađemo . Tada se granice pouzdanosti za interval koji sadrži pravu vrijednost izmjerene vrijednosti mogu pronaći po formuli:
, gdje je srednja vrijednost uzorka, je varijansa uzorka. Ubacivanjem svih vrijednosti dobijamo:

Interval pouzdanosti za varijansu

Vjerujemo da je, općenito govoreći, matematičko očekivanje nepoznato, a poznata je samo točkasta nepristrasna procjena varijanse. Tada interval pouzdanosti izgleda ovako:
, Gdje - kvantile distribucije određene iz tabela.

Primjer. Na osnovu podataka 7 ispitivanja pronađena je vrijednost procjene standardne devijacije s=12. Odrediti sa vjerovatnoćom od 0,9 širinu intervala pouzdanosti izgrađenog za procjenu varijanse.

Rješenje. Interval povjerenja za nepoznatu varijansu populacije može se naći po formuli:

Zamijenite i dobijete:


Tada je širina intervala povjerenja 465,589-71,708=393,881.

Interval pouzdanosti za vjerovatnoću (postotak)

Slučaj 1 Neka su veličina uzorka i frakcija uzorka (relativna frekvencija) poznati u zadatku. Tada je interval povjerenja za opći razlomak (prava vjerovatnoća):
, gdje je parametar t se određuje iz Laplaceove tablice raspodjele omjerom .

Slučaj 2 Ako problem dodatno poznaje ukupnu veličinu populacije iz koje je uzorak uzet, interval povjerenja za opći dio (prava vjerovatnoća) može se pronaći pomoću prilagođene formule:
.

Primjer. Poznato je da se sa vjerovatnoćom Nađite granice u kojima se zaključuje opći udio.

Rješenje. Koristimo formulu:

Nađimo parametar iz uslova , dobijamo zamjenu u formuli:


Na stranici možete pronaći i druge primjere problema iz matematičke statistike

Da biste pronašli granice intervala povjerenja za srednju vrijednost populacije, morate učiniti sljedeće:

1) prema primljenom zapreminskom uzorku n izračunati aritmetičku sredinu i standardnu ​​grešku aritmetičke sredine prema formuli:

;

2) postaviti vjerovatnoću pouzdanosti 1 - α na osnovu svrhe studije;

3) prema tabeli t-Učenikove distribucije (Prilog 4) pronalaze graničnu vrijednost t α zavisno od nivoa značaja α i broj stepena slobode k = n – 1;

4) pronaći granice intervala povjerenja po formuli:

.

Bilješka: U praksi naučno istraživanje, kada je zakon distribucije male populacije uzorka (n < 30) неизвестен или отличен от нормального, пользуются вышеприведенной формулой для približnoprocjene intervala povjerenja.

Interval povjerenja na n≥ 30 se nalazi po sljedećoj formuli:

,

Gdje u - procentni poeni normalizovanog normalna distribucija, koji se nalaze u tabeli 5.1.

8. Redoslijed rada u V fazi

1. Provjerite normalnost distribucije malih (n< 30) выборку, составленную из разностей парных значений результатов измерений исходного показателя скоростных качеств у «спортсменов» (эти результаты обозначены индексом В) и показателя, достигнутого после двухмесячных тренировок (эти результаты обозначены индексом Г).

2. Odabrati kriterijum i proceniti efikasnost metode treninga koja se koristi za ubrzanje razvoja brzinskih kvaliteta kod "sportista".

Izvještaj o radu u petoj fazi igre (uzorak)

Predmet: Evaluacija efektivnosti metodologije obuke.

Ciljevi:

    Upoznajte se sa karakteristikama normalnog zakona distribucije rezultata testa.

    Steknite vještine testiranja distribucije uzorka na normalnost.

    Steći vještine za procjenu efikasnosti metoda obuke.

    Naučite kako izračunati i izgraditi intervale povjerenja za opće aritmetičke sredine malih uzoraka.

pitanja:

    Suština metode za vrednovanje efektivnosti metodologije obuke.

    Zakon normalne distribucije. Suština, značenje.

    Osnovna svojstva krive normalne distribucije.

    Pravilo tri sigma i njegova praktična primjena.

    Procjena normalnosti distribucije malog uzorka.

    Koji se kriteriji i u kojim slučajevima koriste za poređenje srednjih vrijednosti uzoraka zavisnih od parova?

    Šta karakteriše interval poverenja? Metoda za njegovo određivanje.

Opcija 1: parametarski kriterij

Bilješka: Kao primjer, uzmimo rezultate mjerenja brzinskih kvaliteta sportista prije početka treninga date u tabeli 5.2 (označeni su indeksom B, dobijeni su kao rezultat mjerenja naIfaza poslovne igre) i nakon dva mjeseca obuke (označeni su indeksom D).

Od uzoraka C i D, prijeđimo na uzorak sastavljen od razlika uparenih vrijednosti d i = N i G N i IN i odredi kvadrate ovih razlika. Podatke ćemo unijeti u obračunsku tabelu 5.2.

Tabela 5.2 - Izračunavanje kvadrata parnih razlika vrijednosti d i 2

N i IN, beat

N i G, beat

d i = N i GN i IN, beat

d i 2 , pobedio 2

Koristeći tabelu 5.2, nalazimo aritmetičku sredinu uparenih razlika:

otkucaji

Zatim izračunavamo zbir kvadrata odstupanja d i od prema formuli:

Odredite varijansu za uzorak d i :

otkucaji 2

Izneli smo hipoteze:

– nula – H 0: da je opšti skup uparenih razlika d i ima normalnu distribuciju;

– konkurentno – H 1: da je distribucija populacije par razlika d i drugačije od normalnog.

Testiramo na nivou značaja = 0,05.

Da bismo to uradili, sastavit ćemo tabelu proračuna 5.3.

Tabela 5.3 – Podaci za proračun Shapiro i Wilk kriterij W obs za uzorak sastavljen od razlika uparenih vrijednosti d i

d i, beat

d n - k + 1 -d k = k

a nk

k ×a nk

17 – (–2) = 19

Redoslijed popunjavanja tabele 5.3:

    U prvom stupcu upisujemo brojeve redom.

    U drugom - razlike uparenih vrijednosti d i u neopadajućem redoslijedu.

    U trećem - brojevi po redu k razlike u paru. Pošto u našem slučaju n= 10, onda k mijenja se od 1 do n/2 = 5.

4. U četvrtom - razlike k, koje nalazimo na ovaj način:

- od samog od velikog značaja d 10 oduzmi najmanji d 1 k = 1,

- od d 9 oduzimati d 2 i upišite rezultirajuću vrijednost u red za k= 2 itd.

    U petom - zapisujemo vrijednosti koeficijenata a nk, preuzeto iz tabele koja se koristi u statistici za izračunavanje Shapiro i Wilk testa ( W) provjera normalnosti distribucije (Prilog 2) za n= 10.

    U šestom - rad k × a nk i pronađite zbir ovih proizvoda:

.

Uočena vrijednost kriterija W obs pronađi po formuli:

.

Provjerimo ispravnost proračuna Shapiro i Wilk kriterija ( W obs) njegovim izračunavanjem na računaru pomoću programa "Statistika".

Izračun Shapiro i Wilk kriterija ( W obs) na računaru omogućilo je da se utvrdi da:

.

Nadalje, prema tabeli kritičnih vrijednosti Shapiro i Wilk kriterija (Dodatak 3), tražimo W Crete Za n= 10. Nalazimo to W Crete= 0,842. Uporedite količine W Crete I W obs .

Doing zaključak: jer W obs (0,874) > W Crete(0,842), mora se prihvatiti nulta hipoteza normalne distribucije populacije d i. Stoga, za procjenu efikasnosti primijenjene metodologije za razvoj brzinskih kvaliteta, treba koristiti parametarski t-Učenički kriterijum.

U statistici postoje dvije vrste procjena: tačka i interval. Point Estimation je statistika jednog uzorka koja se koristi za procjenu parametra populacije. Na primjer, srednja vrijednost uzorka je tačkasta procjena srednje vrijednosti populacije i varijanse uzorka S2- bodovna procjena varijanse populacije σ2. pokazalo se da je srednja vrijednost uzorka nepristrasna procjena očekivanja populacije. Srednja vrijednost uzorka naziva se nepristrasna jer je srednja vrijednost svih srednjih vrijednosti uzorka (sa istom veličinom uzorka n) jednak je matematičkom očekivanju opće populacije.

U cilju varijanse uzorka S2 postao nepristrasan procjenitelj varijanse stanovništva σ2, nazivnik varijanse uzorka treba postaviti jednakim n – 1 , ali ne n. Drugim riječima, varijansa populacije je prosjek svih mogućih varijansi uzorka.

Prilikom procjene parametara populacije, treba imati na umu da statistika uzorka kao npr , ovise o konkretnim uzorcima. Uzeti ovu činjenicu u obzir, dobiti intervalna procjena matematička očekivanja opće populacije analiziraju distribuciju srednjih vrijednosti uzorka (za više detalja vidjeti). Konstruisani interval karakteriše određeni nivo pouzdanosti, a to je verovatnoća da je pravi parametar opšte populacije tačno procenjen. Slični intervali pouzdanosti mogu se koristiti za procjenu udjela neke karakteristike R i glavna rasprostranjena masa opšte populacije.

Preuzmite bilješku u formatu ili, primjere u formatu

Izgradnja intervala povjerenja za matematičko očekivanje opće populacije s poznatom standardnom devijacijom

Izgradnja intervala povjerenja za udio osobine u općoj populaciji

U ovom odeljku, koncept intervala poverenja je proširen na kategoričke podatke. Ovo vam omogućava da procijenite udio ove osobine u općoj populaciji R sa udjelom uzorka RS= X/n. Kao što je spomenuto, ako vrijednosti nR I n(1 - p) premašiti broj 5, binomna distribucija može se aproksimirati kao normalno. Stoga, procijeniti udio neke osobine u opštoj populaciji R moguće je konstruisati interval čiji je nivo pouzdanosti jednak (1 - α)x100%.


Gdje strS- udio uzorka obilježja, jednak X/n, tj. broj uspjeha podijeljen s veličinom uzorka, R- udio osobine u opštoj populaciji, Z je kritična vrijednost standardizirane normalne distribucije, n- veličina uzorka.

Primjer 3 Pretpostavimo da je uzorak izvučen iz informacionog sistema, koji se sastoji od 100 faktura popunjenih unutar prošli mjesec. Recimo da je 10 od ovih faktura netačno. dakle, R= 10/100 = 0,1. Nivo pouzdanosti od 95% odgovara kritičnoj vrijednosti Z = 1,96.

Dakle, postoji 95% šanse da između 4,12% i 15,88% faktura sadrži greške.

Za datu veličinu uzorka, čini se da je interval pouzdanosti koji sadrži udio osobine u općoj populaciji širi nego za kontinuiranu slučajnu varijablu. To je zato što mjerenja kontinuirane slučajne varijable sadrže više informacija nego mjerenja kategoričkih podataka. Drugim riječima, kategorički podaci koji uzimaju samo dvije vrijednosti ne sadrže dovoljno informacija za procjenu parametara njihove distribucije.

INizračunavanje procjena izvučenih iz konačne populacije

Procjena matematičkog očekivanja. Korekcioni faktor za konačnu populaciju ( fpc) je korišten za smanjenje standardna greška na vrijeme. Prilikom izračunavanja intervala pouzdanosti za procjene parametara populacije, faktor korekcije se primjenjuje u situacijama kada se uzorci uzimaju bez zamjene. Dakle, interval pouzdanosti za matematičko očekivanje, koji ima nivo pouzdanosti jednak (1 - α)x100%, izračunava se po formuli:

Primjer 4 Da bismo ilustrovali primenu faktora korekcije za konačnu populaciju, vratimo se problemu izračunavanja intervala poverenja za prosečni iznos faktura o kome se govori u primeru 3. Pretpostavimo da preduzeće izdaje 5.000 faktura mesečno, i =110,27 USD, S= 28,95 dolara N = 5000, n = 100, α = 0,05, t99 = 1,9842. Prema formuli (6) dobijamo:

Procjena udjela karakteristike. Prilikom odabira bez povrata, interval pouzdanosti za udio obilježja koji ima nivo pouzdanosti jednak (1 - α)x100%, izračunava se po formuli:

Intervali povjerenja i etička pitanja

Prilikom uzorkovanja populacije i formulisanja statističkih zaključaka, često se javljaju etički problemi. Glavni je način na koji se slažu intervali povjerenja i procjene tačaka statistike uzorka. Publikacija bodovne procjene ne specificiranje odgovarajućih intervala pouzdanosti (obično onih sa nivoom pouzdanosti od 95%) i veličine uzorka iz kojeg su izvedeni mogu dovesti u zabludu. Ovo može dati korisniku utisak da je bodovna procjena upravo ono što mu je potrebno da predvidi svojstva cjelokupne populacije. Stoga je potrebno shvatiti da u svakom istraživanju u prvi plan treba staviti ne tačke, već intervalne procjene. osim toga, Posebna pažnja treba dati pravi izbor veličine uzoraka.

Predmet statističkih manipulacija najčešće su rezultati socioloških istraživanja stanovništva o različitim političkim temama. Istovremeno, rezultati ankete se stavljaju na naslovne strane novina, a greška uzorka i metodologija statističke analize štampaju se negde na sredini. Da bi se dokazala validnost dobijenih tačaka, potrebno je navesti veličinu uzorka na osnovu koje su dobijene, granice intervala poverenja i nivo njegove značajnosti.

Sledeća napomena

Korišteni su materijali iz knjige Levin i dr. Statistika za menadžere. - M.: Williams, 2004. - str. 448–462

Centralna granična teorema navodi da, s obzirom na dovoljno veliku veličinu uzorka, distribucija uzorka srednjih vrijednosti može se aproksimirati normalnom distribucijom. Ovo svojstvo ne zavisi od vrste distribucije stanovništva.

Neka je slučajna varijabla raspoređena prema normalnom zakonu, za koju je varijansa D nepoznata. Napravljen je uzorak zapremine n. Iz ovoga se određuje ispravljena varijansa uzorka s 2. Slučajna vrijednost

raspoređeno prema zakonu 2 sa n -1 stepena slobode. S obzirom na datu pouzdanost, može se pronaći bilo koji broj granica 1 2 i 2 2 intervala tako da

Pronađite 1 2 i 2 2 iz sljedećih uslova:

P(2 1 2) = (1 -)/ 2(**)

P(2 2 2) = (1 -)/ 2(***)

Očigledno, ako su posljednja dva uslova zadovoljena, jednakost (*) je tačna.

U tabelama za slučajnu varijablu 2 obično se daje rješenje jednačine

Iz takve tablice, s obzirom na vrijednost q i broj stupnjeva slobode n - 1, možete odrediti vrijednost q 2 . Dakle, vrijednost 2 2 u formuli (***) je odmah pronađena.

Da bismo odredili 1 2, transformiramo (**):

P(2 1 2) = 1 - (1 -)/ 2 = (1 +)/ 2

Rezultirajuća jednakost nam omogućava da odredimo vrijednost 1 2 iz tabele.

Sada kada smo pronašli vrijednosti 1 2 i 2 2, predstavljamo jednakost (*) kao

Posljednju jednakost prepisujemo u takvom obliku da se odrede granice intervala povjerenja za nepoznatu veličinu D:

Odavde je lako dobiti formulu po kojoj se nalazi interval pouzdanosti za standardnu ​​devijaciju:

Zadatak. Pretpostavljamo da je buka u kokpitima helikoptera istog tipa sa motorima koji rade u određenom režimu slučajna varijabla raspoređena po normalnom zakonu. Nasumično je odabrano 20 helikoptera i mjeren je nivo buke (u decibelima) u svakom od njih. Utvrđeno je da je korigirana varijansa uzorka mjerenja 22,5. Pronađite interval pouzdanosti koji pokriva nepoznato standardna devijacija nivo buke u kokpitima helikoptera ovog tipa sa pouzdanošću od 98%.

Rješenje. Prema broju stepena slobode jednakom 19, a prema vjerovatnoći (1 - 0,98) / 2 = 0,01, iz tabele distribucije 2 nalazimo vrijednost 2 2 = 36,2. Slično, sa vjerovatnoćom (1 + 0,98)/2 = 0,99, dobijamo 1 2 = 7,63. Koristeći formulu (****), dobijamo traženi interval pouzdanosti: (3.44; 7.49).



greška: Sadržaj je zaštićen!!