Odaberite Stranica

Opća populacija i metoda uzorkovanja. Formule prosječne greške uzorkovanja

Selektivno posmatranje

Koncept posmatranja uzorka

Metoda uzorkovanja se koristi kada je korištenje kontinuiranog promatranja fizički nemoguće zbog ogromne količine podataka ili nije ekonomski izvodljivo. Fizička nemogućnost se javlja, na primjer, kada se proučavaju putnički tokovi, tržišne cijene i porodični budžeti. Ekonomska nesvrsishodnost javlja se pri ocjenjivanju kvaliteta robe koja je povezana s njihovim uništenjem. Na primjer, degustacija, testiranje cigle na čvrstoću, itd. Opservacija uzorka se također koristi za provjeru rezultata kontinuiranog posmatranja.

Statističke jedinice odabrane za posmatranje su selektivno totalitet ili uzorak, i ceo niz - general totalitet (GS). U ovom slučaju, broj jedinica u uzorku se označava sa p, u cijelom HS-u - N. Stav n/N naziva se relativna veličina ili uzorak udjela.

Kvalitet rezultata posmatranja uzorka zavisi od reprezentativnost uzorci, tj. o tome koliko je reprezentativan u GC-u. Da bi se osigurala reprezentativnost uzorka, potrebno je poštovati princip slučajnog odabira jedinica, koji pretpostavlja da na uključivanje HS jedinice u uzorak ne može uticati nijedan drugi faktor osim slučajnosti.

Metode uzorkovanja

1. Zapravo nasumično odabir: sve GS jedinice su numerisane, a brojevi izvučeni kao rezultat izvlačenja odgovaraju jedinicama uključenim u uzorak, a broj brojeva je jednak planiranoj veličini uzorka. U praksi se umjesto izvlačenja žrijeba koriste generatori slučajnih brojeva. Ova metoda izbor može biti ponovljeno(kada se svaka jedinica odabrana za uzorak vrati u HS nakon posmatranja i može biti ponovo ispitana) i neponovljiv(kada se ispitane jedinice ne vraćaju u HS i ne mogu se ponovo ispitivati). Pri ponovljenom odabiru, vjerovatnoća ulaska u uzorak za svaku jedinicu GS ostaje nepromijenjena, a ponovljenim odabirom se mijenja (povećava), ali za nekoliko jedinica koje preostaju u GS nakon odabira iz njega, vjerovatnoća ulaska u GS uzorak je isti.



2. Mehanički selekcija: jedinice populacije se biraju sa konstantnim korakom N/a. Dakle, ako opća populacija sadrži 100 tisuća jedinica, a trebate odabrati 1 tisuću jedinica, tada će svaka stota jedinica biti uključena u uzorak.

3. Stratificirana(stratifikovana) selekcija se vrši iz heterogene opšte populacije, kada se ona prvo deli na homogene grupe, nakon čega se jedinice iz svake grupe biraju u populaciju uzorka nasumično ili mehanički srazmerno njihovom broju u opštoj populaciji.

4. Serial(klasterski) odabir: ne pojedinačne jedinice, već određene serije (gnijezda) se biraju nasumično ili mehanički, unutar kojih se vrši kontinuirano posmatranje.

Prosječna greška uzorkovanja

Nakon završenog odabira potrebnog broja jedinica u uzorku i evidentiranja proučavanih karakteristika ovih jedinica predviđenih programom posmatranja, prelazi se na proračun općih pokazatelja. To uključuje prosječnu vrijednost karakteristike koja se proučava i udio jedinica koje imaju bilo koju vrijednost za ovu karakteristiku. Međutim, ako GS napravi nekoliko uzoraka, nakon što je odredio njihove opće karakteristike, tada se može utvrditi da će njihove vrijednosti biti različite, osim toga, razlikovat će se od njihove stvarne vrijednosti u GS, ako se to utvrdi kontinuiranim promatranjem . Drugim riječima, generalizirajuće karakteristike izračunate iz podataka uzorka će se razlikovati od njihovih stvarnih vrijednosti u GS, pa uvodimo sljedeće simbole (Tablica 8).

Tabela 8. Legenda

Razlika između vrijednosti generalizirajućih karakteristika uzorka i opće populacije naziva se greška uzorkovanja, koji se deli na grešku registracija i greška reprezentativnost. Prvi nastaje zbog netačnih ili netačnih podataka zbog nerazumijevanja suštine pitanja, nepažnje matičara prilikom popunjavanja upitnika, obrazaca itd. Lako ga je otkriti i eliminirati. Drugi proizlazi iz nepoštovanja principa slučajnog odabira jedinica u uzorku. Teže ga je otkriti i eliminirati, mnogo je veći od prvog i stoga je njegovo mjerenje glavni zadatak selektivnog posmatranja.

Da bi se izmjerila greška uzorkovanja, njena prosječna greška se određuje korištenjem formule (39) za ponovljeno uzorkovanje i formule (40) za uzorkovanje koje se ne ponavlja:

= ;(39) = . (40)

Iz formula (39) i (40) jasno je da je prosječna greška manja za nerepetitivno uzorkovanje, što određuje njegovu širu upotrebu.

Po pravilu postoje određena neslaganja između indikatora populacije uzorka i željenih pokazatelja (parametara) opšte populacije, koji se nazivaju greške uzorkovanja. Opća greška uzorkovanja sastoji se od dvije vrste grešaka: greške registracije i greške reprezentativnosti.

Greške u registraciji karakteristične su za svako statističko posmatranje i njihova pojava može biti uzrokovana nepažnjom registratora, nepreciznošću proračuna, nesavršenošću mjernih instrumenata itd.

Greške u reprezentativnosti svojstvene su samo selektivnom promatranju i određene su samom njegovom prirodom, budući da bez obzira koliko pažljivo i ispravno se vrši odabir jedinica, prosječni i relativni pokazatelji populacije uzorka uvijek će se u određenoj mjeri razlikovati od odgovarajućih indikatora. opšte populacije.

Postoje sistematske i nasumične greške reprezentativnosti. Sistematske greške reprezentativnosti su netačnosti koje nastaju kao rezultat nepoštovanja uslova za odabir jedinica u populaciji uzorka, ne pružajući jednaku mogućnost da se svaka jedinica opšte populacije uključi u uzorak. Slučajne greške reprezentativnosti su greške koje nastaju zbog činjenice da populacija uzorka ne reproducira precizno karakteristike opće populacije (srednja vrijednost, proporcija, varijansa, itd.) zbog nekontinuirane prirode istraživanja.

Ako se poštuje princip slučajnog uzorkovanja, veličina greške uzorkovanja prvenstveno zavisi od veličine uzorka. Što je veća veličina uzorka, pod uslovom da su sve ostale jednake, to je manja greška uzorkovanja. S velikom veličinom uzorka jasnije se očituje djelovanje zakona velikih brojeva, prema kojem: s vjerovatnoćom proizvoljno bliskom jedinici, može se tvrditi da uz dovoljno veliku veličinu uzorka i ograničenu disperziju karakteristike uzorka ( prosječni udio) će se koliko god želite razlikovati od odgovarajućih općih karakteristika.

Veličina greške uzorkovanja je takođe direktno povezana sa stepenom varijacije karakteristike koja se proučava, a stepen varijacije, kao što je gore navedeno, u statistici se karakteriše veličinom disperzije (disperzije): što je manja disperzija, što je manja greška uzorkovanja, to su statistički zaključci pouzdaniji. Stoga se u praksi varijansa identificira sa greškom uzorkovanja.

Pošto je parametar populacije željena vrijednost i nije poznat, potrebno je fokusirati se ne na određenu grešku, već na prosjek svih mogućih uzoraka.

Ako se iz opće populacije odabere nekoliko populacija uzoraka, tada će dati svaki od rezultirajućih uzoraka drugačije značenje specifična greška.

Srednja kvadratna vrijednost /I izračunato iz svih mogućih vrijednosti specifičnih grešaka (;) bit će:

gdje su * i prosjeci uzorka; x - opšti prosjek;)] - broj uzoraka po vrijednosti ê1 = ~si - x.

Standardna devijacija srednje vrijednosti uzorka od opće srednje vrijednosti naziva se srednja greška uzorkovanja.

Ovisnost veličine greške uzorkovanja od njene veličine i od stepena varijacije karakteristike izražena je formulom prosečna greška uzorci/i.

Kvadratna srednja greška (varijansa srednje vrijednosti uzorka) je direktno proporcionalna varijansi Stotinu i obrnuto je proporcionalna veličini uzorka n:

gdje je varijansa osobine u populaciji.

Otuda i prosečna greška u opšti pogled određena formulom:

Dakle, nakon što smo odredili standardnu ​​devijaciju za uzorak, možemo utvrditi vrijednost prosječne greške uzorkovanja, čija je vrijednost, kako slijedi iz formule, veća, što je veća varijacija slučajne varijable, a što je manja, to je veća. veća veličina uzorka.

Stoga, kako se veličina uzorka povećava, veličina prosječne greške se smanjuje. Ako je, na primjer, potrebno smanjiti prosječnu grešku uzorkovanja za polovicu, tada veličinu uzorka treba povećati četiri puta, ako je potrebno smanjiti grešku uzorkovanja za tri puta, tada veličinu uzorka treba povećati devet puta, itd.

U praktičnim proračunima koriste se dvije formule za prosječnu grešku uzorkovanja za srednju vrijednost i za proporciju.

U uzorku studije prosječnih pokazatelja, formula za prosječnu grešku je sljedeća:

Prilikom proučavanja relativnih pokazatelja (posebnih karakteristika), formula za prosječnu grešku ima oblik:

GdjeG - udio karakteristike u populaciji.

Primjena gornjih formula za prosječnu grešku pretpostavlja da su opća varijansa i opći udio poznati. Međutim, u stvarnosti ovi pokazatelji su nepoznati i ne mogu se izračunati zbog nedostatka podataka o opštoj populaciji. Stoga postoji potreba zamjene opće disperzije i općeg udjela drugim njima bliskim vrijednostima.

U matematičkoj statistici je dokazano da takve veličine mogu biti varijansa uzorka (st) i frakcija uzorka (co).

Uzimajući u obzir gore navedeno, formule prosječne greške mogu se napisati na sljedeći način:

Ove formule omogućavaju određivanje prosječne greške prilikom ponovnog uzorkovanja. Upotreba jednostavnog slučajnog ponovnog uzorkovanja u praksi je ograničena. Prije svega, nepraktično je, a ponekad i nemoguće preispitivati ​​iste jedinice. Upotreba ne-ponavljajućeg uzorkovanja umjesto ponovnog uzorkovanja također je diktirana zahtjevom za povećanjem stepena tačnosti i pouzdanosti uzorka. Stoga se u praksi češće koristi metoda nerepetitivnog slučajnog odabira. Prema ovoj metodi selekcije, jedinica populacije odabrana za uzorak ne učestvuje u daljoj selekciji. Jedinice se biraju iz populacije umanjene za broj prethodno odabranih jedinica. Stoga se u vezi sa promjenom veličine opće populacije nakon svake selekcije i vjerovatnoće odabira za jedinice koje preostaju, u formule za prosječnu grešku uzorkovanja uvodi faktor korekcije.

gdje je N veličina opće populacije; n- veličina uzorka. Kad dosta veliki značaj N se može zanemariti kao jedan u nazivniku. Onda

Prema tome, formule za prosječnu grešku uzorkovanja za nerepetitivno uzorkovanje za prosjek i za udio imaju oblik:

Pošto n je uvijek manji od M, tada je dodatni faktor uvijek manji od jedan. Posljedično, apsolutna vrijednost greške uzorkovanja tokom ne-ponavljajućeg uzorkovanja uvijek će biti manja nego tijekom ponovnog uzorkovanja.

Ako je veličina uzorka dovoljno velika, tada je vrijednost 1^ blizu jedinice i stoga se može zanemariti. Tada se prosječna greška slučajnog nerepetitivnog uzorkovanja određuje formulom pravilnog slučajnog ponovljenog uzorkovanja.

Za naš primjer, izračunajmo prosječnu grešku za prinos i udio parcela sa prinosom od 25 c/ha ili više.

Prosječna greška uzorkovanja

a) prosječan prinos ječma

Prosječan prinos ječma u populaciji x -G^= 25,1 ± 0,12 c/ha, odnosno kreće se od 24,98 do 25,22 c/ha.

Udio parcela sa prinosom od 25 c/ha ili više u opštoj populaciji str

T-^G = 0,80 ± 0,07, tj. kreće se od 73 do 87%.

Prosječna greška uzorkovanja pokazuje moguća odstupanja karakteristika populacije uzorka od karakteristika opće populacije. U isto vrijeme, prilikom provođenja promatranja uzorka, istraživači se često suočavaju sa zadatkom izračuna ne samo prosječne greške, već i utvrđivanja najveće moguće greške uzorkovanja. Znajući prosječnu grešku, možete odrediti granice izvan kojih greška uzorkovanja neće prijeći. Međutim, moguće je tvrditi da ova odstupanja neće premašiti datu vrijednost ne sa apsolutnom sigurnošću, već samo sa određenim stepenom vjerovatnoće. Nivo vjerovatnoće koji se prihvata prilikom određivanja mogućih granica koje sadrže vrijednosti parametara populacije naziva se nivo pouzdanosti vjerovatnoće.

Vjerovatnoća povjerenja- ovo je prilično velika vjerovatnoća, i takva da se praktično smatra da se provodi u svakom konkretnom slučaju, što garantuje dobijanje pouzdanih statističkih zaključaka. Označimo ga sa G a vjerovatnoća prekoračenja ovog nivoa je A. dakle,A =1 - R VjerovatnoćaA nazvan nivo značajnosti(supstancijalnost), koja karakteriše relativan broj pogrešnih zaključaka u ukupnom broju zaključaka i definiše se kao razlika između jedinstva i verovatne verovatnoće koja je prihvaćena.

Nivo povjerenja utvrđuje istraživač na osnovu stepena odgovornosti i prirode zadataka koji se rješavaju. U statističkim studijama ekonomije najčešće se usvaja nivo povjerenja G = 0,95; P = 0,99 (odnosno, nivo značajnosti A = 0,05; A = 0,01) rjeđe G = 0,999. na primjer, verovatnoća poverenja G = 0,99 znači da greška procjene u 99 slučajeva od 100 neće premašiti utvrđenu vrijednost i samo u jednom od 100 slučajeva može dostići izračunatu vrijednost ili je premašiti.

Poziva se greška uzorkovanja izračunata sa datim stepenom pouzdane vjerovatnoće marginalna greška uzorkovanja Er.

Razmotrimo kako se utvrđuje vrijednost moguće maksimalne greške uzorkovanja. Magnituda er je povezan sa normalizovanim odstupanjem i, koji je definisan kao omjer maksimalne greške uzorkovanja er na prosečnu grešku i:

Radi lakšeg izračunavanja, odstupanja slučajne varijable od njene srednje vrijednosti obično se izražavaju u jedinicama standardne devijacije. Izraz

pozvao normalizovano odstupanje. V U statističkoj literaturi I pozvao faktor povjerenja, ili umnožak prosječne greške uzorkovanja.

Dakle, normalizirano odstupanje srednje vrijednosti uzorka može se odrediti formulom:

i _ê_r_

Iz izraza 1 možete pronaći moguću maksimalnu grešku uzorkovanja

er = i/l.

Umjesto toga g. u svom značenju, predstavljamo formule za maksimalne greške uzorkovanja za prosjek i za proporciju u slučaju nerepetitivnog slučajnog odabira:

Prema tome, maksimalna greška uzorkovanja zavisi od vrijednosti prosječne greške i normaliziranog odstupanja i jednaka je ± višekratniku prosječne greške uzorkovanja.

Prosječna i maksimalna greška uzorkovanja su imenovane veličine i izražene su u istim jedinicama kao aritmetička sredina i standardna devijacija.

Normalizovano odstupanje je funkcionalno povezano sa verovatnoćom. Da pronađe vrednostiI sastavljene su posebne tabele (ext. 2) iz kojih možete pronaći vrijednostI za dati nivo vjerovatnoće povjerenja i vrijednost vjerovatnoće za poznati i.

Hajde da damo vrednosti I i njihove odgovarajuće vjerovatnoće za uzorke veličinep> 30, koji se najčešće koristi u praktičnim proračunima:

Stoga, kada i = 1, vjerovatnoća odstupanja karakteristika uzorka od općih za vrijednost pojedinačne prosječne greške uzorkovanja je 0,6827. To znači da će u prosjeku, od svakih 1000 uzoraka, 683 dati generalizirane karakteristike koje će se razlikovati od općih generaliziranih karakteristika samo za jednu prosječnu grešku. Kada je u = 2, vjerovatnoća je 0,9545. V To znači da od svakog 1000 uzoraka 954 će dati generalizirane karakteristike koje će se razlikovati od općih generaliziranih karakteristika za najviše dva puta prosječnu grešku uzorkovanja, itd.

Međutim, zbog činjenice da se, po pravilu, uzima samo jedan uzorak, kažemo da se, na primjer, s vjerovatnoćom od 0,9545 može garantirati da veličina granične greške neće premašiti dvostruku prosječnu grešku uzorkovanja .

Matematički je dokazano da omjer greške uzorkovanja i prosječne greške, po pravilu, ne prelazi± 3d za dovoljno veliki broj n, uprkos činjenici da greška uzorkovanja može poprimiti bilo koju vrijednost. Drugim riječima, možemo reći da uz dovoljno veliku vjerovatnoću prosuđivanja (P = 0,9973), maksimalna greška uzorkovanja, po pravilu, ne prelazi tri prosječne greške uzorkovanja. Stoga se vrijednost Ep = 3d može uzeti kao granica moguće greške uzorkovanja.

Za naš primjer, odredimo maksimalnu grešku uzorkovanja za prosječan prinos i udio parcela sa prinosom od 25 c/ha ili više. Uzećemo nivo pouzdanosti verovatnoće jednak P = 0,9545. V Prema tabeli (pril..2) naći vrijednosti i = 2. Prosječne greške uzorkovanja za prinos i udio parcela sa prinosom od 25 c/ha i više utvrđene su ranije i, shodno tome, bile su: Ts~= ±0,12 c/ha; MP = ± 0,07.

Granična greška prosječnog prinosa ječma:

Dakle, razlika između prosečnog prinosa uzorka i opšteg proseka neće biti veća od 0,24 c/ha. Granice prosječnog prinosa u opštoj populaciji: x = x ± je ~ = 25,1 + 0,24, odnosno od 24,86 do 25,34 c/ha.

Maksimalna greška udjela parcela sa prinosom od 25 c/ha ili više:

Shodno tome, maksimalna greška u određivanju udela parcela sa prinosom od 25 c/ha i više neće prelaziti 14%, tj. specifična težina parcele sa naznačenim prinosom u opštoj populaciji su unutar: G= a> ± ep = 0,80 ± 0,14, odnosno od 66 do 94%.

Na osnovu vrednosti karakteristika jedinica u populaciji uzorka registrovane u skladu sa programom statističkog posmatranja, izračunavaju se generalizovane karakteristike uzorka: srednja vrijednost uzorka() I uzorak udjela jedinice koje imaju bilo koju karakteristiku od interesa za istraživače, u ukupnom broju ( w).

Razlika između indikatora uzorka i opće populacije naziva se greška uzorkovanja.

Greške uzorkovanja, kao i greške u bilo kojoj drugoj vrsti statističkog posmatranja, dijele se na greške registracije i greške reprezentativnosti. Glavni cilj metode uzorkovanja je proučavanje i mjerenje slučajnih grešaka reprezentativnosti.

Srednja vrijednost uzorka i proporcija uzorka su slučajne varijable, što može potrajati različita značenja zavisno od toga koje su jedinice stanovništva bile uključene u uzorak. Stoga su i greške uzorkovanja su slučajne varijable i može poprimiti različita značenja. Stoga se utvrđuje prosjek mogućih grešaka.

Prosječna greška uzorkovanja (µ - mu) je jednako:

za prosjek ; za dionicu ,

Gdje r- udio određene karakteristike u opštoj populaciji.

U ovim formulama σ x 2 I r(1-r) su karakteristike opšte populacije koje su nepoznate tokom posmatranja uzorka. U praksi se zamjenjuju sličnim karakteristikama uzoračke populacije zasnovane na zakonu velikih brojeva, prema kojem populacija uzorka, uz dovoljno veliki volumen, prilično precizno reproducira karakteristike opće populacije. Metode za izračunavanje prosječnih grešaka uzorkovanja za prosjek i za proporciju za ponovljeno i neponavljajuće uzorkovanje date su u tabeli. 6.1.

Tabela 6.1.

Formule za izračunavanje prosječne greške uzorkovanja za srednju vrijednost i za udio

Vrijednost je uvijek manja od jedan, tako da je prosječna greška uzorkovanja kod uzorkovanja koja se ne ponavlja manja nego kod ponovljenog uzorkovanja. U slučajevima kada je udio uzorka neznatan, a množitelj blizu jedinice, korekcija se može zanemariti.

Da se tvrdi da je general prosječna vrijednost indikator ili opšti udeo neće ići dalje od prosečne greške uzorkovanja samo sa određenim stepenom verovatnoće. Stoga, za karakterizaciju greške uzorkovanja, pored prosječne greške, izračunajte marginalna greška uzorkovanja(Δ), što je povezano sa nivoom verovatnoće koji to garantuje.

Nivo vjerovatnoće ( R) određuje vrijednost normaliziranog odstupanja ( t), i obrnuto. Vrijednosti t date su u tabelama normalna distribucija vjerovatnoće. Najčešće korištene kombinacije t I R date su u tabeli. 6.2.


Tabela 6.2

Normalizirane vrijednosti odstupanja t na odgovarajućim vrijednostima nivoa vjerovatnoće R

t 1,0 1,5 2,0 2,5 3,0 3,5
R 0,683 0,866 0,954 0,988 0,997 0,999

t- faktor pouzdanosti, u zavisnosti od vjerovatnoće sa kojom se može garantovati da maksimalna greška neće premašiti t- višestruka prosječna greška. Pokazuje koliko prosječnih grešaka sadrži marginalna greška. Dakle, ako t= 1, onda se sa vjerovatnoćom od 0,683 može reći da razlika između uzorka i općih pokazatelja neće prelaziti jednu prosječnu grešku.

Formule za izračunavanje maksimalnih grešaka uzorkovanja date su u tabeli. 6.3.

Tabela 6.3.

Formule za izračunavanje maksimalne greške uzorkovanja za prosjek i za udio

Nakon izračunavanja maksimalnih grešaka uzorka, nalazimo intervali pouzdanosti za opšte indikatore. Vjerovatnoća koja je prihvaćena prilikom izračunavanja greške karakteristike uzorka naziva se pouzdanost. Nivo pouzdanosti od 0,95 znači da samo u 5 slučajeva od 100 greška može preći utvrđene granice; vjerovatnoće od 0,954 - u 46 slučajeva od 1000, i sa 0,999 - u 1 slučaju od 1000.

Za opći prosjek, najvjerovatnije granice u kojima će se nalaziti, uzimajući u obzir maksimalnu grešku reprezentativnosti, imat će oblik:

.

Najvjerovatnije granice unutar kojih će se generalni udio nalaziti će biti:

.

odavde, opšti prosek , generalni udio .

Dato u tabeli. 6.3. formule se koriste za određivanje grešaka uzorkovanja izvedenih čisto slučajnim i mehaničkim metodama.

Kod stratificiranog uzorkovanja, uzorak nužno uključuje predstavnike svih grupa i to obično u istim omjerima kao iu opštoj populaciji. Stoga, greška uzorkovanja u ovom slučaju zavisi uglavnom od prosjeka od varijanse unutar grupe. Na osnovu pravila za dodavanje varijansi, možemo zaključiti da će greška uzorkovanja za stratificirano uzorkovanje uvijek biti manja nego za samo nasumično uzorkovanje.

Kod serijske (klasterirane) selekcije mjera varijabilnosti će biti međugrupna disperzija.

Tokom selektivnog posmatranja, to se mora osigurati nezgoda izbor jedinica. Svaka jedinica mora imati jednake šanse da bude izabrana. To je ono na čemu se zasniva slučajni uzorak.

TO stvarni slučajni uzorak odnosi se na odabir jedinica iz cjelokupne populacije (bez prethodnog dijeljenja na bilo koju grupu) žrijebom (uglavnom) ili nekom drugom sličnom metodom, na primjer, korištenjem tablice slučajnih brojeva. Slučajni odabir- ovaj izbor nije slučajan. Princip slučajnosti pretpostavlja da na uključivanje ili isključivanje objekta iz uzorka ne može uticati bilo koji drugi faktor osim slučajnosti. Primjer zapravo nasumično dobitna izvlačenja mogu poslužiti kao izbor: od ukupnog broja izdatih listića, nasumično se bira određeni dio brojeva koji čine dobitke. Štaviše, svim brojevima je pružena jednaka mogućnost da budu uključeni u uzorak. U ovom slučaju, broj jedinica odabranih u populaciji uzorka obično se određuje na osnovu prihvaćenog udjela uzorka.

Udio uzorka je omjer broja jedinica u populaciji uzorka i broja jedinica u općoj populaciji:

Dakle, sa 5% uzorka iz serije delova od 1000 jedinica. veličina uzorka n iznosi 50 jedinica, a sa uzorkom od 10% - 100 jedinica. itd. Uz pravilnu naučnu organizaciju uzorkovanja, greške u reprezentativnosti mogu se svesti na minimalne vrijednosti, kao rezultat toga, posmatranje uzorka postaje prilično precizno.

Pravilna nasumična selekcija „u svom čistom obliku“ se retko koristi u praksi selektivnog posmatranja, ali je početna među svim drugim vrstama selekcije i sadrži i sprovodi osnovne principe selektivnog posmatranja.

Razmotrimo neka pitanja teorije metode uzorkovanja i formule greške za jednostavan slučajni uzorak.

Kada se u statistici koristi metoda uzorkovanja, obično se koriste dvije glavne vrste općih indikatora: prosječna vrijednost kvantitativne karakteristike I relativna vrijednost alternativne karakteristike(udio ili specifična težina jedinica u statističkoj populaciji koje se razlikuju od svih ostalih jedinica ove populacije samo po prisutnosti karakteristike koja se proučava).

Selektivno dijeljenje (w), ili učestalost, određena je omjerom broja jedinica koje posjeduju karakteristiku koja se proučava T, na ukupan broj jedinica u populaciji uzorka p:

Na primjer, ako od 100 detalja uzorka ( n=100), pokazalo se da je 95 dijelova standardno (T=95), zatim frakcija uzorka

w=95/100=0,95 .

Da bi se okarakterisala pouzdanost indikatora uzorka, postoje prosjek I maksimalna greška uzorkovanja.

Greška uzorkovanja ? ili, drugim riječima, greška reprezentativnosti je razlika između odgovarajućeg uzorka i općih karakteristika:

*

*

Greška uzorkovanja je karakteristična samo za opažanja uzorka. Što je veća vrijednost ove greške, to se indikatori uzorka više razlikuju od odgovarajućih općih indikatora.

Srednja vrijednost uzorka i udio uzorka su inherentni slučajne varijable koje mogu poprimiti različite vrijednosti u zavisnosti od toga koje su jedinice populacije uključene u uzorak. Stoga su greške uzorkovanja također slučajne varijable i mogu poprimiti različite vrijednosti. Stoga se utvrđuje prosjek mogućih grešaka – prosječna greška uzorkovanja.

Od čega zavisi? prosječna greška uzorkovanja? Ako se poštuje princip slučajnog odabira, prije svega se utvrđuje prosječna greška uzorkovanja veličina uzorka:Što je veći broj, pod uslovom da su sve ostale jednake, to je manja prosječna greška uzorkovanja. Pokrivajući sve veći broj jedinica opće populacije uzorkom, sve preciznije karakteriziramo cjelokupnu opštu populaciju.

Prosječna greška uzorkovanja također zavisi od stepen varijacije osobina koja se proučava. Stepen varijacije, kao što je poznato, karakteriše disperzija? 2 ili w(1-w)-- za alternativni znak. Što je manja varijacija karakteristike, a time i disperzije, manja je prosječna greška uzorkovanja, i obrnuto. Uz nultu disperziju (karakteristika se ne mijenja), prosječna greška uzorkovanja je nula, odnosno, bilo koja jedinica u općoj populaciji će precizno karakterizirati cijelu populaciju prema ovoj karakteristici.

Ovisnost prosječne greške uzorkovanja od njenog volumena i stepena varijacije atributa ogleda se u formulama koje se mogu koristiti za izračunavanje prosječne greške uzorkovanja u uslovima selektivnog posmatranja, kada su opšte karakteristike ( x,p) su nepoznati, pa se stoga ne čini mogućim pronaći stvarnu grešku uzorkovanja direktno koristeći formule (Form. 1), (Form. 2).

Sh Sa nasumičnim ponovnim uzorkovanjem prosečne greške teoretski izračunato korištenjem sljedećih formula:

* za prosječnu kvantitativnu karakteristiku

* za dionicu (alternativni atribut)

Budući da je praktično varijansa neke osobine u populaciji? 2 nije tačno poznato, u praksi koriste vrijednost disperzije S 2 izračunatu za populaciju uzorka na osnovu zakona velikih brojeva, prema kojem populacija uzorka, uz dovoljno veliku veličinu uzorka, prilično precizno reproducira karakteristike opšte populacije.

dakle, formule za izračunavanje prosjek greške uzorkovanja sa slučajnim ponovnim odabirom, sljedeće će biti:

* za prosječnu kvantitativnu karakteristiku

* za dionicu (alternativni atribut)

Međutim, disperzija populacije uzorka nije jednaka disperziji opće populacije, pa će stoga prosječne greške uzorkovanja izračunate korištenjem formula (Obrazac 5) i (Obrazac 6) biti približne. Ali u teoriji vjerovatnoće je dokazano da se opšta disperzija izražava kroz selektivnu disperziju sljedećom relacijom:

Jer p/(n-1) za dovoljno velike p -- kada je vrijednost blizu jedinice, onda možemo pretpostaviti da se, stoga, u praktičnim proračunima prosječnih grešaka uzorkovanja, mogu koristiti formule (Form. 5) i (Form. 6). I samo u slučajevima malog uzorka (kada veličina uzorka ne prelazi 30) potrebno je uzeti u obzir koeficijent n/(n-1) i izračunaj mala prosečna greška uzorka prema formuli:

W X Sa slučajnim odabirom koji se ne ponavlja U gornjim formulama za izračunavanje prosječnih grešaka uzorkovanja potrebno je radikalni izraz pomnožiti sa 1-(n/N), jer se u procesu nerepetitivnog uzorkovanja smanjuje broj jedinica u opštoj populaciji. Stoga, za uzorkovanje koji se ne ponavlja formule za izračunavanje prosječna greška uzorkovanja će poprimiti sljedeći oblik:

* za prosječnu kvantitativnu karakteristiku

* za dionicu (alternativni atribut)

. (obrazac. 10)

Jer n uvek manje N, zatim dodatni faktor 1-( n/N) uvijek će biti manji od jedan. Iz toga slijedi da će prosječna greška tokom nerepetitivnog odabira uvijek biti manja nego tokom ponovljenog odabira. Istovremeno, sa relativno malim procentom uzorka, ovaj množitelj je blizu jedinice (npr. kod uzorka od 5% iznosi 0,95; kod uzorka od 2% iznosi 0,98, itd.). Stoga se ponekad u praksi koriste formule (Obrazac 5) i (Obrazac 6) bez specificiranog množitelja za određivanje prosječne greške uzorkovanja, iako je uzorak organiziran kao neponavljajući. Ovo se dešava u slučajevima kada je broj jedinica u populaciji N nepoznat ili neograničen, ili kada n vrlo malo u poređenju sa N, a u suštini, uvođenje dodatnog množitelja, po vrijednosti bliskoj jedinici, neće imati praktički nikakav uticaj na vrijednost prosječne greške uzorkovanja.

Mehaničko uzorkovanje je da je odabir jedinica u populaciju uzorka iz opće populacije podijeljene prema neutralnom kriteriju na jednakim intervalima(grupe), provodi se na način da se iz svake takve grupe odabere samo jedna jedinica za uzorak. Da bi se izbjegla pristrasnost, treba odabrati jedinicu koja se nalazi u sredini svake grupe.

Prilikom organiziranja mehaničke selekcije, jedinice populacije se preliminarno raspoređuju (obično u listu) određenim redoslijedom (na primjer, po abecedi, lokaciji, uzlaznim ili silaznim redoslijedom vrijednosti nekog pokazatelja koji se ne odnosi na svojstvo proučavani, itd.), nakon čega se određeni broj jedinica bira mehanički, u određenom intervalu. U ovom slučaju, veličina intervala u populaciji jednaka je inverznoj vrijednosti proporcije uzorka. Dakle, kod uzorka od 2% bira se i provjerava svaka 50. jedinica (1:0,02), kod uzorka od 5% - svaka 20. jedinica (1:0,05), na primjer, konvergentni dio iz mašine.

Sa dovoljno velikom populacijom, mehanički odabir je blizu čisto slučajnog u smislu tačnosti rezultata. Stoga se za određivanje prosječne greške mehaničkog uzorkovanja koriste formule za pravilno nasumično neponavljajuće uzorkovanje (Obrazac 9), (Obrazac 10).

Za odabir jedinica iz heterogene populacije, tzv tipičan uzorak , koji se koristi u slučajevima kada se sve jedinice opšte populacije mogu podijeliti u nekoliko kvalitativno homogenih, sličnih grupa prema karakteristikama koje utiču na indikatore koji se proučavaju.

Prilikom anketiranja preduzeća, takve grupe mogu biti, na primjer, industrija i podindustrija, oblici vlasništva. Zatim se iz svake tipične grupe koristi čisto slučajni ili mehanički uzorak za individualno odabiranje jedinica u populaciju uzorka.

Tipičan uzorak se obično koristi kada se proučavaju složene statističke populacije. Na primjer, tokom uzorka istraživanja porodičnih budžeta radnika i zaposlenih u određenim sektorima privrede, produktivnost rada radnika preduzeća, predstavljena posebnim grupama po kvalifikacijama.

Tipičan uzorak daje preciznije rezultate u poređenju sa drugim metodama odabira jedinica u populaciji uzorka. Tipizacija opće populacije osigurava reprezentativnost takvog uzorka, zastupljenost svake tipološke grupe u njemu, što omogućava eliminaciju utjecaja međugrupna varijansa prosječnom greškom uzorkovanja.

Prilikom utvrđivanja prosječna greška tipičnog uzorka djeluje kao indikator varijacije prosjek varijansi unutar grupe.

Prosječna greška uzorkovanja pronađeno pomoću formula:

* za prosječnu kvantitativnu karakteristiku

(ponovna selekcija); (obrazac. 11)

(nepovratna selekcija); (obrazac. 12)

* za dionicu (alternativni atribut)

(ponovna selekcija); (forma.13)

(izbor koji se ne ponavlja), (obrazac 14)

gdje je prosjek varijansi unutar grupe za populaciju uzorka;

Prosjek varijansi unutar grupe proporcije (alternativnog atributa) za populaciju uzorka.

Serijsko uzorkovanje uključuje slučajni odabir iz opće populacije ne pojedinačnih jedinica, već njihovih jednakih grupa (gnijezda, serije) tako da se u takvim grupama mogu promatrati sve jedinice bez izuzetka.

Upotreba serijskog uzorkovanja je zbog činjenice da se mnoga roba za njihov transport, skladištenje i prodaju pakira u snopove, kutije itd. Stoga je pri praćenju kvaliteta upakovane robe racionalnije provjeriti nekoliko pakovanja (serija) nego od svih pakovanja odabrati potrebnu količinu proizvoda.

Budući da se unutar grupa (serija) ispituju sve jedinice bez izuzetka, prosječna greška uzorkovanja (pri odabiru jednakih serija) ovisi samo o međugrupnoj (međuserijskoj) disperziji.

Sh Prosječna greška uzorkovanja za prosječno kvantitativno svojstvo tokom serijske selekcije nalaze se pomoću formula:

(ponovna selekcija); (forma.15)

(izbor koji se ne ponavlja), (obrazac 16)

Gdje r- broj odabranih epizoda; R- ukupan broj epizoda.

Varijanca serijskog uzorka između grupa izračunava se na sljedeći način:

gdje je prosjek i- th serija; - ukupni prosjek za cijelu populaciju uzorka.

Sh Prosječna greška uzorkovanja za dionicu (alternativni atribut) u serijskoj selekciji:

(ponovna selekcija); (obrazac. 17)

(neponavljajući izbor). (obrazac. 18)

Intergroup(međuserija) varijansa udjela serijskog uzorka određena formulom:

, (obrazac. 19)

gdje je udio karakteristike u i-th serija; - ukupan udio karakteristike u cjelokupnoj populaciji uzorka.

U praksi statističkih istraživanja, pored prethodno razmatranih metoda selekcije, koristi se i njihova kombinacija (kombinovani izbor).

Nesklad između vrijednosti indikatora dobijenih iz uzorka i odgovarajućih parametara opće populacije naziva se greška reprezentativnosti. Postoje sistematske i nasumične greške uzorkovanja.

Slučajne greške objašnjavaju se nedovoljno ujednačenom zastupljenošću različitih kategorija jedinica u opštoj populaciji u uzorku.

Sistematske greške može biti povezano sa kršenjem pravila selekcije ili uslova uzorkovanja.

Dakle, prilikom anketiranja budžeta domaćinstava, populacija uzorka više od 40 godina izgrađena je na osnovu teritorijalno-sektorskog principa selekcije, što je bilo zbog glavne svrhe proračunskog istraživanja - karakterizacije životnog standarda radnika, zaposlenih. i kolekcionari. Populacija uzorka je raspoređena po regionima i sektorima privrede RSFSR-a srazmerno ukupnom broju zaposlenih; Za kreiranje industrijskog uzorka korišten je tipičan uzorak s mehaničkim odabirom jedinica unutar grupa.

Glavni kriterijum izbora bila je prosečna mesečna plata. Princip selekcije obezbijedio je proporcionalnu zastupljenost u uzorku populacije radnika sa različitim nivoima plata.

Sa pojavom novih društvene grupe(preduzetnici, poljoprivrednici, nezaposleni), reprezentativnost uzorka je narušena ne samo zbog razlika u strukturi opšte populacije, već i zbog sistematske greške koja je nastala zbog neslaganja između jedinice uzorka (zaposlenog) i posmatranja. jedinica (domaćinstvo). Takođe je veća vjerovatnoća da će biti odabrano domaćinstvo sa više od jednog radnog člana nego domaćinstvo sa jednim zaposlenim članom. Porodice koje nisu zaposlene u anketiranim industrijama isključene su iz spektra odabranih jedinica (domaćinstva penzionera, domaćinstva koja žive od individualnih prihoda). radna aktivnost, itd.). Procena tačnosti dobijenih rezultata (granice intervala poverenja, greške uzorkovanja) bila je teška, jer prilikom konstruisanja uzorka nisu korišćeni probabilistički modeli.

U 1996–1997 Uveden je fundamentalno novi pristup uzorkovanju domaćinstava. Kao osnova za njegovu provedbu korišteni su podaci iz mikropopisa iz 1994. godine. Opća populacija za selekciju obuhvatila je sve tipove domaćinstava, osim kolektivnih. I populacija uzorka počela je da se organizuje uzimajući u obzir reprezentativnost sastava i tipova domaćinstava unutar svakog subjekta Ruske Federacije.

Mjerenje grešaka u reprezentativnosti indikatora uzorka zasniva se na pretpostavci o nasumičnoj prirodi njihove distribucije sa beskonačno velikim brojem uzoraka.

Kvantitativna procjena pouzdanosti indikatora uzorka koristi se da bi se dobila ideja o općoj karakteristici. To se radi ili na osnovu indikatora uzorka, uzimajući u obzir njegovu slučajnu grešku, ili na osnovu postavljanja neke hipoteze (o vrijednosti prosječna varijansa, priroda distribucije, povezanost) u odnosu na svojstva opšte populacije.

Da bi se testirala hipoteza, procjenjuje se konzistentnost empirijskih podataka sa hipotetičkim podacima.

Veličina greške slučajne reprezentativnosti zavisi od:

  • 1) o veličini uzorka;
  • 2) stepen varijacije karakteristike koja se proučava u opštoj populaciji;
  • 3) prihvaćen način formiranja uzorka populacije.

Postoje prosječne (standardne) i maksimalne greške uzorkovanja.

Prosječna greška karakterizira mjeru odstupanja indikatora uzorka od sličnih indikatora opšte populacije.

Krajnja greška Općenito je prihvaćeno uzeti u obzir maksimalno moguće odstupanje između uzorka i općih karakteristika, tj. maksimalna greška za datu vjerovatnoću njenog nastanka.

Na osnovu podataka iz uzorka populacije moguće je procijeniti različite pokazatelje (parametre) opće populacije. Najčešće korištena procjena je:

  • – opšta prosječna vrijednost karakteristike koja se proučava (za viševrijednu kvantitativnu karakteristiku);
  • – generalni udio (za alternativnu karakteristiku).

Osnovni princip korištenja metode uzorkovanja je osigurati jednaku mogućnost da sve jedinice u populaciji budu odabrane u populaciji uzorka. Ovim pristupom ispunjen je zahtjev nasumične, objektivne selekcije i stoga je greška uzorkovanja određena prvenstveno njegovim volumenom ( n ). Kako se ovo posljednje povećava, prosječna greška se smanjuje, a karakteristike populacije uzorka približavaju se karakteristikama opće populacije.

S obzirom na isti broj populacija uzoraka i druge jednake uslove, greška uzorkovanja će biti manja u onoj koja je odabrana iz opće populacije sa manjim varijacijama u karakteristici koja se proučava. Smanjenje varijacije karakteristike znači smanjenje količine varijanse (za kvantitativnu karakteristiku ili za alternativnu karakteristiku).

Ovisnost veličine greške uzorkovanja o metodama formiranja populacije uzorka utvrđuje se pomoću formula za prosječnu grešku uzorkovanja (tablica 5.2).

Dodajmo indikatore u tabelu. 5.2 sa sljedećim objašnjenjima.

Varijanca uzorka je nešto manja od opšte varijanse, u matematičkoj statistici je dokazano da

Tabela 5.2

Formule za izračunavanje prosječne greške uzorkovanja na razne načine izbor

Tip uzorka

ponovljeno za

ponovljivo za

Zapravo

nasumično

(jednostavno)

Serial

(sa jednakim dimenzijama

Uobičajeno (proporcionalno veličini grupe)

Ako je populacija uzorka velika (tj. n je dovoljno velik), tada se omjer približava jedinici i varijansa uzorka se praktično poklapa sa općom varijansom.

Uzorak se smatra bezuslovno velikim kada p> 100 i svakako mali na n < 30. При оценке результатов малой выборки указанное соотношение выборочной и генеральной дисперсии следует принимать во внимание.

Oni se mogu izračunati pomoću sljedećih formula:

gdje je prosjek i -th serija; – ukupni prosjek za cijelu populaciju uzorka;

gdje je udio jedinica određene kategorije u i -th serija; – udio jedinica ove kategorije u cjelokupnoj populaciji uzorka; r – broj odabranih epizoda.

4. Za određivanje prosječne greške tipičnog uzorka u slučaju odabira jedinica proporcionalno veličini svake grupe, prosjek intragrupnih varijansi (za kvantitativnu karakteristiku, za alternativnu karakteristiku) služi kao indikator varijacije. Prema pravilu za sabiranje varijansi, vrijednost prosjeka unutargrupnih varijansi je manja od vrijednosti totalna varijansa. Prosječna moguća greška tipičnog uzorka manja je od greške jednostavnog slučajnog uzorka.

Često se koristi kombinovani izbor: individualni odabir jedinica se kombinuje sa grupnim odabirom, tipičan odabir se kombinuje sa selekcijom u serijama. Bilo kojom metodom selekcije, sa određenom vjerovatnoćom može se konstatovati da odstupanje prosječnog uzorka (ili udjela) od opšteg prosjeka (ili udjela) neće preći određenu vrijednost, koja se naziva ekstremna greška uzorci.

Odnos između granice greške uzorkovanja (∆) zajamčen s određenom vjerovatnoćom F(t), a prosječna greška uzorkovanja ima oblik: ili , gdje t – faktor povjerenja, određen u zavisnosti od nivoa vjerovatnoće F(t).

Vrijednosti funkcije F(t) I t određuju se na osnovu posebno sastavljenih matematičkih tabela. Evo nekih od njih koji se najčešće koriste:

T

Dakle, marginalna greška uzorkovanja odgovara na pitanje o tačnosti uzorka sa određenom vjerovatnoćom, čija vrijednost ovisi o vrijednosti koeficijenta pouzdanosti t. Da, kada t = 1 vjerovatnoća F(t ) odstupanje karakteristika uzorka od opštih za vrijednost pojedinačne prosječne greške je 0,683. Shodno tome, u prosjeku, od svakih 1000 uzoraka, 683 će dati generalizirajuće pokazatelje (prosjek, proporcija), koji će se od općih razlikovati samo za jednu prosječnu grešku. At t = 2 vjerovatnoća F(t) je jednako 0,954, to znači da će od svakih 1000 uzoraka 954 dati opće pokazatelje koji će se razlikovati od općih pokazatelja za najviše dva puta prosječnu grešku uzorkovanja, itd.

Uz apsolutnu vrijednost maksimalne greške uzorkovanja, relativna greška, koji je definiran kao postotni omjer granične greške uzorkovanja i odgovarajuće karakteristike populacije uzorka:

U praksi je uobičajeno postaviti vrijednost ∆, obično unutar 10% očekivanog prosječnog nivoa atributa.

Proračun prosječne i maksimalne greške uzorkovanja omogućava nam da odredimo granice unutar kojih će se nalaziti karakteristike opće populacije:

Granice unutar kojih će nepoznata vrijednost proučavanog indikatora u opštoj populaciji biti sadržana sa datim stepenom vjerovatnoće nazivaju se interval povjerenja, i vjerovatnoća F(t) verovatnoća poverenja. Što je veća vrijednost ∆, to je veća vrijednost interval poverenja a samim tim niža tačnost procjene.

Razmotrite sljedeći primjer. Za određivanje prosječne veličine depozita u banci, 200 deviznih računa deponenata odabrano je ponovljenim slučajnim uzorkovanjem. Kao rezultat toga, utvrđeno je da je prosječna veličina depozita bila 60 hiljada rubalja, a varijansa je bila 32. Istovremeno je 40 računa bilo na zahtjev. Potrebno je, sa vjerovatnoćom od 0,954, odrediti granice u kojima se nalazi prosječna veličina depozita na deviznim računima u banci i udio računa po viđenju.

Izračunajmo prosječnu grešku srednje vrijednosti uzorka koristeći formulu za ponovljeni odabir

Maksimalna greška srednje vrednosti uzorka sa verovatnoćom od 0,954 biće

Shodno tome, prosječna veličina depozita na deviznim računima u banci je unutar hiljadu rubalja:

Sa vjerovatnoćom od 0,954, može se reći da se prosječni depozit na deviznim računima u banci kreće od 59.200 do 60.800 rubalja.

Odredimo udio depozita po viđenju u populaciji uzorka:

Prosječna greška frakcije uzorka

Marginalna greška dionice sa vjerovatnoćom od 0,954 će biti

Dakle, udio računa tražnje u populaciji je unutar raspona w :

Sa vjerovatnoćom od 0,954, može se konstatovati da se učešće računa po viđenju u ukupnom broju deviznih računa u banci kreće od 14,4 do 25,6%.

U specifičnim studijama važno je uspostaviti optimalni odnos između mjere pouzdanosti dobijenih rezultata i količine dozvoljene greške uzorkovanja. S tim u vezi, prilikom organizovanja posmatranja uzorka, postavlja se pitanje u vezi sa određivanjem veličine uzorka neophodne za dobijanje potrebne tačnosti rezultata sa datom verovatnoćom. Proračun potrebne veličine uzorka vrši se na osnovu formula za maksimalnu grešku uzorkovanja u skladu sa vrstom i metodom odabira (tabela 5.3).

Tabela 5.3

Formule za izračunavanje veličine uzorka koristeći metodu čisto slučajnog uzorkovanja

Nastavimo s primjerom koji predstavlja rezultate uzorka istraživanja ličnih računa štediša banaka.

Potrebno je utvrditi koliko računa treba ispitati tako da s vjerovatnoćom od 0,977 greška u određivanju prosječne veličine depozita ne prelazi 1,5 hiljada rubalja. Izrazimo indikator veličine uzorka iz formule za maksimalnu grešku uzorkovanja za ponovljeni odabir:

Prilikom određivanja potrebne veličine uzorka korištenjem gornjih formula, poteškoće se javljaju u pronalaženju vrijednosti σ2 i da, jer se te vrijednosti mogu dobiti samo nakon provođenja ankete uzorka. S tim u vezi, umjesto stvarnih vrijednosti ovih pokazatelja, zamjenjuju se približne, koje bi se mogle utvrditi na osnovu promatranja bilo kojeg probnog uzorka ili iz prethodnih analitičkih istraživanja.

U slučajevima kada statističar zna prosječnu vrijednost karakteristika koje se proučava (na primjer, iz uputstava, zakona, itd.) ili granice unutar kojih ova karakteristika varira, može se primijeniti sljedeći proračun koristeći približne formule:

i zamijeniti proizvod w(1 – w) vrijednošću 0,25 (w = 0,5).

Da biste dobili precizniji rezultat, uzmite najveću moguću vrijednost ovih pokazatelja. Ako raspodjela karakteristike u općoj populaciji poštuje normalni zakon, tada je raspon varijacije približno jednak 6σ (ekstremne vrijednosti su odvojene od prosjeka na udaljenosti od 3σ). Dakle , Ali ako je distribucija očito asimetrična, onda .

Za bilo koju vrstu uzorka, njegov volumen počinje se izračunavati pomoću formule za ponovljeni odabir

Ako, kao rezultat izračuna, udio selekcije ( n ) prelazi 5%, tada se izračunavanje vrši pomoću formule za izbor koji se ne ponavlja.

Za tipičan uzorak potrebno je podijeliti ukupnu veličinu uzorka između odabranih tipova jedinica. Izračunavanje broja posmatranja iz svake grupe zavisi od prethodno navedenih organizacionih oblika tipičnog uzorka.

Sa tipičnim odabirom jedinica nesrazmjernim broju grupa, ukupan broj odabranih jedinica dijeli se sa brojem grupa, a rezultirajuća vrijednost daje broj odabira iz svake tipične grupe:

Gdje k – broj identifikovanih tipičnih grupa.

Prilikom odabira jedinica proporcionalno broju tipičnih grupa, broj zapažanja za svaku grupu određuje se formulom

odakle je veličina uzorka i th group; - volumen i th group.

Prilikom odabira za varijaciju osobine, postotak uzorka iz svake grupe trebao bi biti proporcionalan standardnoj devijaciji u ovoj grupi (). Izračunavanje broja () vrši se prema formulama

Kod serijske selekcije, potreban broj odabranih serija se određuje na isti način kao i kod pravilnog slučajnog odabira:

Ponovna selekcija

Selekcija koja se ne ponavlja

U ovom slučaju, varijanse i greške uzorkovanja mogu se izračunati za prosječnu vrijednost ili proporciju karakteristike.

Kada se koristi posmatranje uzorka, karakterizacija njegovih rezultata je moguća na osnovu poređenja dobijenih granica greške indikatora uzorka sa vrednošću dozvoljene greške.

S tim u vezi postavlja se zadatak utvrđivanja vjerovatnoće da greška uzorkovanja neće premašiti dozvoljenu grešku. Rješenje ovog problema svodi se na izračunavanje, na osnovu formule za maksimalnu grešku uzorkovanja, vrijednosti t.

Nastavljajući da razmatramo primjer uzorka ankete ličnih računa klijenata banke, pronaći ćemo vjerovatnoću s kojom se može reći da greška u određivanju prosječne veličine depozita neće premašiti 785 rubalja:

odgovarajući nivo pouzdanosti će biti 0,95.

Trenutno praksa posmatranja uzorka uključuje statistička posmatranja koja se vrše:

  • – tijela Rosstata;
  • – druga ministarstva i odeljenja (na primer, praćenje preduzeća u sistemu Banke Rusije).

Poznata generalizacija iskustva u organizovanju uzorka istraživanja malih preduzeća, stanovništva i domaćinstava predstavljena je u Metodološkim odredbama o statistici. Sadrže više širok koncept selektivno posmatranje od gore opisanog (Tabela 5.4).

U statističkoj praksi koriste se sve četiri vrste uzoraka prikazanih u tabeli. 5.4. Međutim, oni obično daju prednost gore opisanim vjerovatnoćama (slučajnim) uzorcima, koji su najobjektivniji, jer se mogu koristiti za procjenu tačnosti rezultata dobivenih iz podataka samog uzorka.

Tabela 5.4

Tipovi uzoraka

U uzorcima kvazi-slučajni tip Pretpostavlja se da uzorkovanje vjerovatno postoji na osnovu toga što ga uzorkovalac smatra prihvatljivim. Primer upotrebe kvazi-slučajnog uzorkovanja u statističkoj praksi je „Uzorak istraživanja malih preduzeća za proučavanje društvenih procesa u malim preduzećima“, sproveden 1996. godine u nekim regionima Rusije. Jedinice posmatranja (mala preduzeća) odabrali su stručnjaci, uzimajući u obzir zastupljenost privrednih sektora iz već formiranog uzorka istraživanja finansijsko-ekonomskih aktivnosti malih preduzeća (obrazac „Informacije o glavnim pokazateljima finansijsko-ekonomske aktivnosti malog preduzeća”). Prilikom sumiranja podataka uzorka, pretpostavljeno je da je populacija uzorka formirana metodom jednostavnog slučajnog odabira.

Direktno upotreba stručnog mišljenja je najčešći metod namjernog uključivanja jedinica u uzorak. Primjer takve metode selekcije je monografska metoda, koja podrazumijeva dobijanje informacija samo od jedne jedinice posmatranja, što je tipično, po mišljenju organizatora ankete – stručnjaka.

Uzorci formirani na osnovu dirigovana selekcija, implementiraju se korištenjem objektivne procedure, ali bez korištenja vjerojatnosnog mehanizma. Nadaleko je poznata metoda glavnog niza, u kojoj uzorak uključuje najveće (značajne) jedinice posmatranja koje daju glavni doprinos indikatoru, na primjer, ukupnu vrijednost karakteristike koja predstavlja glavnu svrhu istraživanja.

U statističkoj praksi se često koristi kombinovani metod statističkog posmatranja. Kombinacija metoda kontinuiranog i selektivnog posmatranja ima dva aspekta:

  • smjena u vremenu;
  • njihova simultana upotreba (dio populacije se posmatra kontinuirano, a dio selektivno).

Alternacija periodični uzorci sa relativno rijetkim kontinuiranim istraživanjima ili popisima neophodni su da bi se razjasnio sastav populacije koja se proučava. U budućnosti, ove informacije se koriste kao statistička osnova za posmatranje uzorka. Primjeri uključuju popis stanovništva i privremena istraživanja uzorka domaćinstava.

U ovom slučaju potrebno je riješiti sljedeće zadatke:

  • – utvrđivanje sastava znakova kontinuiranog posmatranja koji osiguravaju organizaciju uzorka;
  • – opravdanje za periode smjene, tj. kada kontinuirani podaci izgube svoju relevantnost i potrebni su troškovi za njihovo ažuriranje.

Istovremena upotreba u okviru jednog istraživanja kontinuiranih i uzorkovanih opservacija je zbog heterogenosti populacija koje se susreću u statističkoj praksi. Ovo posebno važi za ankete ekonomska aktivnost skup preduzeća koje karakterišu iskrivljene distribucije proučavanih karakteristika, kada određeni broj jedinica ima karakteristike koje se veoma razlikuju od većine vrednosti. U ovom slučaju takve jedinice se posmatraju kontinuirano, a drugi dio populacije selektivno.

Sa ovom organizacijom posmatranja, glavni zadaci su:

  • – utvrđivanje njihove optimalne proporcije;
  • – razvoj metoda za procjenu tačnosti rezultata.

Tipičan primjer koji ilustruje ovaj aspekt primjene kombinovane metode je opšti princip sprovođenje istraživanja populacije preduzeća, prema kojem se istraživanja populacije velikih i srednjih preduzeća sprovode prvenstveno kontinuiranom metodom, a malih - metodom uzorka.

Daljnji razvoj metodologije uzorkovanja vrši se kako u kombinaciji sa organizacijom kontinuiranog posmatranja, tako i kroz organizaciju posebnih istraživanja, čije je provođenje diktirano potrebom pribavljanja dodatnih informacija za rješavanje konkretnih problema. Dakle, organizacija istraživanja iz oblasti životnih uslova i životnog standarda stanovništva je predviđena u dva aspekta:

Obavezne komponente mogu uključivati ​​godišnja istraživanja prihoda, rashoda i potrošnje (analogno istraživanju budžeta domaćinstava), koja uključuju i osnovne pokazatelje uslova života stanovništva. Svake godine, prema posebnom planu, obavezne komponente moraju se dopuniti jednokratnim anketama (modulima) o životnim uvjetima stanovništva, s ciljem dubinskog proučavanja bilo koje odabrane društvene teme među njima. ukupan broj(na primjer, imovina domaćinstva, zdravlje, ishrana, obrazovanje, uslovi rada, uslovi stanovanja, slobodno vrijeme, socijalna mobilnost, sigurnost, itd.) sa različitom učestalošću koja je određena potrebom za indikatorima i mogućnostima resursa.





greška: Sadržaj zaštićen!!