Odaberite Stranica

Objašnjenje standardne greške srednjeg kvadrata uzorka za. Prosječna greška uzorkovanja

Populacija- skup jedinica koje imaju masovni karakter, tipičnost, kvalitativnu uniformnost i prisustvo varijacija.

Statističku populaciju čine materijalno postojeći objekti (zaposleni, preduzeća, zemlje, regioni), je objekat.

Jedinica stanovništva- svaka pojedinačna jedinica statističke populacije.

Jedna te ista statistička populacija može biti homogena po jednom svojstvu i heterogena po drugom.

Kvalitativna uniformnost- sličnost svih jedinica stanovništva po bilo kojoj osobini i različitost za sve ostale.

U statističkoj populaciji, razlike između jedne i druge jedinice populacije su češće kvantitativne prirode. Kvantitativne promjene vrijednosti atributa različitih jedinica populacije nazivaju se varijacijom.

Varijacija funkcije- kvantitativna promjena predznaka (za kvantitativni predznak) prilikom prelaska iz jedne jedinice populacije u drugu.

sign je vlasništvo karakteristika ili druge karakteristike jedinica, objekata i pojava koje se mogu posmatrati ili meriti. Znakovi se dijele na kvantitativne i kvalitativne. Raznovrsnost i varijabilnost vrijednosti nekog obilježja u pojedinim jedinicama populacije naziva se varijacija.

Atributivne (kvalitativne) karakteristike se ne mogu kvantificirati (sastav stanovništva prema spolu). Kvantitativne karakteristike imaju numerički izraz (sastav stanovništva prema starosti).

Indeks- ovo je generalizirajuća kvantitativna i kvalitativna karakteristika bilo kojeg svojstva jedinica ili agregata za svrhu u specifičnim uslovima vremena i mjesta.

Scorecard je skup indikatora koji sveobuhvatno odražavaju fenomen koji se proučava.

Na primjer, uzmite u obzir platu:
  • Znak - plate
  • Statistička populacija - svi zaposleni
  • Jedinica stanovništva je svaki radnik
  • Kvalitativna homogenost - obračunata plata
  • Varijacija karakteristika - niz brojeva

Opšta populacija i uzorak iz nje

Osnova je skup podataka dobijenih kao rezultat mjerenja jedne ili više karakteristika. Stvarno posmatrani skup objekata, statistički predstavljen nizom opservacija slučajna varijabla, je uzorkovanje, a hipotetički postojeće (promišljeno) - opšta populacija. Opća populacija može biti konačna (broj opažanja N = konst) ili beskonačno ( N = ∞), i uzorak iz stanovništva je uvijek rezultat ograničenog niza zapažanja. Naziva se broj zapažanja koji čine uzorak veličina uzorka. Ako je veličina uzorka dovoljno velika n→∞) uzorak se razmatra veliki, inače se naziva uzorak ograničen volumen. Uzorak se razmatra mala, ako, prilikom mjerenja jednodimenzionalne slučajne varijable, veličina uzorka ne prelazi 30 ( n<= 30 ), a pri istovremenom mjerenju nekoliko ( k) karakteristike u višedimenzionalnoj prostornoj relaciji n To k ne prelazi 10 (n/k< 10) . Uzorci obrazaca varijantne serije ako su njeni članovi statistika narudžbi, tj. uzorke vrijednosti slučajne varijable X sortiraju se u rastućem redoslijedu (rangiraju), vrijednosti atributa se pozivaju opcije.

Primjer. Gotovo isti nasumično odabrani skup objekata - komercijalne banke jednog administrativnog okruga Moskve, može se smatrati uzorkom iz opšte populacije svih komercijalnih banaka u ovom okrugu, i kao uzorkom iz opšte populacije svih komercijalnih banaka u Moskvi. , kao i uzorak komercijalnih banaka u zemlji i dr.

Osnovne metode uzorkovanja

Od toga zavisi pouzdanost statističkih zaključaka i smislena interpretacija rezultata reprezentativnost uzorci, tj. potpunost i adekvatnost prikaza svojstava opšte populacije, u odnosu na koju se ovaj uzorak može smatrati reprezentativnim. Proučavanje statističkih svojstava populacije može se organizirati na dva načina: korištenjem kontinuirano I diskontinuirano. Kontinuirano posmatranje uključuje ispitivanje svih jedinice studirao agregati, A nekontinuirano (selektivno) posmatranje- samo delovi toga.

Postoji pet glavnih načina za organizovanje uzorkovanja:

1. jednostavan slučajni odabir, u kojem se objekti nasumično biraju iz opće populacije objekata (na primjer, pomoću tablice ili generatora slučajnih brojeva), a svaki od mogućih uzoraka ima jednaku vjerovatnoću. Takvi uzorci se nazivaju zapravo nasumično;

2. jednostavan odabir kroz redovnu proceduru se izvodi pomoću mehaničke komponente (npr. datumi, dani u nedelji, brojevi stanova, slova abecede itd.) i tako dobijeni uzorci se nazivaju mehanički;

3. slojevito selekcija se sastoji u tome da se opšta populacija zapremine deli na podskupove ili slojeve (stratu) zapremine tako da . Stratumi su homogeni objekti u smislu statističkih karakteristika (na primjer, stanovništvo je podijeljeno na slojeve prema starosnoj grupi ili društvenoj klasi; preduzeća prema djelatnostima). U ovom slučaju, uzorci se pozivaju slojevito(inače, slojevit, tipičan, zoniran);

4. metode serial selekcije se koriste za formiranje serial ili ugniježđeni uzorci. Pogodni su ako je potrebno pregledati "blok" ili niz objekata odjednom (na primjer, pošiljka robe, proizvodi određene serije ili stanovništvo u teritorijalno-administrativnoj podjeli zemlje). Odabir serija može se izvršiti na slučajan ili mehanički način. Istovremeno se vrši kontinuirani pregled određene serije roba, odnosno cijele teritorijalne jedinice (stambene zgrade ili kvarta);

5. kombinovano(stepena) selekcija može kombinovati nekoliko metoda selekcije odjednom (na primjer, stratificirana i nasumična ili nasumična i mehanička); takav uzorak se zove kombinovano.

Vrste odabira

By um postoje individualni, grupni i kombinovani odabir. At individualni odabir pojedinačne jedinice opšte populacije se biraju u skupu uzoraka, sa grupni izbor su kvalitativno homogene grupe (serije) jedinica, i kombinovani izbor uključuje kombinaciju prvog i drugog tipa.

By metoda izbor razlikovati ponavljaju se i ne ponavljaju uzorak.

Neponovljivo naziva se selekcija, u kojoj se jedinica koja je ušla u uzorak ne vraća u prvobitnu populaciju i ne učestvuje u daljoj selekciji; dok je broj jedinica opšte populacije N smanjena tokom procesa selekcije. At ponovljeno izbor uhvaćen u uzorku se jedinica nakon registracije vraća u opštu populaciju i na taj način zadržava jednaku mogućnost, zajedno sa ostalim jedinicama, da se koristi u daljem postupku selekcije; dok je broj jedinica opšte populacije N ostaje nepromijenjena (metoda se rijetko koristi u socio-ekonomskim studijama). Međutim, sa velikim N (N → ∞) formule za neponovljeno izbor je blizak onima za ponovljeno selekcije, a potonje se koriste gotovo češće ( N = konst).

Glavne karakteristike parametara opće populacije i populacije uzorka

Osnova statističkih zaključaka studije je distribucija slučajne varijable, dok su posmatrane vrijednosti (x 1, x 2, ..., x n) se nazivaju realizacije slučajne varijable X(n je veličina uzorka). Distribucija slučajne varijable u opštoj populaciji je teoretska, idealna je po prirodi, a njen analogni uzorak je empirijski distribucija. Neke teorijske distribucije su date analitički, tj. njihov opcije odrediti vrijednost funkcije distribucije u svakoj tački u prostoru mogućih vrijednosti slučajne varijable. Stoga je za uzorak teško, a ponekad i nemoguće odrediti funkciju distribucije opcije se procjenjuju iz empirijskih podataka, a zatim se zamjenjuju u analitički izraz koji opisuje teorijsku distribuciju. U ovom slučaju, pretpostavka (ili hipoteza) o vrsti distribucije može biti i statistički tačna i pogrešna. Ali u svakom slučaju, empirijska raspodjela rekonstruirana iz uzorka samo grubo karakterizira pravu. Najvažniji parametri distribucije su očekivanu vrijednost i disperzija.

Po svojoj prirodi, distribucije jesu kontinuirano I diskretno. Najpoznatija kontinuirana distribucija je normalno. Selektivni analozi parametara i za njih su: srednja vrijednost i empirijska varijansa. Među diskretnim u socio-ekonomskim studijama, najčešće se koriste alternativa (dihotomno) distribucija. Parametar očekivanja ove distribucije izražava relativnu vrijednost (ili dijeliti) jedinice stanovništva koje imaju ispitivanu karakteristiku (označava se slovom ); udio stanovništva koji nema ovu osobinu označava se slovom q (q = 1 - p). Varijanca alternativne distribucije također ima empirijski analog.

U zavisnosti od vrste distribucije i načina odabira jedinica stanovništva, karakteristike parametara distribucije se različito izračunavaju. Glavne za teorijske i empirijske distribucije date su u tabeli. 9.1.

Udio uzorka k n je omjer broja jedinica populacije uzorka i broja jedinica opće populacije:

k n = n/N.

Udio uzorka w je omjer jedinica koje imaju osobinu koja se proučava x na veličinu uzorka n:

w = n n / n.

Primjer. U seriji robe koja sadrži 1000 jedinica, sa 5% uzorka frakcija uzorka k n u apsolutnoj vrijednosti je 50 jedinica. (n = N*0,05); ako se u ovom uzorku pronađu 2 neispravna proizvoda frakcija uzorka w biće 0,04 (w = 2/50 = 0,04 ili 4%).

Pošto se populacija uzorka razlikuje od opšte populacije, postoje greške uzorkovanja.

Tabela 9.1 Glavni parametri opšte populacije i populacije uzorka

Greške uzorkovanja

Kod bilo koje (solidne i selektivne) greške mogu se pojaviti dvije vrste: registracija i reprezentativnost. Greške registracija može imati nasumično I sistematično karakter. Slučajno greške su sastavljene od mnogo različitih nekontrolisanih uzroka, nenamjerne su prirode i obično se međusobno uravnotežuju (na primjer, promjene očitavanja instrumenta zbog temperaturnih fluktuacija u prostoriji).

Sistematično greške su pristrasne, jer krše pravila za odabir objekata u uzorku (na primjer, odstupanja u mjerenjima pri promjeni postavki mjernog uređaja).

Primjer. Za procjenu socijalnog statusa stanovništva u gradu planirano je ispitivanje 25% porodica. Ako se, međutim, odabir svakog četvrtog stana zasniva na njegovom broju, onda postoji opasnost od odabira svih stanova samo jedne vrste (npr. jednosobni stanovi), što će unijeti sistematsku grešku i iskriviti rezultate; izbor broja stana po ždrijebu je poželjniji, jer će greška biti slučajna.

Greške u reprezentativnosti svojstvene samo selektivnom posmatranju, ne mogu se izbjeći i nastaju kao rezultat činjenice da uzorak ne reproducira u potpunosti opći. Vrijednosti indikatora dobijenih iz uzorka razlikuju se od indikatora istih vrijednosti u opštoj populaciji (ili dobijenih tokom kontinuiranog posmatranja).

Greška uzorkovanja je razlika između vrijednosti parametra u općoj populaciji i vrijednosti uzorka. Za prosječnu vrijednost kvantitativnog atributa, ona je jednaka: , a za udio (alternativni atribut) - .

Greške uzorkovanja su svojstvene samo opažanjima uzorka. Što su ove greške veće, to se empirijska raspodjela više razlikuje od teorijske. Parametri empirijske distribucije i slučajne su varijable, stoga su greške uzorkovanja također slučajne varijable, mogu uzeti različite vrijednosti za različite uzorke, pa je stoga uobičajeno izračunati prosečna greška.

Prosječna greška uzorkovanja je vrijednost koja izražava standardnu ​​devijaciju srednje vrijednosti uzorka od matematičkog očekivanja. Ova vrijednost, podložna principu slučajnog odabira, prvenstveno ovisi o veličini uzorka i o stepenu varijacije osobine: što je veća i manja varijacija osobine (dakle, vrijednost ), to je manja vrijednost prosječna greška uzorkovanja. Odnos između varijansi opšte populacije i populacije uzorka izražava se formulom:

one. za dovoljno velike, možemo pretpostaviti da . Prosječna greška uzorkovanja pokazuje moguća odstupanja parametra populacije uzorka od parametra opšte populacije. U tabeli. 9.2 prikazani su izrazi za izračunavanje prosječne greške uzorkovanja za različite metode organizacije posmatranja.

Tabela 9.2 Srednja greška (m) srednje vrijednosti uzorka i proporcija za različite tipove uzoraka

Gdje je prosjek varijansi unutargrupnog uzorka za kontinuirano obilježje;

Prosjek unutargrupnih disperzija udjela;

— broj odabranih serija, — ukupan broj serija;

,

gdje je prosjek th serije;

- opšti prosjek za cijeli uzorak za kontinuirano obilježje;

,

gdje je udio osobine u th seriji;

— ukupan udio osobine u cijelom uzorku.

Međutim, veličina prosječne greške može se ocijeniti samo sa određenom vjerovatnoćom R (R ≤ 1). Lyapunov A.M. dokazali da se raspodjela srednjih vrijednosti uzorka, a time i njihova odstupanja od opšte srednje vrijednosti, sa dovoljno velikim brojem, približno pridržavaju normalnog zakona raspodjele, pod uvjetom da opća populacija ima konačan prosjek i ograničenu varijansu.

Matematički, ova izjava za srednju vrijednost se izražava kao:

a za razlomak, izraz (1) će poprimiti oblik:

Gdje - Tu je marginalna greška uzorkovanja, što je višekratnik prosječne greške uzorkovanja , a faktor višestrukosti je Studentov kriterijum („faktor pouzdanosti“), koji je predložio W.S. Gosset (pseudonim "Student"); vrijednosti za različite veličine uzoraka pohranjuju se u posebnu tablicu.

Vrijednosti funkcije F(t) za neke vrijednosti t su:

Stoga se izraz (3) može čitati na sljedeći način: sa vjerovatnoćom P = 0,683 (68,3%) može se tvrditi da razlika između uzorka i opšte srednje vrednosti neće preći jednu vrednost srednje greške m(t=1), sa vjerovatnoćom P = 0,954 (95,4%)— da ne prelazi vrijednost dvije srednje greške m (t = 2) , sa vjerovatnoćom P = 0,997 (99,7%)- neće prelaziti tri vrijednosti m (t = 3) . Dakle, vjerovatnoća da će ova razlika prijeći tri puta vrijednost srednje greške određuje nivo greške i nije više od 0,3% .

U tabeli. 9.3 date su formule za izračunavanje granične greške uzorkovanja.

Tabela 9.3 Granična greška uzorkovanja (D) za srednju vrijednost i proporciju (p) za različite vrste uzorkovanja

Proširivanje rezultata uzorka na populaciju

Krajnji cilj posmatranja uzorka je karakterizacija opće populacije. Za male veličine uzorka, empirijske procjene parametara ( i ) mogu značajno odstupati od njihovih pravih vrijednosti ( i ). Stoga postaje neophodno uspostaviti granice unutar kojih leže prave vrijednosti ( i ) za vrijednosti uzorka parametara ( i ).

Interval povjerenja nekog parametra θ opće populacije naziva se slučajni raspon vrijednosti ovog parametra, koji je s vjerovatnoćom bliskom 1 ( pouzdanost) sadrži pravu vrijednost ovog parametra.

marginalna greška uzorci Δ omogućava vam da odredite granične vrijednosti karakteristika opće populacije i njihovih intervali poverenja, koji su jednaki:

Zaključak interval povjerenja dobijeno oduzimanjem marginalna greška iz uzorka srednje vrijednosti (udio), a gornje dodavanjem.

Interval povjerenja za srednju vrijednost koristi graničnu grešku uzorkovanja i za dati nivo povjerenja određuje se formulom:

To znači da sa datom vjerovatnoćom R, koji se naziva nivoom pouzdanosti i jedinstveno je određen vrijednošću t, može se tvrditi da prava vrijednost srednje vrijednosti leži u rasponu od , a prava vrijednost udjela je u rasponu od

Prilikom izračunavanja intervala povjerenja za tri standardna nivoa povjerenja P=95%, P=99% i P=99,9% vrijednost odabire . Primjene ovisno o broju stupnjeva slobode. Ako je veličina uzorka dovoljno velika, tada su vrijednosti koje odgovaraju ovim vjerojatnostima t su jednaki: 1,96, 2,58 I 3,29 . Dakle, marginalna greška uzorkovanja omogućava nam da odredimo granične vrijednosti karakteristika opće populacije i njihovih intervala povjerenja:

Distribucija rezultata selektivnog posmatranja na opštu populaciju u socio-ekonomskim studijama ima svoje karakteristike, jer zahteva potpunost reprezentativnosti svih njenih tipova i grupa. Osnova za mogućnost takve distribucije je proračun relativna greška:

Gdje Δ % - relativna marginalna greška uzorkovanja; , .

Postoje dvije glavne metode za proširenje promatranja uzorka na populaciju: direktna konverzija i metoda koeficijenata.

Essence direktna konverzija je pomnožiti srednju vrijednost uzorka!!\overline(x) sa veličinom populacije.

Primjer. Neka prosječan broj mališana u gradu bude procijenjen metodom uzorkovanja i iznosi jednu osobu. Ako u gradu ima 1000 mladih porodica, onda se broj potrebnih mjesta u opštinskim jaslicama dobije množenjem ovog prosjeka sa veličinom opšte populacije N = 1000, tj. imaće 1200 mesta.

Metoda koeficijenata preporučljivo je koristiti u slučaju kada se vrši selektivno posmatranje kako bi se razjasnili podaci kontinuiranog posmatranja.

Pri tome se koristi formula:

gdje su sve varijable veličina populacije:

Potrebna veličina uzorka

Tabela 9.4 Potrebna veličina uzorka (n) za različite tipove organizacije uzorkovanja

Prilikom planiranja uzorkovanja sa unaprijed određenom vrijednošću dozvoljene greške uzorkovanja, potrebno je pravilno procijeniti traženu veličina uzorka. Ovaj iznos se može odrediti na osnovu dozvoljene greške tokom selektivnog posmatranja na osnovu date verovatnoće koja garantuje prihvatljiv nivo greške (uzimajući u obzir način na koji je posmatranje organizovano). Formule za određivanje potrebne veličine uzorka n mogu se lako dobiti direktno iz formula za graničnu grešku uzorkovanja. Dakle, iz izraza za marginalnu grešku:

veličina uzorka je direktno određena n:

Ova formula to pokazuje sa smanjenjem marginalne greške uzorkovanja Δ značajno povećava potrebnu veličinu uzorka, koja je proporcionalna varijansi i kvadratu Studentovog t-testa.

Za konkretan metod organizacije posmatranja, potrebna veličina uzorka se izračunava prema formulama datim u tabeli. 9.4.

Primjeri praktičnih proračuna

Primjer 1. Proračun srednje vrijednosti i intervala povjerenja za kontinuiranu kvantitativnu karakteristiku.

Za procjenu brzine namirenja sa kreditorima u banci, rađen je slučajni uzorak od 10 platnih dokumenata. Ispostavilo se da su njihove vrijednosti jednake (u danima): 10; 3; 15; 15; 22; 7; 8; 1; 19; 20.

Obavezno sa vjerovatnoćom P = 0,954 odrediti marginalnu grešku Δ srednja vrijednost uzorka i granice povjerenja prosječnog vremena izračunavanja.

Rješenje. Prosječna vrijednost se izračunava po formuli iz tabele. 9.1 za populaciju uzorka

Disperzija se izračunava prema formuli iz tabele. 9.1.

Srednja kvadratna greška dana.

Greška srednje vrijednosti izračunava se po formuli:

one. srednja vrijednost je x ± m = 12,0 ± 2,3 dana.

Pouzdanost srednje vrijednosti je bila

Granična greška se izračunava po formuli iz tabele. 9.3 za ponovni izbor, pošto je veličina populacije nepoznata, i za P = 0,954 nivo samopouzdanja.

Dakle, srednja vrijednost je `x ± D = `x ± 2m = 12,0 ± 4,6, tj. njegova prava vrijednost je u rasponu od 7,4 do 16,6 dana.

Korišćenje Studentskog stola. Aplikacija nam omogućava da zaključimo da je za n = 10 - 1 = 9 stepeni slobode dobijena vrijednost pouzdana sa nivoom značajnosti a £ 0,001, tj. rezultirajuća srednja vrijednost se značajno razlikuje od 0.

Primjer 2. Procjena vjerovatnoće (opšti udio) r.

Mehaničkim metodom uzorkovanja istraživanja socijalnog statusa 1000 porodica, otkriveno je da je udio porodica sa niskim primanjima w = 0,3 (30%)(uzorak je bio 2% , tj. n/N = 0,02). Obavezno sa nivoom samopouzdanja p = 0,997 definisati indikator R porodice sa niskim primanjima širom regiona.

Rješenje. Prema prikazanim vrijednostima funkcije F(t) pronaći za dati nivo pouzdanosti P = 0,997 značenje t=3(vidi formulu 3). Greška graničnog udjela w odrediti po formuli iz tabele. 9.3 za uzorkovanje koje se ne ponavlja (mehaničko uzorkovanje se uvijek ne ponavlja):

Ograničavanje relativne greške uzorkovanja u % bice:

Verovatnoća (opšti udeo) porodica sa niskim primanjima u regionu će biti p=w±Δw, a granice pouzdanosti p se izračunavaju na osnovu dvostruke nejednakosti:

w — Δw ≤ p ≤ w — Δw, tj. prava vrijednost p leži unutar:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Dakle, sa vjerovatnoćom od 0,997, može se tvrditi da se udio porodica sa niskim primanjima među svim porodicama u regionu kreće od 28,6% do 31,4%.

Primjer 3 Izračunavanje srednje vrijednosti i intervala pouzdanosti za diskretnu karakteristiku specificiranu nizom intervala.

U tabeli. 9.5. postavlja se distribucija aplikacija za izradu narudžbi prema vremenu njihovog sprovođenja od strane preduzeća.

Tabela 9.5 Distribucija zapažanja prema vremenu nastanka

Rješenje. Prosječno vrijeme završetka narudžbe se izračunava po formuli:

Prosječno vrijeme će biti:

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23,1 mjeseci

Isti odgovor dobijamo ako koristimo podatke o p i iz pretposljednje kolone tabele. 9.5 koristeći formulu:

Imajte na umu da se sredina intervala za posljednju gradaciju nalazi umjetnim dodavanjem širine intervala prethodne gradacije jednakom 60 - 36 = 24 mjeseca.

Disperzija se izračunava po formuli

Gdje x i- sredina intervalne serije.

Dakle!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) i standardna greška je .

Greška srednje vrijednosti izračunava se po formuli za mjesece, tj. srednja vrijednost je!!\overline(x) ± m = 23,1 ± 13,4.

Granična greška se izračunava po formuli iz tabele. 9.3 za ponovni odabir jer je veličina populacije nepoznata, za nivo pouzdanosti 0,954:

Dakle, srednja vrijednost je:

one. njegova prava vrijednost je u rasponu od 0 do 50 mjeseci.

Primjer 4 Da bi se utvrdila brzina namirenja sa kreditorima N = 500 preduzeća korporacije u poslovnoj banci, potrebno je sprovesti selektivnu studiju metodom slučajnog nerepetitivnog odabira. Odrediti potrebnu veličinu uzorka n tako da sa vjerovatnoćom P = 0,954 greška srednje vrijednosti uzorka ne prelazi 3 dana, ako su probne procjene pokazale da je standardna devijacija s 10 dana.

Rješenje. Za određivanje broja potrebnih studija n koristimo formulu za nerepetitivnu selekciju iz tabele. 9.4:

U njemu se vrijednost t određuje iz za nivo pouzdanosti P = 0,954. Jednako je 2. Srednja kvadratna vrijednost s = 10, veličina populacije N = 500 i marginalna greška srednje vrijednosti Δ x = 3. Zamjenom ovih vrijednosti u formulu dobijamo:

one. dovoljno je napraviti uzorak od 41 preduzeća da bi se procijenio traženi parametar - brzina obračuna sa kreditorima.

Na osnovu vrijednosti karakteristika jedinica uzorka registrovanih u skladu sa programom statističkog posmatranja, izračunavaju se generalizirajuće karakteristike uzorka: srednja vrijednost uzorka() I uzorak udjela jedinice koje imaju neku osobinu od interesa za istraživače, u ukupnom broju ( w).

Razlika između indikatora uzorka i opće populacije naziva se greška uzorkovanja.

Greške uzorkovanja, kao i greške bilo koje druge vrste statističkog posmatranja, dijele se na greške registracije i greške reprezentativnosti. Glavni zadatak metode uzorkovanja je proučavanje i mjerenje slučajnih grešaka reprezentativnosti.

Srednja vrijednost uzorka i udio uzorka su slučajne varijable koje mogu poprimiti različite vrijednosti u zavisnosti od toga koje su jedinice populacije u uzorku. Stoga su i greške uzorkovanja su slučajne varijable i može poprimiti različite vrijednosti. Stoga se utvrđuje prosjek mogućih grešaka.

Prosječna greška uzorkovanja (µ - mu) je jednako:

za sredinu ; za dionicu ,

Gdje R- udio određene karakteristike u opštoj populaciji.

U ovim formulama σ x 2 I R(1-R) su karakteristike opšte populacije, koje su nepoznate tokom posmatranja uzorka. U praksi se zamjenjuju sličnim karakteristikama populacije uzorka na osnovu zakona velikih brojeva, prema kojem populacija uzorka, uz dovoljno veliki volumen, precizno reproducira karakteristike opće populacije. Metode za izračunavanje prosječnih grešaka uzorkovanja za prosjek i za udio u ponovljenim i neponovljenim selekcijama date su u tabeli. 6.1.

Tabela 6.1.

Formule za izračunavanje srednje greške uzorkovanja za srednju vrijednost i za udio

Vrijednost je uvijek manja od jedan, tako da je vrijednost prosječne greške uzorkovanja kod nerepetitivnog odabira manja nego kod ponovljenog odabira. U slučajevima kada je udio uzorka beznačajan, a faktor blizu jedinice, korekcija se može zanemariti.

Može se tvrditi da opšti prosjek vrijednosti indikatora ili opšteg udjela neće ići izvan granica prosječne greške uzorka samo sa određenim stepenom vjerovatnoće. Stoga, za karakterizaciju greške uzorkovanja, pored prosječne greške, izračunavamo marginalna greška uzorkovanja(Δ), što je povezano sa nivoom verovatnoće koji to garantuje.

Nivo vjerovatnoće ( R) određuje vrijednost normaliziranog odstupanja ( t), i obrnuto. Vrijednosti t date su u tablicama normalne distribucije vjerovatnoće. Najčešće korištene kombinacije t I R date su u tabeli. 6.2.


Tabela 6.2

Vrijednosti standardne devijacije t sa odgovarajućim vrijednostima nivoa vjerovatnoće R

t 1,0 1,5 2,0 2,5 3,0 3,5
R 0,683 0,866 0,954 0,988 0,997 0,999

t je faktor povjerenja koji ovisi o vjerovatnoći s kojom se može garantirati da marginalna greška neće premašiti t puta srednju grešku. Pokazuje koliko prosječnih grešaka sadrži marginalna greška.. Sta ako t= 1, onda se sa vjerovatnoćom od 0,683 može tvrditi da razlika između uzorka i općih indikatora neće premašiti jednu srednju grešku.

Formule za izračunavanje graničnih grešaka uzorkovanja date su u tabeli. 6.3.

Tabela 6.3.

Formule za izračunavanje granične greške uzorkovanja za srednju vrijednost i za udio

Nakon izračunavanja marginalnih grešaka uzorka, nalazi se intervali pouzdanosti za opšte indikatore. Vjerovatnoća koja se uzima u obzir prilikom izračunavanja greške karakteristike uzorka naziva se nivo pouzdanosti. Nivo pouzdanosti vjerovatnoće od 0,95 znači da samo u 5 slučajeva od 100 greška može preći utvrđene granice; vjerovatnoće od 0,954 - u 46 slučajeva od 1000, a kod 0,999 - u 1 slučaju od 1000.

Za opći prosjek, najvjerovatnije granice u kojima će se nalaziti, uzimajući u obzir marginalnu grešku reprezentativnosti, izgledat će ovako:

.

Najvjerovatnije granice u kojima će se generalni udio nalaziti će izgledati ovako:

.

Odavde, opšti prosek , generalni udio .

Dato u tabeli. 6.3. formule se koriste za određivanje grešaka uzorkovanja, koje se obavljaju stvarnim slučajnim i mehaničkim metodama.

Stratifikacijom selekcije predstavnici svih grupa nužno spadaju u uzorak, i to obično u istim omjerima kao u opštoj populaciji. Stoga, greška uzorkovanja u ovom slučaju zavisi uglavnom od prosjeka unutargrupnih varijansi. Na osnovu pravila za dodavanje varijansi, možemo zaključiti da će greška uzorkovanja za stratificiranu selekciju uvijek biti manja nego kod pravilnog slučajnog odabira.

Uz serijsku (ugniježđenu) selekciju, međugrupna disperzija će biti mjera fluktuacije.

Zašto ova prezentacija? Prvo, "srednja kvadratna greška uzorka / standardna greška" je dugo i komplikovano ime koje se često u problemima skraćuje na "srednju" ili "standardnu" grešku. Činjenica da je to ista stvar za mene je tada bilo pravo otkriće. Ova ozloglašena greška može biti različita i uvijek je napisana na različite načine, što je vrlo zbunjujuće. Ispostavilo se da ova stvar nailazi na mnogo mjesta, ali stalno mijenja svoj izgled. Zbog toga trpamo čitavu gomilu formula kada možete proći s jednom ili dvije.

Kako se označava? Čim nisu maltretirali nesrećne! Ovo su opcije za pisanje standardne greške za srednju vrednost u predavanjima i udžbenicima. Na isti način su ismijavali grešku udjela, ili čak zaboravili na njeno postojanje i odmah je zapisali formulom, što nesretne studente jako zbunjuje. Ovdje ću ga označiti sa "ε", jer, hvala Bogovima, ovo je rijetko slovo i ne može se pomiješati ni sa trenutkom ni sa selektivnim COEX.

Zapravo, formula (korijen varijanse sa brojem elemenata u uzorku ili RMS podijeljen s korijenom veličine uzorka) Ovo je glavna formula, temelj, osnova temelja. Dovoljno je samo to naučiti, a onda samo raditi glavom! Kako? Čitajte dalje!

Sorte i odakle dolaze 1. Za udio. Varijanca udjela smatra se neuobičajenom. Ako uzmemo udio ispitivane osobine kao p, a udio „svega ostalog“ kao q, tada je varijansa jednaka p*q ili p*(1 p). Odatle dolazi formula:

Sorte i odakle potiču (2) 2. Gdje mogu nabaviti opći RMS? σ je, u stvari, opšta standardna devijacija, koja će vam biti data u problemu na slici. Postoji izlaz - varijansa uzorka S 2 , koja je, kao što svi znaju, pristrasna. Stoga opći procjenjujemo na sljedeći način: (tako da ni ne pomisli da se pomjeri) i zamjenjujemo ga. I možete odmah ovako: Ali postoji takav čip. Ako je n>30, razlika između S i σ je izuzetno mala ©, tako da možete varati i pisati jednostavnije:

Sorte i odakle potiču (3) „Odakle neke druge zagrade i enki? ? ? » Postoje 2 metode uzorkovanja, sjećate se? - ponavljaju se i ne ponavljaju. Dakle, sve prethodne formule su pogodne za ponovno uzorkovanje ili kada je uzorak n u odnosu na populaciju N toliko mali da se omjer n/N može zanemariti. U slučaju kada je direktno važno da se uzorak ne ponavlja, ili kada je u problemu u čistom tekstu navedeno koliko jedinica u opštoj populaciji, neophodno je koristiti.

Teorija statistike: Bilješke s predavanja Burkhanova Inessa Viktorovna

3. Greške uzorkovanja

3. Greške uzorkovanja

Svaka jedinica u opservaciji uzorka treba da ima jednaku priliku da bude odabrana sa ostalima - to je osnova slučajnog uzorka.

Samonasumično uzorkovanje - ovo je odabir jedinica iz cjelokupne opće populacije lutrijom ili na drugi sličan način.

Princip slučajnosti je da na uključivanje ili isključivanje objekta iz uzorka ne može uticati bilo koji drugi faktor osim slučajnosti.

Udio uzorka je omjer broja jedinica u uzorku i broja jedinica u općoj populaciji:

Samoslučajna selekcija u svom čistom obliku je inicijalna među svim drugim vrstama selekcije, sadrži i implementira osnovne principe selektivnog statističkog posmatranja.

Dvije glavne vrste generalizirajućih indikatora koje se koriste u metodi uzorkovanja su prosječna vrijednost kvantitativnog atributa i relativna vrijednost alternativnog atributa.

Udio uzorka (w), ili posebnost, određen je omjerom broja jedinica koje imaju osobinu koja se proučava m, na ukupan broj jedinica uzorkovanja (n):

Da bi se okarakterisala pouzdanost indikatora uzorka, razlikuju se prosječne i marginalne greške uzorka.

Greška uzorkovanja, koja se također naziva greška reprezentativnosti, je razlika između odgovarajućeg uzorka i općih karakteristika:

?x = |x - x |;

?w =|h – p|.

Samo uzorkovana opažanja imaju grešku uzorkovanja

Srednja vrijednost uzorka i proporcija uzorka- to su slučajne varijable koje poprimaju različite vrijednosti u zavisnosti od jedinica proučavane statističke populacije koje su uključene u uzorak. Shodno tome, greške uzorkovanja su također slučajne varijable i također mogu poprimiti različite vrijednosti. Stoga se utvrđuje prosjek mogućih grešaka – prosječna greška uzorkovanja.

Prosječna greška uzorkovanja određena je veličinom uzorka: što je veća populacija, ako su sve ostale jednake, to je manja prosječna greška uzorkovanja. Pokrivajući uzorkovanu anketu sa sve većim brojem jedinica opšte populacije, sve preciznije karakterišemo celokupnu populaciju.

Prosječna greška uzorkovanja zavisi od stepena varijacije proučavane osobine, a stepen varijacije karakteriše varijansa? 2 ili w(l - w)- za alternativni znak. Što je manja varijacija i varijansa karakteristika, manja je srednja greška uzorkovanja, i obrnuto.

Za nasumično ponovno uzorkovanje, srednje greške se teoretski izračunavaju pomoću sljedećih formula:

1) za prosječnu kvantitativnu osobinu:

Gdje? 2 - prosječna vrijednost disperzije kvantitativne osobine.

2) za dionicu (alternativni znak):

Dakle, kakva je varijansa osobine u populaciji? 2 nije točno poznato, u praksi koriste vrijednost varijanse S 2 izračunatu za populaciju uzorka na osnovu zakona velikih brojeva, prema kojem populacija uzorka s dovoljno velikom veličinom uzorka precizno reproducira karakteristike opće populacije .

Formule za srednju grešku uzorkovanja za nasumično ponovno uzorkovanje su sljedeće. Za prosječnu vrijednost kvantitativnog atributa: opća varijansa se izražava kroz izborni predmet sljedećim omjerom:

gdje je S 2 vrijednost disperzije.

Mehaničko uzorkovanje- ovo je izbor jedinica u skupu uzoraka iz općeg, koji je podijeljen u jednake grupe prema neutralnom kriteriju; se radi na način da se iz svake takve grupe u uzorku odabere samo jedna jedinica.

Mehaničkim odabirom jedinice statističke populacije koja se proučava preliminarno se raspoređuju po određenom redoslijedu, nakon čega se u određenom intervalu mehanički odabire određeni broj jedinica. U ovom slučaju, veličina intervala u općoj populaciji jednaka je recipročnom udjelu uzorka.

Sa dovoljno velikom populacijom, mehanički odabir u smislu tačnosti rezultata blizak je slučajnom, pa se za određivanje prosječne greške mehaničkog uzorkovanja koriste formule slučajnog nerepetitivnog uzorkovanja.

Za odabir jedinica iz heterogene populacije koristi se tzv. tipični uzorak, koristi se kada se sve jedinice opće populacije mogu podijeliti u nekoliko kvalitativno homogenih, sličnih grupa prema karakteristikama od kojih zavise proučavani pokazatelji.

Zatim se iz svake tipične grupe vrši pojedinačni odabir jedinica u uzorak slučajnim ili mehaničkim uzorkom.

Tipično uzorkovanje se obično koristi u proučavanju složenih statističkih populacija.

Tipično uzorkovanje daje preciznije rezultate. Tipizacija opšte populacije obezbeđuje reprezentativnost takvog uzorka, zastupljenost svake tipološke grupe u njemu, što omogućava da se isključi uticaj međugrupne varijanse na prosečnu grešku uzorka. Stoga, pri određivanju prosječne greške tipičnog uzorka, prosjek varijansi unutar grupe djeluje kao indikator varijacije.

Serijsko uzorkovanje uključuje slučajni odabir iz opće populacije grupa jednake veličine kako bi se sve jedinice bez izuzetka podvrgle posmatranju u takvim grupama.

Budući da se sve jedinice bez izuzetka ispituju unutar grupa (serija), prosječna greška uzorkovanja (pri odabiru jednakih serija) zavisi samo od međugrupne (međuserijalne) varijanse.

Iz knjige Lični budžet. Novac pod kontrolom autor Makarov Sergej Vladimirovič

Greške stanara Možete se odnositi na greške na različite načine: možete se bojati da ih napravite i brinete za svaku od njih, možete se radovati svojim greškama i krizama kao putokazima na putu ka uspjehu i ličnim pobjedama. Samo jedna stvar je nepromjenjiva u greškama - za njih morate platiti.

Iz knjige Priručnik o internoj reviziji. Rizici i poslovni procesi autor Kriškin Oleg

Uzorkovanje Procedura uzorkovanja je bitan korak u projektu interne revizije. Detaljno je opisana u različitim izvorima na temu revizije. Međutim, takvi opisi su uglavnom akademske prirode. Predlažem da se fokusiram na njih

Iz knjige Psihologija ulaganja [Kako prestati raditi gluposti sa svojim novcem] autor Richards Carl

Investicione greške su greške investitora Sada, više nego ikada, uveren sam da su sve greške u investiranju zapravo greške investitora. Investicije ne prave greške. Za razliku od investitora, ulaganje je izbor. Radi se o ovome

autor Shcherbina Lidia Vladimirovna

29. Određivanje potrebne veličine uzorka Jedan od naučnih principa u teoriji metode uzorkovanja je osigurati dovoljan broj odabranih jedinica.Smanjenje standardne greške uzorka uvijek je povezano sa povećanjem veličine uzorka. Kalkulacija

Iz knjige Opća teorija statistike autor Shcherbina Lidia Vladimirovna

30. Metode selekcije i vrste uzorkovanja. Pravilno nasumično uzorkovanje U teoriji metode uzorkovanja razvijene su različite metode selekcije i vrste uzorkovanja kako bi se osigurala reprezentativnost. Pod metodom selekcije podrazumijeva se postupak odabira jedinica iz opće populacije.

Iz knjige Opća teorija statistike autor Shcherbina Lidia Vladimirovna

31. Mehaničko i tipično uzorkovanje Kod čisto mehaničkog uzorkovanja, cjelokupna opšta populacija jedinica mora prije svega biti predstavljena u obliku liste selekcijskih jedinica, sastavljenih u nekom neutralnom redoslijedu u odnosu na osobinu koja se proučava. Onda lista

Iz knjige Opća teorija statistike autor Shcherbina Lidia Vladimirovna

32. Serijsko i kombinovano uzorkovanje Serijsko (ugniježđeno) uzorkovanje je vrsta formiranja uzorka kada se slučajno ne biraju jedinice koje se ispituju, već grupe jedinica (serija, gnijezda). Unutar odabrane serije (gnijezda)

Iz knjige Opća teorija statistike autor Shcherbina Lidia Vladimirovna

33. Višestepeno, višefazno i ​​interpenetrirajuće uzorkovanje. Karakteristika višestepenog uzorka je da se uzorak formira postepeno, prema koracima selekcije. U prvoj fazi, korištenjem unaprijed određene metode i vrste selekcije

autor Konik Nina Vladimirovna

3. Određivanje potrebne veličine uzorka Jedan od naučnih principa u teoriji uzorkovanja je osigurati da je odabran dovoljan broj jedinica. Teoretski, neophodnost poštovanja ovog principa prikazana je u dokazima graničnih teorema

Iz knjige Opća teorija statistike: bilješke s predavanja autor Konik Nina Vladimirovna

4. Metode selekcije i vrste uzorkovanja U teoriji metode uzorkovanja razvijene su različite metode selekcije i vrste uzorkovanja kako bi se osigurala reprezentativnost. Pod metodom selekcije podrazumijeva se postupak odabira jedinica iz opće populacije. Postoje dva načina odabira: ponovljeni

Iz knjige Teorija statistike autor Burkhanova Inessa Viktorovna

36. Greške uzorkovanja Samonasumično uzorkovanje je odabir jedinica iz cjelokupne populacije žrijebom ili na neki drugi sličan način. Princip slučajnosti je da na uključivanje ili isključivanje objekta iz uzorka ne može uticati nijedan faktor,

Iz knjige Poslovna korespondencija: Vodič za učenje autor Kirsanova Marija Vladimirovna

Leksičke greške 1. Nepravilna upotreba riječi i termina Većina grešaka u poslovnim pismima je leksička. Nepismenost dovodi ne samo do radoznalih gluposti, već i do apsurda.Zasebni pojmovi i stručne sleng riječi

Iz knjige Nova era - stare strepnje: politička ekonomija autor Yasin Evgeny Grigorievich

5 Naše greške Insistiramo da je odabrani kurs tržišnih reformi bio ispravan. I uopće nisu podbacili, samo su opet posrnuli. Ali bilo je grešaka i propusta. To su i naše greške i greške rukovodstva zemlje koje nismo uspjeli spriječiti. Greške - na mnogo načina

autor Curtis Face

Važnost veličine uzorka Kao što sam rekao, ljudi imaju tendenciju da se previše fokusiraju na rijetke pojave nekog fenomena, iako statistički nije moguće izvući mnogo informacija iz nekoliko pojava. Ovo je glavni razlog

Iz knjige Put kornjača. Od amatera do legendarnih trgovaca autor Curtis Face

Reprezentativni uzorci Reprezentativnost naših testova za predviđanje budućnosti određena je dva faktora: – Broj tržišta: Testovi sprovedeni na različitim tržištima će najvjerovatnije uključivati ​​tržišta s različitim stupnjevima volatilnosti tipova

Iz knjige Put kornjača. Od amatera do legendarnih trgovaca autor Curtis Face

Veličina uzorka Koncept veličine uzorka je jednostavan: da biste izveli statistički valjane zaključke, morate imati dovoljno velik uzorak. Što je uzorak manji, to su grublji zaključci koji se mogu izvući; Što je veći uzorak, to su zaključci bolji. Nema

On predstavlja takvu nesklad između prosjeka uzorka i opšte populacije, koja ne prelazi ± b (delta).

Na osnovu P. L. Čebiševljeve teoreme srednja vrijednost greške u slučaju nasumične ponovne selekcije, izračunava se po formuli (za prosječnu kvantitativno svojstvo):

gdje je brojilac varijansa karakteristike x u uzorku;
n je veličina uzorka.

Za alternativnu karakteristiku, formula za srednju grešku uzorkovanja za proporciju prema teoremi J. Bernoullija izračunato po formuli:

gdje je p(1 - p) varijansa udjela atributa u općoj populaciji;
n - veličina uzorka.

Zbog činjenice da varijansa osobine u opštoj populaciji nije tačno poznata, u praksi se koristi vrednost varijanse koja se za populaciju uzorka izračunava na osnovu zakon velikih brojeva. Prema ovom zakonu, uz veliku veličinu uzorka, uzorak precizno reproducira karakteristike opšte populacije.

Dakle, formule za proračun srednja greška u slučajnom ponovnom uzorkovanju izgledat će ovako:

1. Za prosječnu kvantitativnu osobinu:

gdje je S^2 varijansa karakteristike x u uzorku;
n - veličina uzorka.

gdje je w (1 - w) varijansa proporcije osobine koja se proučava u populaciji uzorka.

U teoriji vjerovatnoće je pokazano da se ona izražava kroz uzorak prema formuli:

U slučajevima mali uzorak, kada je njegov volumen manji od 30, potrebno je uzeti u obzir koeficijent n/(n-1). Tada se prosječna greška malog uzorka izračunava po formuli:

Budući da se u procesu nerepetitivnog uzorkovanja smanjuje broj jedinica opće populacije, u gornjim formulama za izračunavanje prosječne greške uzorkovanja, korijenski izraz se mora pomnožiti sa 1- (n/N).

Formule proračuna za ovu vrstu uzorka će izgledati ovako:

1. Za prosječnu kvantitativnu osobinu:

gdje je N obim opće populacije; n - veličina uzorka.

2. Za dijeljenje (alternativna funkcija):

gdje je 1- (n/N) udio jedinica u opštoj populaciji koje nisu bile uključene u uzorak.

Pošto je n uvijek manje od N, dodatni faktor 1 - (n/N) uvijek će biti manji od jedan. To znači da će prosječna greška za neponovljivu selekciju uvijek biti manja nego za ponovljenu selekciju. Kada je udio jedinica opšte populacije koje nisu bile uključene u uzorak značajan, tada je vrijednost 1 - (n/N) blizu jedan, a onda se prosječna greška izračunava prema opštoj formuli.

Prosječna greška zavisi od sljedećih faktora:

1. Kada je princip slučajnog odabira ispunjen, prosječna greška uzorkovanja je određena, prvo, veličinom uzorka: što je veći broj, to su manje vrijednosti srednja greška uzorkovanja. Opšta populacija se preciznije karakteriše kada više jedinica ove populacije pokriva posmatranje uzorka

2. Prosječna greška takođe zavisi od stepena varijacije karakteristika. Stepen varijacije karakteriše . Što je manja varijacija karakteristike (disperzija), manja je prosječna greška uzorkovanja. Sa nultom varijansom (atribut ne varira), prosječna greška uzorkovanja je nula, tako da će bilo koja jedinica opće populacije karakterizirati cijelu populaciju prema ovom atributu.



greška: Sadržaj je zaštićen!!