Odaberite Stranica

Sekundarno grupisanje. Sažetak i grupisanje statistike

Svrha: formiranje znanja o metodama klasifikacije i sistematizacije primarnih podataka i metodama za proračun opštih karakteristika predmeta proučavanja.

Zadaci:

Proširiti pojmove statističkog sumiranja i grupisanja, prikazati faze njihove implementacije;

Sažmite tehnike za građenje grupa, odredite vrijednost različite vrste grupiranje u svrhu sistematizacije podataka;

Prikazati osnovne principe konstruisanja statističkih tabela;

Proširiti koncept serije distribucije, predstaviti glavne indikatore distribucije i pravila za crtanje grafikona.

Statističke metode klasifikacije i grupisanja

Statistički sažetak- ovo je proces sumiranja primarnih podataka o svakoj jedinici proučavane populacije, dobijenih tokom statističkog posmatranja, kako bi se identifikovale tipične karakteristike i obrasci fenomena/procesa koji se proučava u cjelini.

Ovaj zadatak se realizuje izračunavanjem ukupnih vrednosti za pojedine delove populacije (grupe) i za populaciju u celini, što rezultira sistemom statističkih indikatora.

Dakle, proces sumiranja statističkih podataka podijeljen je u sljedeće faze:

1. Grupisanje statističkih podataka;

2. Proračun sistema indikatora;

3. Tabelarni i grafički prikaz rezultata.

Kompleks gore navedenih operacija ponekad se naziva složenim sažetkom. U ovom slučaju, jednostavan sažetak se razumije kao skup operacija za izračunavanje ukupnih vrijednosti.

Za ispravnu implementaciju svih faza sažetka, njima mora prethoditi sveobuhvatna teorijska analiza fenomena/procesa koji se proučava.

Masovni fenomeni/procesi koji su predmet statističkog proučavanja sastoje se od mnogo zasebnih činjenica, od kojih svaka ima oboje. zajedničke karakteristike i širok spektar individualnih karakteristika. Razlike u svojstvima pojedinih jedinica posmatranja određuju potrebu za njihovim grupisanjem.

Kao faza u izgradnji statističkog rezimea, grupisanje je najvažnija, a ujedno i jedna od najsloženijih statističkih metoda koja određuje ispravnost naknadnih proračuna i zaključaka.

Statističko grupisanje- ovo je proces podjele skupa jedinica proučavane populacije na dijelove prema određenim karakteristikama koje su im bitne kako bi se dobile kvalitativno homogene (u određenom pogledu) grupe.

Tehnički, proces grupisanja statističkih podataka sastoji se od sljedećih koraka:

1. Izbor atributa grupisanja;

2. Rangiranje stanovništva prema odabranom atributu grupisanja;

3. Određivanje broja grupa;

4. Određivanje veličine intervala;

5. Raspodjela jedinica stanovništva po formiranim grupama.

Grupni znak, odnosno osnova grupisanja, bitna je teorijski utemeljena karakteristika po kojoj se pojedine jedinice proučavane populacije dijele u grupe.


Izbor osnove grupisanja određen je svrhom statističke studije. Značaj znaka znači da on odražava najkarakterističnije karakteristike proučavane pojave u specifičnim uslovima mjesta i vremena. Dakle, karakteristika grupisanja može biti odabrana samo kao rezultat teorijske analize.

Grupisanje se može zasnivati ​​i na kvalitativnim i na kvantitativnim karakteristikama. Kvalitativni (atributski) znaci odražavaju stanje jedinice posmatranja (na primjer, pol osobe, privredna grana, oblik vlasništva preduzeća, itd.). Kvantitativne karakteristike imaju numerički izraz (na primjer, devizni kurs, starost osobe, prihod porodice, itd.).

Kvantitativni znaci, zauzvrat, mogu biti diskretni i kontinuirani. Diskretni indikatori uzimaju ograničen broj mogućih vrijednosti između kojih ne može biti međuvrijednosti (na primjer, broj djece u porodici, broj soba u stanu, broj turističkih putovanja, itd.) . Kontinuirani indikatori, obično dobijeni kao rezultat mjerenja i proračuna, mogu poprimiti beskonačan broj vrijednosti, tj. moguće su međuvrijednosti između pojedinačnih vrijednosti kontinuiranog indikatora (na primjer, masa proizvoda, visina osobe itd.).

Istovremeno, važno je uzeti u obzir da se u procesu statističkog posmatranja diskretne karakteristike često ponašaju kao kontinuirane i obrnuto. Dakle, diskretni znak "broj stanovnika" u procesu posmatranja i registracije u određenom trenutku se odmah mijenja, pa se u priručniku nalaze prosječne i zaokružene informacije. Ili suprotna situacija, kada je karakteristika koja je u suštini kontinuirana, rezultat operacije, fiksirana u određenom trenutku.

Poziva se grupisanje zasnovano na jednoj osobini jednostavno. Međutim, složenost socio-ekonomskih pojava može zahtijevati istovremeno proučavanje strukture stanovništva prema nekoliko karakteristika uzetih u kombinaciji (na primjer, proučavanje starosne i polne strukture stanovništva). Onda je u pitanju složeno grupisanje.

Prilikom izgradnje složeno grupisanje treba imati na umu da sa povećanjem broja karakteristika grupisanja, broj grupa naglo raste. Ovo zauzvrat smanjuje vidljivost konačnog grupisanja i statističku stabilnost izračunatih indikatora.

Kompleksne grupe mogu biti kombinovane i višedimenzionalne.

Tehnička zgrada kombinovano grupisanje sastoji se u sekvencijalnoj raspodjeli u grupe prema jednom atributu, zatim svaka grupa u podgrupe prema drugom atributu, itd. U pravilu počinju s atributivom karakteristikom, čije se grupe kvalitativno razlikuju jedna od druge. U tabeli je prikazano kombinovano grupisanje stanovništva prema polu i starosti.

Iz tabele, uz gotovo istu distribuciju muškaraca i žena po starosnim grupama predškolskog, školskog i radnog uzrasta, uočava se nagli pad broja muškaraca starijih od radnog uzrasta u odnosu na žene. Uglavnom zbog ovoga starosnoj grupi Ukupna ženska populacija brojčano je veća od muške populacije.

Table

Distribucija stanovništva po polu i starosti u 2008

br. p / str Grupe stanovništva prema spolu Uključujući podgrupe stanovništva prema starosti Broj, hiljade ljudi
Muškarci uzrasta 0-6 godina 5 184,8
starosti 7-15 godina 6 336,2
radnog uzrasta 45 928,7
8 267,4
TOTAL za grupu 65 717,1
Žene uzrasta 0-6 godina 4 918,5
starosti 7-15 godina 6 057,9
radnog uzrasta 43 822,9
stariji od radnog uzrasta 21 492,5
TOTAL za grupu 76 291,8
TOTAL po podgrupama uzrasta 0-6 godina 10 103,3
starosti 7-15 godina 12 394,1
radnog uzrasta 89 751,6
stariji od radnog uzrasta 29 759,9
TOTAL 142 008,9

Multidimenzionalno grupisanje gradi se ne sekvencijalno, već istovremeno na velikom broju karakteristika kako bi se formirale kvalitativno homogene grupe na osnovu određene procedure za procenu blizine objekata.

Klasifikacija- ovo je standardno ili normativno grupisanje, koje se sastoji u podjeli pojedinačnih pojava na grupe, klase, kategorije, odjeljke, tipove itd. na osnovu njihovih sličnosti i razlika. Glavne karakteristike klasifikacije su sljedeće. Prvo, osnova klasifikacije je kvalitativni znak. Drugo, podjela na razrede ima opšteprihvaćen standardni karakter i ne zavisi od ciljeva studija.

Treće, klasifikacije su stabilne, tj. ne mijenjaju se u dužem vremenskom periodu (promjene nastaju tek pojavom novih klasa, kategorija itd.). Federalna služba Državna statistika Rusije (Rosstat) održava nekoliko klasifikatora (šifriranih spiskova objekata). Na primjer, makroekonomska statistika koristi klasifikaciju tipova ekonomska aktivnost, statistika rada - klasifikacija zanimanja i dr.

Nakon utvrđivanja osnove grupisanja, statistička populacija koja se proučava se rangira prema atributu grupisanja, tj. sve jedinice promatranja su raspoređene u rastućem ili opadajućem redoslijedu vrijednosti odabrane karakteristike.

Broj grupa određen je sledećim faktorima: ciljevima studije, osnovom grupisanja, veličinom populacije, stepenom varijabilnosti (varijabilnosti) osobine.

U zavisnosti od svrhe istraživanja, ista populacija se može podijeliti u različit broj grupa.

Na primjer, grupisanje studenata prema rezultatima ispitne sesije može se napraviti u dvije grupe, ako je zadatak studije da identifikuje one koji rade dobro i one koji ne rade dobro iz nekog predmeta; u tri grupe, ako je zadatak identifikovati neuspešne, koji su dobili „zadovoljavajuće“ i koji su na vreme za „dobro“ i „odlično“ itd.

Odabrani atribut grupisanja također utječe na broj odabranih grupa.

Dakle, ako je osnova grupisanja kvalitativna karakteristika, onda je broj grupa određen brojem gradacija, tipova, stanja ove karakteristike. Na primjer, grupisanje stanovništva prema polu (kvalitativni atribut) može se izvršiti samo u dvije grupe: muškarci i žene; grupisanje broja putovanja u inostranstvo prema svrsi putovanja - u pet grupa: poslovna, turistička, privatna, tranzitna, uslužno osoblje itd.

Grupisanje, izgrađeno na kvantitativnoj osnovi, može biti diskretno i intervalno. IN diskretno grupisanje svaka grupa predstavlja određenu vrijednost karakteristike, u interval- raspon mogućih vrijednosti.

Ova podjela možda ne odgovara prirodi grupisane kvantitativne osobine (diskretne ili kontinuirane). Diskretno obilježje može se grupirati u intervalima ako je broj njegovih mogućih gradacija prevelik da ih sve razdvoji u zasebne grupe. Na primjer, grupiranje odraslih prema veličini cipela zahtijevalo bi najmanje 13 grupa (veličine od 33 do 45).

U ovom slučaju poželjno je kombinovati, na primjer, dvije veličine u grupi, formirajući tako intervalno grupiranje. Ako je broj mogućih vrijednosti diskretnog atributa mali, tada konačno grupiranje može biti idealno homogeno prema ovom atributu (na primjer, grupiranje porodica prema broju djece). Kada se konstruiše intervalno grupisanje, kreirane grupe će biti samo manje ili više homogene.

Tabela prikazuje diskretno grupisanje domaćinstava prema atributu „broj djece“. Iz tabele se vidi da se povećanjem broja djece u porodici redistribuira udio domaćinstava sa povećanjem broja onih čije su subjektivne ocjene uslova života negativne. Istovremeno, u svim grupama po broju djece, više od polovine domaćinstava svoje životne uslove karakteriše samo kao „zadovoljavajuće“.

U tabeli je prikazano intervalno grupisanje automobila na osnovu "starosti". Iz tabele se vidi da je 2006-2007. došlo do blage preraspodjele udjela "srednjedobnih" automobila u korist "mlađih" automobila. Istovremeno, udio "starih" automobila ostao je praktički nepromijenjen, čineći nešto manje od polovine cjelokupnog voznog parka.

Distribucija domaćinstava sa djecom mlađom od 16 godina prema stepenu zadovoljstva stambenim uslovima u 2007. godini (u procentima od ukupnog broja domaćinstava u odgovarajućoj kategoriji)

1) na osnovu materijala statističke zbirke „Socijalni status i životni standard stanovništva Rusije. 2008"

Starosna struktura parkinga 2006-2007 (na kraju godine, u procentima od ukupnog broja) 1

1) na osnovu materijala statističke zbirke „Socijalni status i životni standard stanovništva Rusije. 2008"

Određivanje broja grupa za kvantitativno svojstvo zavisi od stepena homogenost statistički agregat.

Ako je početni skup kvalitativno heterogen, tada se prilikom konstruisanja grupisanja prema kvantitativnom atributu određuju granice grupa gdje količina prelazi u novi kvalitet.

Ako je proučavana populacija kvalitativno homogena, tada su veličina populacije i nivo fluktuacije grupne osobine od odlučujućeg značaja za određivanje broja grupa. Konačni kriterij u ovom slučaju je da se dobiju što homogenije, a dovoljno popunjene grupe.

Svaka formirana grupa treba da bude „obezbeđena“ dovoljnim brojem zapažanja, jer se poništavanje slučajnog i identifikacija opšteg, suštinskog za pojavu/proces koji se proučava, dešava samo kada se računa za dovoljno velike grupe. Pokazatelji izračunati za male grupe neće biti tačni i stabilni.

Ceteris paribus, što je veći stepen varijabilnosti osobine, to treba formirati više grupa, jer će to doprineti preciznijem opisu prirode objekta/procesa koji se proučava. Međutim, previše grupa otežava identifikaciju obrazaca i automatski rezultira manjim brojem opservacija u svakoj grupi, što će smanjiti statističku stabilnost naknadno izračunatih indikatora.

Tehnike izgradnje grupa.

Standardne statističke procedure mogu se koristiti za određivanje broja grupa. Najčešći od njih zasniva se na upotrebi formule američkog naučnika Sturgess :

Ograničenje Sturgessove formule je potreba za velikim brojem opažanja i bliskost distribucije grupne osobine normalnoj.

Nakon utvrđivanja broja formiraju se grupe intervali grupisanja- vrijednosti atributa koje leže u određenim granicama.

Vrijednost intervala je razlika između gornje i donje granice intervala, tj. maksimalne i minimalne vrijednosti, respektivno.

Označavanje granica intervala zavisi od prirode grupisanog obeležja. Ako je kontinuirana karakteristika postavljena na osnovu grupiranja, onda je gornja granica i-ti interval se poklapa sa donjom granicom i+1 th. Ako je diskretna karakteristika grupirana, onda je donja granica i+1-ti interval je jednak gornjoj granici i-th plus 1. Tabela pokazuje granice grupa u distribuciji ljudi po godinama. U opciji I, starost se podrazumijeva kao kontinuirana količina, au varijanti II - kao diskretna. U ovom primjeru, u oba slučaja, širina intervala je ista i iznosi 10 godina.

Opcije za izgradnju grupa za obilježje "dob"

Po prisutnosti granica razlikuju se otvoreni i zatvoreni intervali. Otvoreni intervali nazivaju se intervali za koje je definirana samo jedna granica: gornja (ako je interval prva) ili donja (ako je interval zadnja). Obje granice su definirane u zatvorenim intervalima.

Za naknadne proračune, pretpostavlja se da je vrijednost otvorenog intervala jednaka vrijednosti intervala koji se nalazi uz njega. Dakle, u verziji I tabele, vrijednost prvog intervala se uzima jednakom vrijednosti drugog, a posljednjeg - vrijednosti pretposljednjeg, tj. deset godina.

Ako se, prema ovom pravilu, pokaže da otvoreni interval počinje da uključuje teoretski nemoguće vrijednosti, tada njegovu širinu treba odrediti logikom pojave/procesa. Na primjer, u tabeli vrijednost drugog intervala je četiri minuta. Ni u ovom slučaju vrijednost otvorenog intervala ne može biti jednaka četiri minute, jer bi to značilo da bi donja granica prvog intervala bila negativna, što je nemoguće u odnosu na vremensku karakteristiku. Dakle, kao prvi interval, logično je uzeti raspon od nula do tri minuta.

Grupiranje operatera dispečera prema prosječnom vremenu obrade narudžbe (uvjetne brojke)

Prilikom formiranja granica prema tipu prikazanom u opciji I tabele, potrebno je odrediti kojim grupama pripadaju jedinice promatranja, vrijednosti karakteristike za koje se poklapaju s graničnim. Da bi se to postiglo, određuje se koja će se granica, donja ili gornja, formirati po principu "inkluzivnog", a koja - po principu "isključivo". Odabrani pristup treba implementirati na isti način za sve intervale. Za određenost, mogu se koristiti i otvoreni intervali. U našem primjeru, donja granica je formirana prema „inkluzivnom“ principu, a gornja je „isključivo“.

Prema veličini intervala jednak interval(interval je isti za sve grupe) i nejednak interval(veličina intervala varira od grupe do grupe) grupisanja. Grupacije nejednakih intervala se, pak, dijele na progresivno rastuće/opadajuće, jednako popunjene, specijalizirane i proizvoljne.

Ako se ispitivana osobina razlikuje u relativno uskim granicama i njena distribucija je manje-više ujednačena, tada je preporučljivo izgraditi grupiranje u jednakim intervalima. Vrijednost intervala je određena formulom:

Prilikom određivanja raspona varijacije važno je da maksimalne i/ili minimalne vrijednosti nisu u nekom smislu „anomalne“, tj. jako se razlikuje od susjednih vrijednosti atributa. U suprotnom, trebali biste odrediti razliku u vrijednostima koje su nešto veće od minimalne i manje od maksimuma.

Ako dobijena vrijednost intervala zahtijeva zaokruživanje, onda je treba nadograditi, a ne smanjiti, inače neka od zapažanja možda neće upasti u konačno grupiranje.

Na primjer, neka se statistička populacija sastoji od 40 turističkih kompanija čiji prihodi variraju od 50 miliona do 650 miliona dolara, što je minimalna i maksimalna vrijednost karakteristike. Tada, prema Sturgessovoj formuli, dobijamo: . Vrijednost intervala za konstruiranje grupacije jednakih intervala određuje se na sljedeći način: (miliona dolara). Dakle, ukupnost kompanija će biti podeljena po prihodu u šest jednakih grupa: , , , , , (miliona dolara).

Iako su grupe sa jednakim intervalima poželjnije zbog jednostavnosti njihove naknadne obrade, priroda promjene u većini društveno-ekonomskih pojava ne ispunjava zahtjeve za grupiranje u jednakim intervalima. Ako se ispitivana osobina značajno i neujednačeno razlikuje, potrebno je izgraditi nejednako intervalno grupiranje.

Jedan od mogućih pristupa formiranju granica grupe zasniva se na upotrebi aritmetičke ili geometrijske progresije. U ovom slučaju, intervali su određeni formulama, respektivno.

Ovaj pristup određivanju veličine intervala može se koristiti, na primjer, pri grupisanju gradova prema broju stanovnika. Nemogućnost konstruisanja ravnointervalne grupe u ovom slučaju povezuje se sa velikim brojem slabo naseljenih gradova i malim brojem „gradova sa milion stanovnika“.

Po pravilu, u proučavanju prihoda na osnovu rezultata aktivnosti kompanije u bilo kojoj industriji, „progresivni“ pristup je prikladniji od formiranja jednakim intervalima. Ovo je diktirano činjenicom da broj malih preduzeća sa malim prihodima značajno premašuje broj velikih preduzeća sa visokim stopama.

gore opisano tehničkim načinima definicije veličine intervala ne garantuju da neće biti malih grupa ili čak „praznih“ u koje nije upalo nijedno posmatranje. Ako se to dogodi, potrebno je promijeniti broj grupa i/ili vrijednosti intervala, jer takvo grupisanje nije ispravno.

Da bi se osigurala statistička stabilnost indikatora izračunatih za pojedinačne grupe, može se koristiti ravnopravno grupisanje, u kojoj je broj zapažanja u svakoj grupi približno isti i određen je formulom:

Ako je primljeno n nije cijeli broj i/ili postoje ponovljene vrijednosti obilježja u agregatu, tada se broj opažanja u svakoj grupi može razlikovati. Istovremeno, potrebno je nastojati da ove razlike budu beznačajne.

Ako je za realizaciju istraživačkih zadataka potrebno utvrditi granice grupa u kojima kvantitet prelazi u novi kvalitet, koriste se specijalizovani intervali. Dakle, u grupisanju stanovništva prema starosti, radi procjene radnih resursa, granice starosnih grupa mogu se uspostaviti prema kategorijama: mlađi od radnog uzrasta (do 16 godina), radno sposoban (za žene od 16 do 54 godine). , za muškarce od 16 do 59 godina) i starije od radne dobi (za žene preko 54 godine, za muškarce preko 59 godina).

Granice grupe se također mogu proizvoljno definirati kada nijedna od gore navedenih metoda nije dala dobre rezultate.

Završna faza izgradnje grupisanja je podjela jedinica statističke populacije koja se proučava u grupe prema odabranom (jednom ili više) atributu grupisanja.

grupisanje zadataka. Tipološka, ​​strukturna, analitička i kombinaciona grupisanja.

Metoda grupisanja nam omogućava da riješimo sljedeće probleme:

1. Identifikacija socio-ekonomskih tipova pojava;

2. Proučavanje strukture pojave i strukturnih promjena u njoj;

3. Identifikacija povezanosti i zavisnosti između pojava.

U zavisnosti od zadataka koji se rešavaju, razlikuju se sledeće vrste grupisanja: tipološka, ​​strukturna, analitička grupisanja.

Tipološko grupisanje- ovo je proces podjele proučavane kvalitativno heterogene populacije u homogene grupe koje karakteriziraju socio-ekonomske tipove fenomena.

Budući da su, u stvari, klasifikacija, tipološke grupe se obično izgrađuju u prvoj fazi generalizacije primarnih statističkih informacija, koja je najčešće heterogena. Istovremeno, važno je shvatiti da, u zavisnosti od svrhe istraživanja, ista populacija može biti kvalitativno homogena i heterogena. Na primjer, skup industrijskih preduzeća je homogen za potrebe procjene bilo kakvih proizvodnih karakteristika i heterogen za procjenu oporezivanja, budući da ovo drugo zavisi od oblika vlasništva, dostupnosti pogodnosti itd.

Primjeri tipoloških grupisanja su grupisanje stanovništva po društvenim grupama, preduzeća prema obliku vlasništva, vrstama privredne djelatnosti itd.

Proučavanje postojećih tipova društveno-ekonomskih pojava u dinamici omogućava da se identificiraju promjene u odnosima između njih, pojava novih tipova ili smrt starih.

Prilikom konstruisanja tipološke grupe, identifikacija tipova proučavanog socio-ekonomskog fenomena treba da se zasniva na njegovoj sveobuhvatnoj teorijskoj analizi, koja je često veoma teška zbog nejasnih razlika među tipovima.

Tipološko grupisanje može se zasnivati ​​i na kvalitativnom i na kvantitativnom obilježju. U ovom slučaju, uspostavljanje granica intervala ne može biti proizvoljno, već je određeno tačkama prijelaza iz jednog tipa u drugi, tj. su specijalizovani.

Tipološko grupiranje je prikazano u tabeli. U ovom primjeru se izdvaja pet grupa (tipova) u karakterističnom "oblici vlasništva". Analiza indikatora prosječnog godišnjeg broja zaposlenih u dinamici omogućava nam da pratimo pojavu nove vrste fenomena. Vidi se da 1980. godine mnogi oblici svojine nisu postojali, a od 1990. godine došlo je do značajnog smanjenja broja zaposlenih u državnim i općine uz istovremeno povećanje zaposlenosti u privatnim i stranim i zajedničkim kompanijama. Pošto u isto vreme ukupan broj zaposlenost se nije mnogo smanjila, možemo zaključiti da su takve promjene nastale kao rezultat „tranzicije“ zaposlenih iz jedne oblasti u drugu.

Prosječan godišnji broj zaposlenih u privredi prema vrsti vlasništva (hiljada ljudi)

Strukturno grupisanje- ovo je proces podjele kvalitativno homogene populacije u grupe koje karakteriziraju strukturu fenomena koji se proučava prema nekoj promjenjivoj osobini.

Primjeri strukturnih grupacija su grupisanje stanovništva prema starosti, mjestu stanovanja; preduzeća po broju zaposlenih, troškovima osnovnih sredstava itd.

Proučavanje strukture društveno-ekonomskog fenomena uključuje analizu ne samo njegovih sastavni dijelovi, ali i odnosi između njih i promjene u tim odnosima tokom vremena.

Glavni zahtjev za formirane grupe u formiranju strukturne grupacije je sprječavanje alokacije "praznih" i malih intervala. Pretpostavlja se da prva i posljednja grupa mogu sadržavati mali broj zapažanja. Ako se takvi "propadanja" javljaju u srednjim intervalima, najčešće to ukazuje da je došlo do mješavine. različite vrste fenomena i početni skup je kvalitativno heterogen.

Strukturno grupiranje vam omogućava da izvučete zaključke o tome koje su vrijednosti u ispitivanoj populaciji najčešće, a koje - najmanje; kakva je priroda promjene u strukturi stanovništva u cjelini (ujednačena ili neujednačena).

Strukturno grupiranje je prikazano u tabeli. Ove grupe pokazuju da je 2005. godine više od 49% stanovništva imalo prosječan prihod po glavi stanovnika ispod 6.000 rubalja. mjesečno, a preostalih nešto više od 50% bilo je gotovo ravnomjerno raspoređeno na četiri grupe prihoda od 6.000 do 20.000 rubalja. Mjesečno.

Naredne tri godine pokazuju određenu preraspodjelu udjela stanovništva iz grupa sa niskim primanjima u korist „srednje klase“ i pojavu grupa sa višim prihodima. Međutim, iz ovih podataka se ne može izvući konačan zaključak, jer je vrijednost prosječnog novčanog dohotka po stanovniku ovdje prikazana u nominalnom iznosu, tj. nije prilagođen za indeks potrošačke cijene. Stoga je za analizu potrebno ove podatke uporediti sa realnim prihodima stanovništva.

Distribucija stanovništva prema prosječnom novčanom dohotku po glavi stanovnika (procenat) 1

Čitava populacija, uključujući i one sa prosječnim novčanim prihodima po glavi stanovnika, rub. Mjesečno:
do 4000.0 28,9 20,5 14,3 9,8
4000,1-6000,0 20,3 17,7 14,8 12,0
6000,1-8000,0 14,9 14,7 13,6 12,1
8000,1-10000,0 10,3 11,2 11,3 10,9
10000,1-15000,0 13,9 17,1 19,1 20,1
15000,1-20000,0 11,7 8,4 10,6 12,4
20000,1-30000,0 ... 10,4 9,6 12,4
preko 30000.0 ... ... 6,7 10,3

Analitičko grupisanje- ovo je grupiranje koje vam omogućava da identificirate prisutnost odnosa između različitih karakteristika fenomena koji se proučava i smjera ovog odnosa.

Proces konstruisanja analitičkog grupisanja podrazumeva podelu svih karakteristika proučavane populacije u dve grupe: faktorske, koje utiču na druge karakteristike, i efektivne, koje se menjaju pod tim uticajem.

Za razliku od drugih statističkih metoda analize odnosa, analitičkim grupama se nameće samo jedan zahtjev - kvalitativna homogenost populacije.

U zavisnosti od dubine proučavanja odnosa, može se izgraditi stvarno analitičko grupisanje, kombinaciono grupisanje i višedimenzionalno grupisanje.

Konstrukcija stvarnog analitičkog grupiranja sastoji se od podjele kvalitativno homogene populacije u grupe prema faktorskom atributu i izračunavanja prosječne vrijednosti jednog ili više efektivnih atributa za ove grupe kako bi se identificirao odnos između njih i odredio njegov smjer. . Kada grupišu faktor atributa, oni pokušavaju da formiraju jednake ili jednako popunjene intervale.

Sistematsko povećanje ili smanjenje prosječne vrijednosti efektivnog atributa kao rezultat povećanja vrijednosti faktorskog atributa potvrđuje prisustvo između njih direktnog ili povratne informacije respektivno. Nesistematska promjena prosječne vrijednosti rezultirajuće osobine ukazuje na nepostojanje veze s ovim faktorom.

kombinovano grupisanje omogućava detaljniju procjenu odnosa između karakteristika i smjera ovog odnosa. Konstrukcija kombinacionog grupisanja za opisivanje odnosa dva znaka sastoji se u sekvencijalnoj podeli grupa faktorskog znaka u podgrupe rezultantnog znaka. Poželjno je da intervali formiranih grupa budu jednaki ili podjednako popunjeni.

Za procjenu prisutnosti i smjera komunikacije analiziraju se maksimalne frekvencije u kolonama ili redovima. Ako se nalaze duž dijagonale koja ide od gornjeg lijevog ugla do donjeg desnog, tada je odnos između obilježja direktan i blizak linearnom. Ako su maksimalne frekvencije na suprotnoj dijagonali (od gornjeg desnog ugla do donjeg lijevog), tada je odnos inverzan i blizak linearnom. Ako je lokacija maksimalnih frekvencija haotična, nema veze između znakova.

Multidimenzionalno grupisanje omogućavaju procjenu višesmjernih odnosa velikog broja karakteristika.

Grupacije izgrađene za različite subjekte u istom vremenskom periodu ili za jedan predmet u dinamici omogućavaju analizu promjena u karakteristikama fenomena koji se proučava u raznim uslovima mjesto i vrijeme, respektivno. Istovremeno, u svrhu poređenja, grupacije se moraju dovesti u uporediv oblik. Ovaj problem se rješava metodom sekundarno grupisanje . Istovremeno, ova metoda otklanja problem uporedivosti samo u pogledu razlika u broju grupa i veličini intervala i ne tiče se pitanja uporedivosti početnih podataka i postupka posmatranja.

Za razliku od primarno grupisanje, koji se formira na osnovu primarnih podataka, materijal za sekundarni je prethodno izvršeno grupisanje.

dakle, sekundarno grupisanje- ovo je proces pregrupisavanja već postojećeg grupisanja, tj. stvaranje novih grupa na njenoj osnovi.

Tehnički, sekundarno grupisanje se može izvršiti na jedan od dva načina: kombinovanjem originalnih intervala ili delimičnim preuređivanjem.

Unija početnih intervala se koristi kada se prelazi sa manjih na veće intervale, ako se nove granice poklapaju sa starim.

Zajedničko pregrupisavanje se koristi ako je, da bi se odredila određena grupa unutar novih granica, potrebno odrediti koji će dio populacijskih jedinica preći iz starih grupa u nove. Tehnički, pregrupisavanje udjela sastoji se u dodjeljivanju određenog udjela jedinica stanovništva svakoj grupi i raspodjeli tog udjela duž novih granica, pod pretpostavkom da je raspodjela populacijskih jedinica unutar svake grupe ujednačena.

Statističke tabele. Njihove vrste i principi izgradnje.

U drugoj fazi, redukcija podataka prelazi na izračunavanje ukupnih vrijednosti za grupe i populaciju u cjelini. Prethodno su rezultati grupisanja zgrada sastavljeni na tabelarni način.

Statistička tabela- ovo je tabela koja sadrži zbirne numeričke karakteristike proučavane populacije prema jednom ili više logički međusobno povezanih karakteristika.

Osnova (kostur) statističke tabele prikazana je na sl.

Naslov tabele* (opći naslov)

*Napomene uz tabelu

Predmet statističke tabele je predmet proučavanja karakteriziran brojevima. To mogu biti jedinice populacije, grupe jedinica ili populacija u cjelini. Na primjer, firme, regije, vremenski periodi, itd. Obično se predmet tabele nalazi na lijevoj strani, u nazivu redova.

Predikat statističke tabele- ovo je sistem indikatora, koji je rezultat sažetka i karakterizira predmet proučavanja. Obično je predikat predstavljen naslovima, tj. imena kolona, ​​koja su raspoređena s lijeva na desno u logičkom nizu.

Opšti naslov je glavni sadržaj tabele, predstavljen u sažetom i jasnom obliku, sa naznakom mesta i vremena na koje se informacije sadržane u njoj odnose.

U zavisnosti od prirode predmeta, postoje jednostavne, grupne i kombinovane statističke tabele.

Predmet jednostavna tabela je jednostavna lista objekata, teritorija, hronoloških datuma, tj. ne predviđa grupisanje jedinica posmatranja. Predmet grupni sto sadrži grupiranje jedinica stanovništva prema jednom kvantitativnom ili kvalitativnom atributu. Predmet kombinovana tabela sadrži sekvencijalno grupisanje populacijskih jedinica istovremeno prema više karakteristika, tj. kombinovana grupa.

U zavisnosti od dubine razvoja predikata, razlikuju se jednostavne i složene statističke tabele. Jednostavnim razvojem predikata, indikator koji ga formira ne dijeli se na podgrupe. Složen razvoj predikata, naprotiv, uključuje takvu podjelu koja omogućava da se svaka grupa ili jedinica objekta karakterizira različitom kombinacijom karakteristika.

Prilikom kreiranja statističke tabele, morate se pridržavati sljedećih pravila:

1. Kompaktnost i preglednost tabele; nedostatak suvišnih, sekundarnih podataka; prezentovani podaci treba da direktno odražavaju fenomen koji se proučava;

2. Kratkoća formulacije svih naslova tabele;

3. Označavanje mjernih jedinica za sve indikatore: u naslovu, ako su isti, iu nazivima redova i kolona, ​​ako su različiti; upotreba općeprihvaćenih skraćenica: osoba, rub. itd.;

4. Formiranje objedinjujućih naslova uz prisustvo opštih pojmova u nazivima subjekta ili predikata;

5. Lokacija međusobno povezanih podataka u susjednim kolonama;

6. Logika u slijedu elemenata subjekta i predikata (od posebnog do opšteg, od apsolutnih vrijednosti do prosječnih i relativnih, itd.);

7. Isti stepen tačnosti zaokruživanja brojčanih podataka;

8. Ispravan prikaz nedostatka podataka: crtica - u odsustvu fenomena, "bez informacija" ili "..." - u odsustvu informacija o fenomenu; u ćelije koje se ne popunjavaju stavlja se „X“; ako je vrijednost manja od prihvaćene tačnosti, onda se stavlja (0,0) ili (0,00) i tako dalje.

9. Neophodnost ukupnog broja redova/kolona u grupnim i kombinovanim tabelama; ako popune tabelu, koriste riječi “Ukupno” ili “Ukupno”, ako je otvore, dopunjuju se riječima “uključujući” sa naknadnim specifikacijama.

Nakon čitanja tabele, tj. upoznavanje sa sadržajem, vrši se njegova analiza, koja se sastoji u identifikovanju karakteristika fenomena koji se proučava i glavnih trendova u njegovom razvoju. Procedura analize u ovom slučaju obično ide od opštih rezultata ka konkretnim, identifikujući najviše karakteristične karakteristike, upoređujući dijelove i formulišući opšte zaključke iz tabele.

Serija distribucije: diskretna, intervalna. Konstrukcija intervalnih serija. Frekvencije, frekvencije, gustine distribucije. kumulativne serije.

Sastavni dio operacija obrade podataka dobijenih grupisanjem je izgradnja distributivnog niza.

Raspon distribucije- ovo je uređena distribucija jedinica stanovništva u grupe prema nekim varijabilnim atributima.

Serija distribucije je konstruisana na osnovu principa statističkog grupisanja. Tehnički, ovo je implementirano korištenjem jednostavnog grupisanja karakteristika od interesa, u kojem se svakoj vrijednosti ili intervalu dodjeljuje broj jedinica stanovništva koje zadovoljavaju ovu vrijednost/interval.

Dakle, serija distribucije se sastoji od dva strukturni elementi: opcija i frekvencije i/ili frekvencije.

Opcija, je specifična vrijednost promjenljive karakteristike u seriji.

Frekvencija, - broj pojedinačne varijante ili svake grupe varijanti, koji pokazuje koliko se često ove vrijednosti pojavljuju u seriji distribucije. Zbir frekvencija za sve grupe jednak je obimu populacije, tj.:

Frekvencija, je učestalost, izražena kao dio jedinice ili kao postotak ukupne vrijednosti. Zbir frekvencija za sve grupe jednak je 1 odnosno 100%, tj.

U zavisnosti od osnovne osobine, razlikuju se atributivne i varijacione distributivne serije. Budući da je red distribucije, u stvari, grupisanje, tipovi distribucijskih serija u potpunosti odgovaraju mogućim gradacijama grupiranja opisanim gore.

Serija distribucije atributa- ovo je serija izgrađena na kvalitativnoj osnovi.

Serija distribucije varijacija je serija izgrađena na kvantitativnoj osnovi. Priroda varijacije potonjeg može biti diskretna ili kontinuirana. Shodno tome, razlikuju se diskretne i intervalne varijacione serije. Kao i kod grupiranja, ako je broj mogućih gradacija diskretne karakteristike velik, za nju se konstruiše intervalni varijacioni niz.

Na primjer, ako odaberete jednu godinu interesa, tabela se lako transformira u niz atributa distribucije zaposlenih prema vrsti vlasništva u odabranoj godini, a tabela u intervalne serije raspodjela stanovništva prema prosječnom dohotku po glavi stanovnika.

Proučavanje serije distribucije omogućava vam da identificirate prisutnost i odredite prirodu obrasca u promjeni frekvencija s promjenom vrijednosti promjenjivog atributa, tj. slijedite obrasce distribucije. Obrasci distribucije su dizajnirani da odražavaju glavna svojstva fenomena koji se proučava.

U ovom slučaju, zahtjev homogenosti za strukturne grupe postaje relevantan, inače će doći do mješavine distribucija koje odražavaju različite pojave. Indirektna potvrda toga može biti gore opisana varijanta pojave malih srednjih intervala pri grupisanju.

Identifikacija pravog uzorka može biti teška i netačna interpretacija rezultata konstruisanja intervala varijantne serije, koji može biti jednak intervalu ili nejednaki interval.

Kada se konstruiše serija varijacionih distribucija sa nejednakim intervalima, poređenje frekvencija po grupama je nezakonito, jer promena granica intervala može dovesti do potpuno suprotnih zaključaka. Stoga, da bi se pravilno odrazila distribucija osobine, potrebno je osloboditi se utjecaja vrijednosti intervala, koji se vrši pomjeranjem sa frekvencija/učestalosti na gustinu distribucije.

Apsolutna gustina distribucije, je frekvencija izračunata po jedinici intervala, tj.:

Relativna gustina distribucije, je frekvencija izračunata po jedinici intervala, tj.:

Da bi se mogle uporediti distribucije diskretnih i intervalnih vrijednosti, koristi se univerzalni pristup zasnovan na proračunu akumulirane frekvencije/frekvencije. Ove vrijednosti se određuju uzastopnim zbrajanjem frekvencija/učestalosti po grupama, sa ukupnim zbrojima izračunatim na kraju svake grupe.

Kumulativna frekvencija/frekvencija, / je broj/postotak jedinica stanovništva sa vrijednošću obilježja koja nije veća od navedene, tj.:

Ove veličine, koje se računaju u terminima učestalosti/učestalosti, ne mogu biti negativne (do početka prvog intervala uzimaju vrijednost "nula"), a njihov maksimum je ograničen obimom populacije. Do kraja posljednje grupe ovaj maksimum bi trebao biti dostignut. Kumulativna priroda akumuliranih frekvencija/frekvencija implicira da kako se vrijednosti grupe povećavaju, njihove veličine mogu samo rasti. Dakle,:

Ako se u nekoj grupi vrijednost akumulirane frekvencije / frekvencije poklapa s njenom prethodnom vrijednošću, tada grupa koja se razmatra ne sadrži niti jedno opažanje, tj. je "prazan", što ukazuje na potrebu za pregrupisavanjem.

Moguća je i obrnuta procedura - izračunavanje frekvencija/frekvencija kroz akumulirane frekvencije/frekvencije:

Grafički prikaz statističkih podataka.

Najpogodnije je analizirati distribucijske serije koristeći njihov grafički prikaz. Zajedno sa tabelama, graf je metoda sumiranja izvornih informacija. Grafikoni omogućavaju da se jasnije i lakše percipiraju karakteristike interesovanja, odnosa, trendova u proučavanoj pojavi.

Statistički grafikon- ovo je crtež koji prikazuje karakteristike određene statističke populacije koristeći geometrijske slike ili znakove. U statistici se koristi veliki broj grafičkih slika koje se razlikuju kako po izabranoj osnovi grafa (linearni, ravninski, volumetrijski), tako i po načinu konstrukcije (dijagrami, statističke karte).

Za ispravnu konstrukciju grafikona potrebno je pridržavati se niza pravila: od eksternog dizajna (naziv grafikona, oznake skale, objašnjenja) do formiranja glavnih elemenata grafikona (grafička slika, polje grafikona, prostorni i orijentiri).

U odnosu na distributivnu seriju, koriste se sljedeće grafičke slike: poligon, histogram, kumulat, žig. Svi ovi grafovi su izgrađeni u pravougaonom koordinatnom sistemu.

Poligon- grafički prikaz diskretne varijacione serije distribucije, dajući ideju o prirodi promjene njenih frekvencija. Da bi se konstruirao poligon, duž ose apscise, rangirane vrijednosti promjenjivog obilježja iscrtavaju se na istoj skali, duž ordinatne ose, frekvencije ili frekvencije.

Poligon je presjek apscise i ordinate, koji su ponekad povezani pravim linijama radi jasnoće, dobivajući izlomljenu liniju. Ako atribut varijable teoretski može poprimiti vrijednosti manje od registrovanog minimuma i/ili veće od registrovanog maksimuma, poligon se zatvara na x-osi u tim vrijednostima.

Tabela pokazuje diskretne serije distribucija sveruskog stambenog fonda po vrsti stanova. Poligon ove serije prikazan je na sl.

Rice. Poligonska raspodjela stambenog fonda po vrstama stanova u 2008

Histogram (trakasti dijagram) - grafički prikaz intervalne serije varijacije distribucije, dajući ideju o prirodi promjene njegovih frekvencija. Prilikom konstruiranja histograma, vrijednosti intervala odgovarajuće karakteristike iscrtavaju se duž osi apscise, a frekvencija, frekvencija ili gustoća distribucije duž ordinatne osi. Za serije sa jednakim intervalima mogu se koristiti i frekvencije/frekvencije i gustine, za serije sa nejednakim intervalima - samo gustine.

Histogram je pravokutnik čija je širina određena intervalima na osi apscise, a visina - vrijednostima frekvencija, frekvencija ili gustoća na osi ordinata.

Prilikom konstruisanja grafova za diskretne ili jednake intervalne distributivne serije, izbor između frekvencija i frekvencija određen je potrebom da se ovi grafovi porede za različite populacije (sa različitim brojem posmatranja) u istom koordinatnom sistemu. Ako je potrebno, frekvencije treba iscrtati duž y-ose.

U tabeli je prikazana serija intervalnih varijacija distribucije stanovništva u smislu novčanog dohotka po glavi stanovnika. Za ispravnu procjenu distribucije ove serije koristi se karakteristika gustine, jer niz nejednakih intervala. Na primjer, kada se procjenjuje po učestalosti/frekvenciji, čini se da je „najpopularniji“ interval od 10 do 15, međutim gustina frekvencije/frekvencije pokazuje da je u stvarnosti takav interval od 4 do 6. Histogram ove serije je prikazano na sl.

6 - 8 19,3 13,6 9,7 6,8 8 - 10 16,1 11,3 8,0 5,7 10 - 15 27,2 19,1 5,4 3,8 15 - 25 23,5 16,5 2,3 1,7 preko 25 14,4 10,1 1,4 1,0 TOTAL 142,2 100,0 - - -

1) na osnovu materijala statističke zbirke „Socijalni status i životni standard stanovništva Rusije. 2008"

Rice. Histogram distribucije stanovništva prema prosječnom novčanom dohotku po stanovniku u 2007. godini

Kumulacija - grafički prikaz kumulativne krivulje, koji daje ideju o prirodi promjene akumuliranih frekvencija / frekvencija. Da bi se izgradio kumulativni niz varijacija intervala, vrijednosti intervala se crtaju duž apscise, a ako je serija diskretna, rangirane vrijednosti osobine. U oba slučaja, kumulativne frekvencije ili frekvencije se nalaze duž y-ose. Jednakost ili nejednakost intervala za kumulativni graf nije bitna.

Kumulat serije varijacije intervala je neopadajuća isprekidana linija koja povezuje tačke preseka krajeva intervala sa njihovim odgovarajućim akumuliranim frekvencijama. U ovom slučaju, povezivanje tačaka pravim linijama nastaje zbog pretpostavke ravnomernog povećanja broja akumuliranih frekvencija unutar intervala. Ugaoni koeficijent kumulativne veze karakterizira gustoću distribucije u odgovarajućem intervalu: što je veza strmija u odnosu na osu apscise, to je veća gustoća u ovom intervalu.

U tabeli su prikazane vrijednosti akumuliranih serija za karakterizaciju prosječnih prihoda po glavi stanovnika. Na osnovu ovih podataka, konstruisan je kumulat na Sl.

Raspodjela stanovništva prema prosječnom novčanom dohotku po glavi stanovnika u 2007. 1

Rice. Kumulativna distribucija stanovništva po prosječnom novčanom dohotku po stanovniku u 2007

Kumulat diskretne varijacione serije je neopadajuća, stepenasta kriva. Izgrađen je na sljedeći način. U pravougaonom koordinatnom sistemu označene su tačke čija je apscisa vrednost obeležja, ordinata je akumulirana frekvencija/frekvencija. Iz tačaka se okomice spuštaju na osu apscise. Zatim, iz svake tačke, segment paralelan sa x-osi se polaže udesno dok se ne siječe sa sljedećom okomicom.

U tabeli su prikazane vrijednosti kumulativne serije za karakteristiku "broj soba u stanu". Kumulat ove serije je prikazan na Sl.

Raspodjela stambenog fonda po tipovima stanova u 2008. godini 1

1) na osnovu materijala statističke zbirke „Ruski statistički godišnjak. 2009"

Rice. Kumulativna raspodjela stambenog fonda po vrstama stanova u 2008

Ogiva je grafički prikaz kumulativne krive, u kojoj su kumulativne ose obrnute. Na sl. ogiva je prikazana za raspodjelu dohotka po glavi stanovnika.

Rice. Ogiva raspodjela stanovništva prema vrijednosti novčanih dohodaka po stanovniku u 2007. godini.

Raspodjela populacijskih jedinica prema grupnim vrijednostima osobine samo je jedna od karakteristika fenomena koji se proučava. U zbirnoj obradi podataka, svaku grupu karakteriše čitav niz indikatora. Stoga, uz izgradnju distributivne serije, da bi se dobila sveobuhvatna procjena fenomena koji se proučava, treba formirati sistem statističkih indikatora koji se sastoji od apsolutnih, relativnih i prosječnih vrijednosti.

Kontrolna pitanja

1. Koja je suština sumiranja i grupisanja statističkih podataka?

2. Koji su glavni koraci u sumiranju i grupisanju podataka?

3. Na osnovu kojih razmatranja se bira osnova grupisanja i koje su razlike u grupisanju njome određene?

4. Šta je složeno grupisanje?

5. Kako se određuje broj grupa?

6. Koji pristupi postoje za određivanje vrijednosti intervala grupisanja?

7. Navedite glavne tipove grupiranja i ukratko opišite suštinu svake od njih.

8. Šta je sekundarno grupisanje i na koje načine se ono provodi?

9. Definirajte statističku tabelu i njene glavne elemente.

10. Koja pravila treba poštovati pri izradi statističkih tabela?

11. Definirajte distribucijsku seriju i njene glavne elemente.

12. Navedite glavne tipove distributivnih serija. Na osnovu čega je njihova podjela?

13. Definirajte statistički graf.

14. Koji se grafikoni prave da bi se prikazala promjena frekvencija varijacionih serija?

15. Šta su kumulati i ogive i kako se grade?

, hiljada rubalja/mjesečno stanovništva
, miliona ljudi

Podaci o svakoj jedinici analizirane populacije, dobijeni kao rezultat prve faze statističkog istraživanja, karakterišu statističko posmatranje sa njenih različitih strana, budući da imaju brojne karakteristike i svojstva koja se menjaju u vremenu i prostoru. Da bi se dobila zbirna karakteristika cjelokupnog objekta korištenjem generalizirajućih indikatora, potrebno je sistematizirati i sumirati rezultate koji su dobijeni tokom statističkog posmatranja. To će nam dati priliku da identifikujemo karakteristike i karakteristike statističke populacije u cjelini i njenih pojedinačnih komponenti, da otkrijemo obrasce proučavanih društveno-ekonomskih pojava i procesa. Ova sistematizacija se naziva sažetkom primarne statističke građe.

Druga faza statističkog rada - statistički sažetak - ovo je obrada primarnih podataka u cilju dobijanja generalizovanih karakteristika fenomena ili procesa koji se proučava prema nizu značajki koje su za nju bitne kako bi se identifikovale tipične karakteristike i obrasci svojstveni fenomenu ili procesu kao celini.

Statistički sažetak- ovo je prijelaz sa pojedinačnih podataka na informacije o grupama jedinica i populaciji u cjelini.

Proces pregleda uključuje tri koraka:

1) prethodna kontrola je provjera podataka;

2) grupisanje podataka prema datim karakteristikama - to je definicija izvedenih indikatora;

3) registracija rezultata rezimea u obliku statističkih tabela, one su pogodan oblik za percepciju primljenih informacija.

Semantička konzistentnost statističkih informacija je preliminarna kontrola. U skladu sa statističkim sumarnim programom, radi daljeg pružanja primljenih informacija u pristupačnom obliku, koristi se statističko grupisanje podataka.

Rezultati grupisanja se sastavljaju u obliku tabela grupisanja koje sadrže sažetak karakteristika proučavane populacije prema jednom ili više karakteristika koje su međusobno povezane logikom analize. Razlikujte jednostavne i složene sažetke. Podaci o pojedinačnim jedinicama sumirani su kao cjelina u agregatu bez podjele u homogene grupe. Rezultati jednostavnog statističkog sažetka namijenjeni su daljoj obradi materijala, a jednostavan sažetak ima i samostalnu kognitivnu vrijednost.

Jednostavan statistički sažetak- ovo je operacija za izračunavanje ukupnih zbirnih i grupnih podataka o ukupnosti jedinica posmatranja i prikaz ovog materijala u tabelama.

Jednostavan statistički sažetak daje nam mogućnost da odredimo broj jedinica proučavane populacije i obim proučavanih karakteristika, ali tako jednostavan sažetak ne daje predstavu o integritetu sastava proučavane populacije.

Ako su jedinice stanovništva podijeljene u homogene grupe, onda se zbrojevi izračunavaju za svaku grupu, a zatim za cjelokupnu populaciju kao cjelinu, takav statistički sažetak se naziva složenim. Složeni sažetak omogućava nam da proučavamo sastav populacije i identificiramo utjecaj nekih karakteristika na druge, odnosno da otkrijemo obrasce svojstvene ovoj populaciji.

Kompleksni statistički sažetak je skup operacija. uključujući distribuciju jedinica posmatranja socio-ekonomskog fenomena ili procesa koji se proučava u grupe, kompilaciju sistema indikatora za karakterizaciju tipičnih grupa i podgrupa proučavanog skupa fenomena, brojanje broja jedinica i totala u svakoj grupi i podgrupe i predstavljanje rezultata ovog rada u obliku statističkih tabela. Na osnovu sveobuhvatne teorijske analize suštine i sadržaja proučavanih pojava i procesa izrađuje se statistički sažetak. Program i plan izvođenja statističkog sažetka osigurava pouzdanost i valjanost njegovih rezultata.

Statistički zbirni program sadrži listu grupa u koje se skup jedinica statističkog posmatranja može podijeliti ili podijeliti, kao i sistem indikatora koji karakterišu proučavani skup pojava i procesa, kako u cjelini, tako i u pojedinim dijelovima. Program statističkog sažetka zavisi od ciljeva i zadataka studije. Razvoj programa uključuje sljedeće korake:

1) odabrano je obeležje grupisanja da formira homogene grupe;

2) utvrđuje se redosled formiranja i broj grupa;

3) razvija se sistem statističkih indikatora za karakterizaciju grupa i objekta u celini;

4) kreirani su izgledi statističkih tabela kako bi se dali zbirni rezultati.

Zajedno sa programom statističkog sažetka izrađuje se plan njegove implementacije. Plan treba da sadrži informacije o redoslijedu, vremenu i tehnici izvođenja rezimea, njegovim izvođačima, o postupku i pravilima oblikovanja njegovih rezultata u obliku tabela.

Sažetak takođe može biti decentralizovan i centralizovan.

Decentralizovani statistički sažetak- ovo je način generalizacije materijala koji se odvija od vrha do dna duž hijerarhijske lestvice upravljanja i obrađuje se u svakoj fazi. Obrada podataka se vrši na terenu, odnosno izvještaje preduzeća sastavljaju statistički organi subjekata. Ruska Federacija. Dobijeni rezultati se dostavljaju Državnom komitetu za statistiku Ruske Federacije, a zatim se prikazuju konačni pokazatelji općenito za društveno-ekonomsku situaciju u zemlji.

Centralizirani statistički sažetak- ovo je način na koji se svi primarni podaci dobijeni kao rezultat statističkog posmatranja koncentrišu u jednu centralnu organizaciju i obrađuju od početka do kraja.

Prema tehnici izvođenja statistički sažetak može biti mehanizovan (pomoću elektronskih računara) i ručni.

2. Suština i klasifikacija grupacija

Naučno potkrijepljena distribucija u grupe omogućava donošenje ispravnih zaključaka o populaciji koja se proučava i procesima koji se u njoj odvijaju.

Principi naučnog grupisanja izloženi su u radovima V. I. Lenjina. Statističko grupisanje, kako je istakao V. I. Lenjin, nije sporedno pitanje. Zahtijeva sveobuhvatnu socio-ekonomsku analizu fenomena koji se proučavaju. pravi izbor grupisanje karakteristika u skladu sa ciljevima statističkog istraživanja. Grupisanje treba da se zasniva na najznačajnijim, najvažnijim karakteristikama za problematiku koja se proučava, što će omogućiti da se identifikuju socio-ekonomski tipovi pojava. Briljantan primjer upotrebe statističkih grupa za identifikaciju socio-ekonomskih tipova može poslužiti kao tabela iz djela V. I. Lenjina "Razvoj kapitalizma u Rusiji".

Statističko grupisanje- Ovo je jedna od glavnih faza statističkog istraživanja.

Proces formiranja homogenih grupa na osnovu podjele statističke populacije na dijelove ili spajanja proučavanih statističkih jedinica u agregat prema određenim karakteristikama naziva se statističko grupisanje Najvažnija statistička metoda generalizacije podataka je statističko grupisanje.

Tri glavne vrste problema riješenih metodom statističkog grupisanja:

1) izdvajanje društveno-ekonomskih vrsta pojava;

2) proučavanje strukture pojave i strukturnih promena koje se dešavaju u pojavi;

3) utvrđivanje međuodnosa i međuzavisnosti između pojava i karakteristika koje karakterišu ove pojave. Postoje sljedeće vrste statističkih grupa:

1) tipološki;

2) strukturni;

3) analitičke.

Kvalitativno homogene grupe kolekcija, odnosno objekti koji su međusobno bliski po svojim karakteristikama grupisanja, nazivaju se tipološko grupisanje.

Primjer tipološkog grupisanja je: grupisanje zemljišta, prema obliku vlasništva. Glavnu pažnju u tipološkom grupisanju treba posvetiti identifikaciji tipova i izboru obeležja grupisanja. Za izgradnju tipološke grupe potrebno je koristiti kvantitativne i kvalitativne (atributivne) karakteristike.

Grupiranje prema atributu sugerira da broj odabranih grupa odgovara stvarnom broju gradacija ovog atributa. Na kvantitativnoj osnovi, potrebno je pravilno postaviti interval grupisanja, odrediti potreban broj grupa. Problem određivanja intervala tipološkog grupisanja rješava se na osnovu identifikacije takvih kvantitativnih granica za promjenu atributa grupisanja, na kojima se pojava mijenja ili dobija novi kvalitet.

U tipološkom grupisanju, broj grupa zavisi od broja postojećih socio-ekonomskih tipova. Društveno-ekonomski tipovi pojava zavise od sastava, strukture homogenih grupa i proučavanja varijacije znakova unutar istog tipa stanovništva i grupa istog tipa na osnovu konstrukcije strukturne grupacije. Podjela homogene populacije na određene grupe, koje će kasnije karakterizirati strukturu prema određenom grupnom obilježju, naziva se strukturno grupiranje. Ovdje se također razmatraju kvantitativni i atributivni znaci. Primjer je grupiranje skladišnih radnika prema vještinama.

Prema atributivnoj osobini, grupe se međusobno razlikuju po prirodi osobine. Kvantitativna karakteristika takođe uključuje određivanje broja grupa i širine intervala.

Glavni zadatak statističkih grupisanja- proučavanje odnosa i zavisnosti između karakteristika jedinica statističke populacije, koje se rješava izgradnjom analitičkih grupa. Analitičko grupisanje- ovo je grupisanje koje otkriva odnos i međuzavisnost između proučavanih društveno-ekonomskih pojava i karakteristika koje ih karakterišu.

Svi znakovi u statističkoj nauci mogu se podijeliti na faktor i rezultat. Znakovi koji pružaju veliki uticaj za promjenu efektivnih znakova, tzv faktorijel. Osobine koje se mijenjaju pod uticajem faktorskih osobina nazivaju se produktivan.

Važan zadatak u izgradnji analitičkog grupisanja je izbor broja grupa na koje je potrebno podijeliti proučavani skup jedinica posmatranja i određivanje njihovih granica.

Zahtjevi koji se moraju poštovati u procesu konstruiranja analitičkih grupa su: svaka grupa koja se proučava mora sadržavati homogene jedinice populacije prema obeležju grupisanja, a broj jedinica u svakoj grupi koja se proučava mora biti dovoljan za dobijanje statističkih karakteristika. objekta koji se proučava.

Simple call grupisanje, ako je grupa formirana samo na jednoj osnovi. Ako je grupa podijeljena u podgrupu u skladu s određenim karakteristikama, onda se takvo grupisanje naziva kombinovano.

kombinacijski grupiranje se smatra kada je populacija podijeljena u grupe prema dvije ili više karakteristika grupisanja uzetih u kombinaciji (kombinacijama) jedna s drugom.

Prilikom proučavanja složenih društveno-ekonomskih pojava i procesa koriste se kombinaciona grupisanja. Da bi se izgradila kombinaciona grupa, potrebno je identifikovati prisustvo dovoljno velikog broja zapažanja.

Da bi se pronašao klaster (u dimenzionalnom prostoru) objekata (tačaka), potrebno je primijeniti multidimenzionalno grupisanje Postoje grupe prema korištenim informacijama:

1) primarni - izrađuju se na osnovu početnih podataka koji su dobijeni kao rezultat statističkog posmatranja;

2) sekundarni - ovo je rezultat povezivanja ili rasparčavanja grupe.

3. Principi izgradnje grupa

Da biste izgradili statističke grupe, morate odabrati atribut grupisanja, zatim odrediti broj grupa u koje je proučavana statistička populacija podijeljena i fiksirati granice intervala grupisanja. Za svaku grupaciju potrebno je pronaći specifične indikatore ili njihov sistem koji treba da karakteriše proučavane grupe.

Izbor atributa grupisanja - kompleksno pitanje u teoriji statističkog grupisanja i statističkih istraživanja općenito. Atribut grupisanja je osnova na kojoj se jedinice stanovništva dijele u posebne grupe. Ispravnost zaključaka statističke studije zavisi od stepena tačnosti obeležja grupisanja.

Grupisanje uključuje kvantitativne i atributivne (kvalitativne) karakteristike. Kvantitativne karakteristike obično imaju numerički izraz (na primjer, obim proizvodnje, starost osobe, prihod porodice, itd.). Atributivne karakteristike daju kvalitativnu karakteristiku jedinice stanovništva (na primjer, spol, Porodični status, politička orijentacija osobe i sl.). Odabrane grupe prema atributu u grupisanju treba da se razlikuju jedna od druge u smislu kvalitativnih karakteristika atributa. Broj grupa na koje je podijeljena statistička populacija ovisi o broju gradacija atributa.

Važno za studiranje ekonomska suština fenomena koji se proučava kada se konstruiše grupisanje prema kvantitativnom atributu.

Da biste odredili broj grupa, možete koristiti Sturgessovu formulu:

h + 3,322 ? lg N,

Gdje h– broj grupa;

N je broj populacijskih jedinica;

lgN je decimalni logaritam od N.

Ova formula kaže da izbor broja grupa objektivno zavisi od veličine populacije. Nakon utvrđivanja broja grupa, rešava se pitanje određivanja intervala grupisanja.

Na osnovu intervala grupisanja, može se kvantitativno razlikovati jedna grupa od druge i ocrtati granice za isticanje njihovog novog kvaliteta. Interval grupisanja je interval vrijednosti varijabilnog atributa koji se nalazi unutar određene grupe. Svaki interval ima svoju dužinu (širinu), gornju i donju granicu.

Donja granica intervala je najmanju vrijednost karakteristika u intervalu, a gornja granica intervala je njegova najveća vrijednost. Donja granica prvog intervala uzima se kao najmanja vrijednost atributa u zbiru jedinica posmatranja. Gornja granica posljednjeg intervala ne može biti manja od najveća vrednost karakteristika u zbiru jedinica posmatranja.

Interval Width je razlika između gornje i donje granice. Intervali grupisanja u zavisnosti od njihove širine su jednaki i nejednaki. Nejednake se dijele na progresivno rastuće, progresivno opadajuće, proizvoljne i specijalizirane. Ako se varijacija osobine manifestira u relativno uskim granicama i distribucija je ujednačena, tada se gradi grupiranje u jednakim intervalima.

Vrijednost jednakog intervala određena je sljedećom formulom:

h \u003d R / n \u003d (x max - x min) / n,

gdje je x max, x min - maksimalna i minimalna vrijednost karakteristike u agregatu;

n je broj grupa.

Ova formula se zove intervalni korak. Ako je raspon varijacije obilježja u populaciji velik i vrijednosti obilježja variraju neravnomjerno, tada se koristi grupiranje s nejednakim intervalima. Nejednaki intervali se mogu dobiti ako konstruisana grupacija sa jednakim intervalima sadrži grupe koje ne odražavaju određene vrste fenomena ili procesa koji se proučavaju ili ne sadrže jednu jedinicu populacije, postaje potrebno povećati - kombinovati dve ili više malih ili "prazne" uzastopne jednake intervale. Izbor jednakih ili nejednakih intervala zavisi od stepena ispunjenosti intervala. Intervali grupisanja mogu biti zatvoreni ili otvoreni Zatvoreno intervali su intervali u kojima su navedene gornje i donje granice. Otvoreni intervali imaju samo jednu granicu (gornja - na prvom, donja - na posljednjoj). Na kvantitativne znakove može se pripisati kontinuiranoj osobini ili diskretnoj. Ako je grupisanje zasnovano na diskretnoj osobini, tada je donja granica i-tog intervala jednaka gornjoj granici i-tog intervala, uvećana za 1.

U grupiranjima koja odražavaju kvalitativne karakteristike i specifičnosti izdvojenih grupa jedinica populacije koja se proučava na određenoj osnovi, koriste se specijalizovani intervali. Specijalizovani intervali - to su intervali koji se koriste za razlikovanje od ukupnosti istih tipova na istoj osnovi za pojave koje se nalaze u različitim uslovima. Prema ulozi koju imaju znakovi u odnosu proučavanih objekata, procesa ili pojava, mogu se podijeliti na faktorske i rezultativne. Znakovi faktora utiču na druge znakove, a na rezultirajuće znakove utiču drugi znakovi.

Statističko grupisanje se odnosi na distribuciju jedinica posmatranja u grupe prema jednoj ili više karakteristika. Ovi znakovi se nazivaju grupiranje. U zavisnosti od ciljeva studije grade se tipološka, ​​strukturna i analitička grupisanja.

Tipološko grupisanje je distribucija jedinica posmatranja kvalitativno heterogene populacije prema socio-ekonomskim tipovima, klasama, kvalitativno homogenim grupama. Na primjer, distribucija ukupnog broja preduzeća prema obliku vlasništva (tabela 3.1); sektori privrede; veličina preduzeća - mala, srednja i velika preduzeća (klasifikovana su prema nekoliko kriterijuma odjednom); banke - državnim i komercijalnim itd. Glavni zadatak tipološkog grupisanja je identifikacija i opis tipova fenomena koji se proučava. Broj izdvojenih grupa određen je brojem tipova, klasa, homogenih grupa itd. samu prirodu fenomena.

Tabela 3.1. Raspodjela preduzeća i organizacija po oblicima svojine od 01.01.2006
Vrsta vlasništva Broj preduzeća i organizacija, hiljada
Država 160
Općinski 252
Imovina javnih i vjerskih udruženja (organizacija) 252
Privatno 3 838
Ostali oblici vlasništva, uključujući mješoviti ruski, strani, zajednički ruski i strani 265
Ukupno 4 767

Izvor: Rusija u brojkama. 2006: Brief stat. Sat. / Rosstat. M., 2006. S. 167.

Kod strukturalnog grupisanja dolazi do podjele jedinica homogene populacije na grupe kako bi se identificirala njena struktura prema jednoj od karakteristika. Na primjer, raspodjela zaposlenih prema spolu, starosti; raspodela preduzeća po broju zaposlenih itd. Primjer strukturalnog grupiranja su podaci u tabeli. 3.2.

Tabela 3.2. Struktura zaposlenih prema radnom stažu u preduzeću
Radno iskustvo, godine Broj zaposlenih Broj zaposlenih u procentima od ukupnog broja
Do 2 10 5
2-4 20 10
4-6 30 15
6-8 80 40
8 ili više 60 30
Ukupno 200 100

Analitičke grupe igraju važnu ulogu u statističkoj analizi. Uz njihovu pomoć utvrđuje se prisutnost veze između znakova i njegovog smjera. U ovom slučaju, jedna od karakteristika je efektivna, a druga faktorijalna. Efektivna osobina se menja pod uticajem faktorske osobine.

Kada se konstruiše analitičko grupisanje, faktorski atribut se uvek bira kao karakteristika grupisanja. U svakoj odabranoj grupi izračunava se prosječna vrijednost efektivne karakteristike. Na primjer, u tabeli. 3.3 kompanije su grupisane po visini troškova oglašavanja. U svakoj grupi se utvrđuje prosječan promet. Iz tabele se vidi da što više pažnje kompanije posvećuju oglašavanju, to su značajniji rezultati njihovih aktivnosti, izraženi u vidu prometa.

Odnos između znakova naziva se direktnim, ako se s rastom vrijednosti predznaka faktora povećavaju vrijednosti efektivnog znaka. Odnos je inverzan ako povećanje vrijednosti atributa faktora dovodi do smanjenja vrijednosti efektivnog atributa. U našem primjeru, rast troškova oglašavanja je uzrokovao povećanje prometa, što znači da postoji direktna veza između ovih znakova.

Uz grupisanje, u statističkoj analizi se koriste klasifikacije. Klasifikacija je opšteprihvaćena, tradicionalno korišćena, često i zvanično ustanovljena podela populacije na grupe, što je određeni standard u kome se nameću strogi zahtevi jedinicama posmatranja u pogledu njihove usklađenosti sa određenom grupom. Klasifikacija se zasniva na kvalitativnom znaku. Najpoznatije su klasifikacije privrednih sektora, administrativno-teritorijalne podjele, privrednih regiona, vrsta privrednih djelatnosti itd. Klasifikacije nisu nešto stabilno, u skladu sa ekonomskim i političke promjene oni se takođe menjaju.

U zavisnosti od broja znakova po kojima se vrši grupisanje, razlikuju se jednostavne i složene grupe. Ako se grupisanje vrši prema jednom atributu, onda se naziva jednostavnim (vidi tabele 3.1, 3.2). Ako se jedinice populacije grupišu odjednom prema dvije ili više karakteristika, onda se takvo grupiranje naziva složenim. Istovremeno, unutar grupa formiranih prema jednom atributu, jedinice stanovništva se dijele na podgrupe prema drugom atributu. Primjer složenog grupisanja je grupisanje učenika na struji prema dvije karakteristike – spolu i uzrastu. Njegovi rezultati se mogu prikazati u obliku tabele (Tabela 3.4).

Tabela 3.4. Distribucija učenika u struji prema polu i starosti
Starost, godine Kat Ukupno
muškarci zene
Do 14 10 8 18
15 8 9 17
16 12 13 25
17 i više 11 10 21
Ukupno 41 40 81

Sekundarno grupisanje podataka. U praksi se često javljaju situacije kada se prema dostupnim grupisanim podacima traži izgradnja nove grupe. U ovom slučaju, po pravilu, niz primarnih podataka je nedostupan. Zatim pribjegavajte metodama sekundarnog grupiranja podataka.

Sekundarno grupisanje je pregrupisavanje već grupisanih podataka bez pozivanja na primarni niz podataka. U tu svrhu koriste se dva pristupa: kombinovanje početnih intervala ako se granice nove i stare grupe poklapaju i frakciono pregrupisavanje podataka ako se granice ne poklapaju.

Pokazaćemo metodu kombinovanja početnih intervala koristeći sledeći primer. Pretpostavimo da početni podaci predstavljaju niz rezultat tab. 3.5.

Tabela 3.5. Distribucija zaposlenih u kompaniji prema veličini plate
Broj intervala Plata, rub. Broj zaposlenih, osoba
1 2 000-3 000 16
2 3 000-4 000 40
3 4 000-5 000 65
4 5 000-6 000 58
5 6 000-7 000 44
6 7.000 i više 17
Ukupno - 240

Pregrupišimo podatke i formiramo nove intervale: "2000-4000", "4000-6000", "6000 i više". Pošto se granice novog i starog intervala poklapaju, lako je uočiti da će radnici prvog i drugog intervala prvobitne grupe (16 + 40 = 56 ljudi) pasti u prvi novi interval "2000-4000", a radnici trećeg i četvrtog intervala originalne grupe će pasti u drugi novi interval grupacije (65 + 58 = 123 osobe), u trećem novom intervalu - radnici iz posljednja dva intervala (44 + 17 = 61 osoba ). Rezultati preuređenja prikazani su u tabeli. 3.6.

Tabela 3.6. Distribucija zaposlenih u kompaniji prema platama (sekundarno grupisanje)
Broj intervala Plata, rub. Broj zaposlenih, osoba
1 2 000-4 000 56
2 4 000-6 000 123
3 6.000 i više 61
Ukupno - 240

Zajedničko pregrupisavanje se zasniva na principu ravnomerne raspodele jedinica posmatranja unutar granica intervalnih grupa. Kao rezultat njegove implementacije, izračunava se koji će dio posmatračkih jedinica preći iz stare intervalne grupe u novu.

Zajedno sa primarnim grupisanjem u statistici, nalazi široka primena sekundarno grupisanje. V Sekundarno grupisanje naziva se formiranje novih grupa na osnovu prethodno sprovedenog grupisanja.

Sekundarne grupe se koriste za rešavanje različitih problema, od kojih su najvažniji: 1) formiranje kvalitativno homogenih grupa (tipova) na osnovu grupisanja prema kvantitativnim karakteristikama; 2) dovođenje dve (ili više) grupacija sa različitim intervalima u jedan oblik radi uporedivosti i analize; 3) formiranje većih grupa, u kojima se jasnije ispoljava priroda distribucije.

Suština ove tehnike je da se dobiju uporedivi podaci o različitim grupama, za koje: snagu grupa (sa procentom) je fiksirana na istom nivou za sve grupe; u svim grupama se takođe uspostavlja jednak broj grupa i isti sadržaj grupnih tabela. Nisu apsolutni pokazatelji za grupe koji su predmet poređenja i poređenja, već relativne vrijednosti, procenti.

Postoje dvije metode sekundarnog grupisanja: 1) transformacijom intervala primarnog grupisanja (češće jednostavnim povećanjem intervala) i 2) dodjeljivanjem svakoj grupi određenog dijela jedinica populacije (djelimično preuređivanje). Kada se koriste ove metode sekundarnog grupisanja, obično se pretpostavlja da će distribucija obilježja unutar intervala biti ujednačena.

Korištenje sekundarnog grupiranja za dovođenje dvije grupe s različitim intervalima u jedan oblik u svrhu uporedivosti biće ilustrovano sljedećim primjerom. Za to koristimo podatke primarnog grupisanja dva okruga po broju stočarskih radnika (tabela 3.7).

Tabela 3.7. Grupisanje farmi u dva okruga po broju stočarskih radnika

Distrikt I

Distrikt II

grupe farmi

grupe farmi

na kraju

broj zaposlenih, ljudi

na kraju

Podaci grupacija dva okruga nisu direktno uporedivi, jer su gazdinstva podeljena u grupe u različitim intervalima: 20 ljudi. u okrugu I i 30 ljudi. u regiji II. Broj odabranih grupa također nije isti.

Da bismo te dvije grupe doveli u uporediv oblik, izvršit ćemo sekundarno grupisanje. U tu svrhu pregrupisujemo materijale u grupe koje su iste za oba područja: uzmimo interval od 40 ljudi. (Tabela 3.8).

Budući da je moguće izvršiti sekundarno grupisanje gazdinstava regije i provesti metodu jednostavnog uvećanja intervala (postoji podudarnost donjeg i gornjeg intervala u dvije grupe), ovim metodom rješavamo problem.

Objasnimo redoslijed izračunavanja. U prvoj grupi farmi sa do 160 zaposlenih. obuhvatiće farme I i II grupe.

Tabela 3.8. Sekundarno grupisanje farmi u dva okruga prema broju stočarskih radnika

Udio gazdinstava u ovim grupama iznosiće 16% (4+12). U drugoj grupi gazdinstava sa brojem zaposlenih od 160 do 200 ljudi. obuhvatiće gazdinstva III i IV grupe njihovih specifična gravitacija ukupno će biti 45% (18+27). Proračuni se vrše slično za formiranje drugih grupa.

Pregrupisavanje gazdinstava regije II. Budući da povećanje intervala za gazdinstva regiona II nije pogodno i ne rješava problem, koristimo metodu parcijalnog pregrupisavanja podataka primarnog grupisanja.

Prva, novostvorena grupa gazdinstava u regionu II sa brojem stočarskih radnika do 160 ljudi će u potpunosti obuhvatiti farme primarne grupacije sa istim intervalom. Učešće gazdinstava u ovoj grupi iznosi 8%.

U drugoj grupi gazdinstava sekundarne grupacije sa brojem zaposlenih od 160 do 200 ljudi. u potpunosti će biti obuhvaćena gazdinstva II grupe (16%) i dio gazdinstava III grupe. Za određivanje dijela gazdinstava koji se mora uzeti iz grupe III, potrebno je podijeliti u podgrupe sa brojem zaposlenih 190 - 200, 200 - 210, 210 - 220 ljudi. Pokazatelji udjela gazdinstava u ovim podgrupama određuju se srazmjerno podjeli intervala. Veličina intervala koji razmatramo je 30 ljudi. i podijeljen je na tri jednaka dijela. Za postizanje željenog intervala 160 - 200 ljudi. na veličinu intervala grupe II (160 - 190 osoba) treba dodati jednu trećinu veličine intervala grupe III (190 - 220 osoba) i isti dio gazdinstava ove grupe.

Dakle, druga, novostvorena grupa gazdinstava obuhvatiće 16% gazdinstava druge grupe i jednu trećinu III grupe - 10% (1/3-30), što će biti 26% od ukupnog broja gazdinstava u Srbiji. region II.

III grupa gazdinstava sekundarne grupacije (200 - 240 ljudi) obuhvatiće deo gazdinstava III grupe (190 - 220 ljudi), ono što ostaje - 20% (% -30) i dve trećine farmi IV grupa (220 - 250 lica) - 14% (% -21), odnosno 34% od ukupnog broja gazdinstava u regionu II.

Slični proračuni su napravljeni i za formiranje drugih, novostvorenih grupa farmi: 240 - 280 i više od 280 ljudi. Kao u tabeli. 3.7, uz podatke o udjelu gazdinstava po grupama, dati su i podaci o njihovom broju, zatim bi se obračuni u novonastalim grupama vršili u istim omjerima kao i za udio gazdinstava.

Nakon sekundarnog grupisanja primarni materijal postaje uporediv, jer se za dva okruga uzimaju iste grupe prema broju zaposlenih. Iz podataka u tabeli. 3.8 pokazuje da se distribucija farmi prema broju stočarskih radnika u dva okruga značajno razlikuje: u okrugu I preovlađuju farme sa do 200 stočara. (61% od ukupnog broja gazdinstava), u regionu II - farme sa brojem stočarskih radnika - više od 200 ljudi. (66% od ukupnog broja farmi).

Pitanje 10. Sekundarno grupisanje, metode za njegovu implementaciju.

grupisanje - ovo je podjela proučavane statističke populacije na dijelove prema jednoj ili više karakteristika grupisanja. Pravilno provedeno grupisanje u velikoj mjeri osigurava pouzdanost cjelokupne statističke studije.

primarno grupisanje proizvedeno na osnovu sortiranja primarnih izvornih podataka.

Grupacije izgrađene za isti vremenski period, ali za različite regije, ili, obrnuto, za istu regiju, ali za dva različita vremenska perioda, možda neće biti uporedive zbog različitog broja odabranih grupa ili razlike u granicama intervalima. U tom slučaju potrebno je pregrupisati podatke koristeći sekundarno grupisanje.

Sekundarno grupisanje - operacija formiranja novih grupa na osnovu prethodno izvršenog grupisanja.

Postoje dva načina za formiranje novih grupa.

1. najjednostavniji i najčešći način je promjena (češće povećanje) početnih intervala.

2. Doleinsko preuređenje- metoda se sastoji u formiranju novih grupa na osnovu dodjele određenog udjela jedinica stanovništva svakoj grupi.

Primjer. Potrebno je pregrupisati podatke, formirajući nove grupe u intervalima do 500, 500 - 1000, 1000 - 2000, 2000 - 3000, preko 3000 rubalja. prema podacima o raspodjeli ugovora građevinskih preduzeća po dobiti.

Table. Pregled ugovora građevinskih firmi prema dobiti¹

Prva nova grupa će obuhvatiti cijelu 1. grupu ugovora i dio 2. grupe. Za formiranje grupe do 500 hiljada rubalja potrebno je uzeti 100 hiljada rubalja iz intervala 2. grupe. Vrijednost intervala ove grupe bit će 600 hiljada rubalja. Dakle, potrebno je od njega uzeti 1/6 (100:600) Sličan deo u novoformiranoj novoj grupi takođe treba uzeti od broja ugovora, odnosno 20 1/6 - 3 ugovora. Tada će biti 16 ugovora + 3 = 19 ugovora u 1. grupi. Drugu novu grupu formiraju ugovori 2. grupe minus oni koji su dodijeljeni 1. tj. 20 - 3 = 17 jedinica. Novoformirana treća grupa obuhvatiće sve ugovore 3. grupe i dio ugovora 4. grupe. Da biste odredili ovaj dio iz intervala 1800 -3000 (širina intervala je 1200 hiljada rubalja), potrebno je prethodnom dodati 200 hiljada rubalja. (tako da je gornja granica intervala jednaka 2000 rubalja). Stoga je potrebno uzeti dio intervala jednak 200:1200, odnosno 1/6. U ovoj grupi ima 74 ugovora, što znači da trebate uzeti 74 ¦ (1:6) = 12 jedinica. Treća nova grupa će uključivati: 44 H-12 - 56 ugovora. Novoformirana četvrta grupa će uključivati: 74 - 12 = 62 ugovora preostala iz prethodne 4. grupe. Petu, novoformiranu grupu činiće ugovori 5. i 6. prethodne grupe: 37 + 9 = 46 ugovora. Tehnika preuređivanja je prikazana u tabeli.



greška: Sadržaj je zaštićen!!