Odaberite Stranica

Konstruirati diskretne i intervalne serije raspodjele. Konstrukcija diskretne varijacione serije

Šta je grupisanje statističkih podataka i kako je povezano sa redovima distribucije, govorilo se u ovom predavanju, gde se takođe može naučiti šta je diskretna i varijantna serija raspodele.

Distribucija serije jedna od varijanti statističke serije(pored njih, u statistici se koriste i vremenske serije), koje se koriste za analizu podataka o pojavama javni život. Izgradnja varijantnih serija je sasvim izvodljiv zadatak za svakoga. Međutim, postoje pravila koja se moraju zapamtiti.

Kako konstruirati diskretnu varijacionu distribucijsku seriju

Primjer 1. Postoje podaci o broju djece u 20 anketiranih porodica. Konstruirajte diskretnu seriju varijacija porodična distribucija po broju djece.

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

Rješenje:

  1. Počnimo sa rasporedom tabele u koju ćemo zatim unositi podatke. Pošto redovi distribucije imaju dva elementa, tabela će se sastojati od dve kolone. Prva kolona je uvijek opcija - ono što proučavamo - ime uzimamo iz zadatka (kraj rečenice sa zadatkom u uslovima) - prema broju djece– to znači da je naša opcija broj djece.

Drugi stupac je učestalost - koliko se često naša varijanta javlja u fenomenu koji se proučava - također uzimamo naziv kolone iz zadatka - porodična distribucija – to znači da je naša frekvencija broj porodica sa odgovarajućim brojem djece.

  1. Sada iz izvornih podataka biramo one vrijednosti koje se javljaju barem jednom. U našem slučaju jeste

I hajde da rasporedimo ove podatke u prvu kolonu naše tabele logičkim redom, u ovom slučaju povećavajući od 0 do 4. Dobijamo

I na kraju, izbrojimo koliko se puta pojavljuje svaka vrijednost varijante.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

Kao rezultat dobijamo popunjenu tabelu ili traženi red raspodele porodica po broju dece.

Vježbajte . Postoje podaci o tarifnim kategorijama 30 radnika u preduzeću. Konstruirajte diskretnu varijantnu seriju za raspodjelu radnika po tarifnim kategorijama. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

Kako konstruirati intervalni varijacioni niz raspodjele

Hajde da gradimo intervalne serije distribuciju, i da vidimo kako se njena konstrukcija razlikuje od diskretne serije.

Primjer 2. Postoje podaci o visini dobiti koju je primilo 16 preduzeća, miliona rubalja. — 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Konstruirajte intervalnu seriju varijacije distribucije preduzeća prema obimu dobiti, identifikujući 3 grupe sa u jednakim intervalima.

Generalni princip konstruisanja serije, naravno, ostaće ista dva stupca, iste opcije i frekvencija, ali će u ovom slučaju opcije biti locirane u intervalu i frekvencije će se brojati drugačije.

Rješenje:

  1. Počnimo slično prethodnom zadatku tako što ćemo napraviti izgled tabele u koju ćemo zatim unijeti podatke. Pošto redovi distribucije imaju dva elementa, tabela će se sastojati od dve kolone. Prva kolona je uvijek opcija - ono što proučavamo - ime uzimamo iz zadatka (kraj rečenice sa zadatkom u uslovima) - po visini dobiti - što znači da je naša opcija iznos dobiti koju dobijemo .

Druga kolona je učestalost – koliko se često naša varijanta javlja u fenomenu koji se proučava – naziv kolone uzimamo i iz zadatka – distribucija preduzeća – što znači da je naša učestalost broj preduzeća sa odgovarajućom dobiti, u ovaj slučaj pada u interval.

Kao rezultat toga, naš raspored tablice će izgledati ovako:

gdje je i vrijednost ili dužina intervala,

Xmax i Xmin – maksimalna i minimalna vrijednost atributa,

n je potreban broj grupa prema uslovima zadatka.

Izračunajmo veličinu intervala za naš primjer. Da bismo to učinili, među početnim podacima pronaći ćemo najveći i najmanji

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 – maksimalna vrijednost je 118 miliona rubalja, a minimalna 9 miliona rubalja. Izračunajmo pomoću formule.

U proračunu smo dobili broj 36, (3) tri u periodu, u takvim situacijama vrijednost intervala se mora zaokružiti kako se nakon proračuna ne bi izgubio maksimalni podatak, zbog čega je u proračunu vrijednost od interval je 36,4 miliona rubalja.

  1. Sada konstruirajmo intervale - naše opcije u ovom problemu. Prvi interval se počinje graditi od minimalne vrijednosti, dodaje mu se vrijednost intervala i dobiva se gornja granica prvog intervala. Tada gornja granica prvog intervala postaje donja granica drugog intervala, tome se dodaje vrijednost intervala i dobija se drugi interval. I tako dalje onoliko puta koliko je potrebno da se konstruišu intervali prema uslovu.

Obratimo pažnju da vrijednost intervala nismo zaokružili na 36,4, nego smo je ostavili na 36,3, tada bi zadnja vrijednost bila 117,9. Da bi se izbjegao gubitak podataka potrebno je zaokružiti vrijednost intervala na veću vrijednost.

  1. Hajde da izbrojimo broj preduzeća koja spadaju u svaki određeni interval. Prilikom obrade podataka, morate imati na umu da se gornja vrijednost intervala u datom intervalu ne uzima u obzir (nije uključena u ovaj interval), već se uzima u obzir u sljedećem intervalu (uključena je donja granica intervala u ovom intervalu, a gornji nije uključen), sa izuzetkom posljednjeg intervala.

Prilikom obrade podataka, najbolje je označene podatke označiti simbolima ili bojama radi pojednostavljenja obrade.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

Označimo prvi interval žutom bojom - i odredimo koliko podataka spada u interval od 9 do 45,4, dok će se ovaj 45,4 uzeti u obzir u drugom intervalu (pod uslovom da je u podacima) - kao rezultat dobijamo 7 preduzeća u prvom intervalu. I tako u svim intervalima.

  1. (dodatna akcija) Izračunajmo ukupan iznos dobiti koju primaju preduzeća za svaki interval i općenito. Da biste to učinili, zbrojite označene podatke različite boje i dobijete ukupnu vrijednost profita.

Za prvi interval - 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 miliona rubalja.

Za drugi interval - 48 + 57 + 48 + 56 + 63 = 272 miliona rubalja.

Za treći interval - 118 + 87 + 98 + 88 = 391 milion rubalja.

Vježbajte . Postoje podaci o iznosu depozita u banci od 30 štediša, hiljada rubalja. 150, 120, 300, 650, 1500, 900, 450, 500, 380, 440,

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

Build intervalne varijacione serije raspodjela štediša, prema veličini depozita, izdvajajući 4 grupe u jednakim intervalima. Za svaku grupu izračunajte ukupan iznos depozita.

Statističke distribucijske serije– ovo je uređena distribucija populacijskih jedinica u grupe prema određenim varijabilnim karakteristikama.
U zavisnosti od karakteristika na kojima se formira niz distribucije, postoje atributivne i varijacione serije distribucije.

Prisustvo zajedničke karakteristike je osnova za formiranje statističke populacije, koja predstavlja rezultate opisa ili mjerenja. zajedničke karakteristike objekti istraživanja.

Predmet proučavanja u statistici su promjenjive (promjenjive) karakteristike ili statističke karakteristike.

Vrste statističkih karakteristika.

Redovi distribucije se nazivaju atributivni izgrađen po kriterijumima kvaliteta. Atributivno– ovo je znak koji ima ime (na primjer, profesija: krojačica, učiteljica, itd.).
Serija distribucije se obično prikazuje u obliku tabela. U tabeli 2.8 prikazuje seriju raspodjele atributa.
Tabela 2.8 - Distribucija vrsta pravne pomoći koju pružaju advokati građanima jednog od regiona Ruske Federacije.

Varijacijska serija– to su vrijednosti karakteristike (ili intervala vrijednosti) i njihove frekvencije.
Varijabilne serije su distribucijske serije, izgrađen na kvantitativnoj osnovi. Bilo koja serija varijacija sastoji se od dva elementa: opcija i frekvencija.
Varijantama se smatraju pojedinačne vrijednosti karakteristike koje ona uzima u nizu varijacija.
Učestalosti su brojevi pojedinačnih opcija ili svake grupe varijantne serije, tj. Ovo su brojevi koji pokazuju koliko se često određene opcije pojavljuju u seriji distribucije. Zbir svih frekvencija određuje veličinu cjelokupne populacije, njen volumen.
Frekvencije su učestalosti izražene kao dijelovi jedinice ili kao postotak ukupnog iznosa. Prema tome, zbir frekvencija je jednak 1 ili 100%. Varijaciona serija omogućava procjenu oblika zakona raspodjele na osnovu stvarnih podataka.

U zavisnosti od prirode varijacije osobine, postoje diskretne i intervalne varijacione serije.
Primjer diskretne serije varijacija dat je u tabeli. 2.9.
Tabela 2.9 - Raspodjela porodica prema broju nastanjenih soba u pojedinačnim stanovima 1989. godine u Ruskoj Federaciji.

Prva kolona tabele predstavlja opcije za diskretnu seriju varijacija, druga kolona sadrži frekvencije serije varijacija, a treća sadrži indikatore frekvencije.

Varijacijska serija

IN stanovništva istražuje se određena kvantitativna osobina. Iz njega se nasumično izdvaja uzorak zapremine n, odnosno broj elemenata uzorka je jednak n. U prvoj fazi statističke obrade, rangiranje uzorci, tj. redosled brojeva x 1 , x 2 , …, x n Uzlazno. Svaka posmatrana vrednost x i pozvao opcija. Frekvencija m i je broj zapažanja vrijednosti x i u uzorku. Relativna frekvencija (frekvencija) w i je omjer frekvencija m i na veličinu uzorka n: .
Prilikom proučavanja varijacionih serija koriste se i koncepti akumulirane frekvencije i akumulirane frekvencije. Neka x neki broj. Zatim broj opcija , čije su vrijednosti manje x, naziva se akumulirana frekvencija: za x i n naziva se akumulirana frekvencija w i max.
Karakteristika se naziva diskretno varijabilnom ako se njene pojedinačne vrijednosti (varijante) razlikuju jedna od druge za određenu konačnu vrijednost (obično cijeli broj). Varijacijski niz takve karakteristike naziva se diskretni varijacioni niz.

Tabela 1. Opšti pogled na diskretnu varijantnu seriju frekvencija

Karakteristične vrijednostix i x 1 x 2 x n
Frekvencijem i m 1 m 2 m n

Karakteristika se naziva kontinuirano promjenjiva ako se njene vrijednosti razlikuju jedna od druge za proizvoljno mali iznos, tj. znak može uzeti bilo koju vrijednost u određenom intervalu. Kontinuirani niz varijacija za takvu karakteristiku naziva se interval.

Tabela 2. Opšti prikaz intervalnih varijacionih serija frekvencija

Tabela 3. Grafičke slike serije varijacija

RedPoligon ili histogramEmpirijska funkcija distribucije
Diskretno
Interval
Pregledom rezultata promatranja utvrđuje se koliko vrijednosti varijanti spada u svaki određeni interval. Pretpostavlja se da svaki interval pripada jednom od svojih krajeva: ili u svim slučajevima lijevo (češće) ili u svim slučajevima desno, a frekvencije ili frekvencije pokazuju broj opcija sadržanih unutar navedenih granica. Razlike a i – a i +1 nazivaju se parcijalni intervali. Da bi se pojednostavili naknadni proračuni, niz intervalnih varijacija može se zamijeniti uslovno diskretnim. U ovom slučaju, prosječna vrijednost i-interval se uzima kao opcija x i, i odgovarajuću frekvenciju intervala m i– za frekvenciju ovog intervala.
Za grafički prikaz varijacionih serija najčešće se koriste poligon, histogram, kumulativna kriva i empirijska funkcija raspodjele.

U tabeli 2.3 (Grupacija ruskog stanovništva prema prosječnom dohotku po glavi stanovnika u aprilu 1994.) je prikazana intervalne varijacione serije.
Pogodno je analizirati nizove distribucije pomoću grafičke slike, koja omogućava prosuđivanje oblika distribucije. Vizuelni prikaz prirode promjena u frekvencijama varijacionih serija je dat pomoću poligon i histogram.
Poligon se koristi kada se prikazuje diskretna serija varijacija.
Hajde da, na primjer, grafički prikažemo raspodjelu stambenog fonda po tipu stana (tabela 2.10).
Tabela 2.10 - Raspodjela stambenog fonda urbanog područja prema tipu stana (uslovne brojke).


Rice. Distribucija stambenog prostora


Na osi ordinata mogu se nacrtati ne samo vrijednosti frekvencija, već i frekvencije serije varijacija.
Histogram se koristi za prikaz niza intervalnih varijacija. Prilikom konstruiranja histograma, vrijednosti intervala se iscrtavaju na osi apscise, a frekvencije su prikazane pravokutnicima izgrađenim na odgovarajućim intervalima. Visina stubova u slučaju jednakih intervala treba da bude proporcionalna frekvencijama. Histogram je graf u kojem je niz prikazan u obliku šipki koje se nalaze jedna uz drugu.
Hajde da grafički prikažemo niz intervalne distribucije date u tabeli. 2.11.
Tabela 2.11 - Raspodjela porodica prema veličini stambenog prostora po osobi (uslovne brojke).
N p/p Grupe porodica prema veličini stambenog prostora po osobi Broj porodica sa datom veličinom stambenog prostora Kumulativni broj porodica
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TOTAL 115 ----


Rice. 2.2. Histogram distribucije porodica prema veličini stambenog prostora po osobi


Koristeći podatke akumulirane serije (tabela 2.11), konstruišemo kumulirajuća distribucija.


Rice. 2.3. Kumulativna distribucija porodica prema veličini stambenog prostora po osobi


Reprezentacija varijacione serije u obliku kumulata je posebno efikasna za varijacione serije čije su frekvencije izražene kao razlomci ili procenti zbira frekvencija serija.
Ako promijenimo osi kada grafički prikazujemo niz varijacija u obliku kumulata, onda ćemo dobiti ogiva. Na sl. 2.4 prikazuje ogive konstruisano na osnovu podataka u tabeli. 2.11.
Histogram se može pretvoriti u poligon distribucije pronalaženjem središta stranica pravougaonika, a zatim povezivanjem ovih tačaka pravim linijama. Rezultirajući poligon distribucije prikazan je na Sl. 2.2 sa isprekidanom linijom.
Prilikom konstruiranja histograma distribucije varijacionog niza s nejednakim intervalima, duž ordinatne ose nisu iscrtane frekvencije, već gustoća distribucije karakteristike u odgovarajućim intervalima.
Gustina distribucije je frekvencija izračunata po jedinici širine intervala, tj. koliko jedinica u svakoj grupi ima po jedinici vrijednosti intervala. Primjer izračunavanja gustine distribucije prikazan je u tabeli. 2.12.
Tabela 2.12 - Distribucija preduzeća po broju zaposlenih (uslovne brojke)
N p/p Grupe preduzeća prema broju zaposlenih, ljudi. Broj preduzeća Veličina intervala, ljudi. Gustina distribucije
A 1 2 3=1/2
1 Do 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TOTAL 147 ---- ----

Može se koristiti i za grafičko predstavljanje serije varijacija kumulativna kriva. Koristeći kumulaciju (krivulja zbira), prikazan je niz akumuliranih frekvencija. Kumulativne frekvencije se određuju uzastopnim zbrajanjem frekvencija po grupama i pokazuju koliko jedinica u populaciji ima vrijednosti atributa ne veće od vrijednosti koja se razmatra.


Rice. 2.4. Ogive raspodjele porodica prema veličini stambenog prostora po osobi

Prilikom konstruiranja kumulata intervalne varijacione serije, varijante niza se crtaju duž ose apscise, a akumulirane frekvencije se crtaju duž ordinatne ose.

Karakteristike koje proučava statistika variraju (razlikuju se jedna od druge) među različitim jedinicama stanovništva u istom periodu ili vremenskom trenutku. Na primjer, iznos spoljnotrgovinskog prometa varira između odjeljenja Federalne carinske službe; količina izvoza (uvoza) varira po pravcu izvoza (za različite zemlje partnere u spoljnoj trgovini), po vrsti robe itd.

Razlog varijacije su različiti uslovi za postojanje različitih jedinica totaliteta. Na primjer, veliki broj razloga utiče na obim vanjske trgovine u različitim zemljama svijeta.

Za upravljanje i proučavanje varijacija pomoću statistike razvijene su posebne metode za proučavanje varijacija, sistem indikatora uz pomoć kojih se mjeri varijacija i karakterišu njena svojstva.

Prva faza statističkog proučavanja varijacije je konstrukcija distribucijske serije(ili varijantne serije) – uređena distribucija jedinica populacije prema rastućim (češće) ili opadajućim (rjeđe) vrijednostima karakteristike i brojanju broja jedinica sa određenom vrijednošću karakteristike.

postoje 3 vrsta red distribucije:

1) rangirana serija– ovo je lista pojedinačnih jedinica stanovništva u rastućem redoslijedu prema osobini koja se proučava (na primjer, tabela 11); ako je broj populacijskih jedinica dovoljno velik, rangirana serija postaje glomazna, te se u takvim slučajevima distribucijski niz konstruira grupiranjem jedinica populacije prema vrijednostima karakteristike koja se proučava (ako karakteristika ima mali broj vrijednosti , tada se konstruiše diskretni niz, a inače intervalni niz);

2) diskretne serije- ovo je tabela koja se sastoji od dvije kolone (reda) - specifične vrijednosti različite karakteristike Xi i broj populacijskih jedinica sa datom karakterističnom vrijednošću fi– frekvencije; broj grupa u diskretnoj seriji određen je brojem stvarno postojećih vrijednosti različite karakteristike;

3) intervalne serije- ovo je tabela koja se sastoji od dvije kolone (reda) - intervala različite karakteristike Xi i broj populacijskih jedinica koje spadaju u dati interval (učestalosti), ili udio ovog broja u ukupnom broju populacija (učestalosti).

Izgradimo niz distribucije spoljnotrgovinskog prometa (FO) na carinskim ispostavama u Rusiji, za šta je potrebno izvršiti statističko posmatranje, odnosno prikupiti primarni statistički materijal, koji predstavlja vrijednost VO na carinskim ispostavama.

Rezultate posmatranja VO na 35 carinskih ispostava u regionu za izvještajni period prikazaćemo u vidu serije distribucije rangirane po rastu vrijednosti VO (tabela 11).

Tabela 11. Spoljnotrgovinski promet (FO) za 35 carinskih ispostava, miliona dolara.

Poštanski broj

Poštanski broj

Poštanski broj

Odredimo prosječnu veličinu VO koristeći formulu (10), uzimajući kao X vrijednost VO, i za N– broj postova:

= = 2100/35 = 60 (miliona dolara)

Odredit ćemo varijansu (o tome ćemo govoriti malo kasnije - u 4. fazi analize varijacije u ovoj temi) koristeći formulu (28):

= = 445.778 (miliona dolara 2)

Napravimo intervalnu seriju distribucije VO po carinskim ispostavama, za koju je potrebno odabrati optimalan broj grupa (atributnih intervala) i odrediti dužinu (opseg) intervala. Budući da se prilikom analize distributivnog niza upoređuju frekvencije u različitim intervalima, potrebno je da dužina intervala bude konstantna. Optimalan broj grupa je odabran tako da se raznolikost vrijednosti atributa u agregatu u dovoljnoj mjeri odrazi i, istovremeno, obrazac distribucije ne bude iskrivljen slučajnim fluktuacijama frekvencije. Ako ima premalo grupa, obrazac varijacije se neće pojaviti; ako ima previše grupa, slučajni skokovi frekvencije će iskriviti oblik distribucije.

Najčešće se broj grupa u nizu distribucije određuje pomoću Sturgessove formule (19) ili (20):

(19) ili ,(20)

Gdje k– broj grupa (zaokružen na najbliži cijeli broj); N– veličina populacije.

Iz Sturgessove formule jasno je da je broj grupa funkcija volumena podataka ( N).

Znajući broj grupa, izračunajte dužinu (raspon) intervala koristeći formulu (21):

,(21)

Gdje X max i X min - maksimalne i minimalne vrijednosti ukupno.

U našem primjeru o VO, koristeći Sturgessovu formulu (19), određujemo broj grupa:

k = 1 + 3,322lg 35 = 1+ 3,322*1,544 = 6,129 ≈ 6.

Izračunajmo dužinu (raspon) intervala koristeći formulu (21):

h= (111,16 – 24,16)/6 = 87/6 = 14,5 (miliona dolara).

Sada napravimo intervalnu seriju sa 6 grupa sa intervalom od 14,5 miliona dolara. (vidi prve 3 kolone tabele 12).

Tabela 12. Intervalna serija distribucije VO po carinskim ispostavama, milioni dolara.

Grupe postova prema veličini VO

Broj postova

Sredina intervala

X ja fi

Akumulacija frekvencija

| Xi- |fi

(Xi- )2 fi

(Xi- )3 fi

(Xi- )4 fi

96,66 – 111,16

Grafički prikaz pruža značajnu pomoć u analizi distributivnih serija i njegovih svojstava. Intervalni niz je prikazan trakastim grafikonom, u kojem su osnove šipki koje se nalaze duž apscisne osi intervali vrijednosti promjenjive karakteristike, a visine šipki su frekvencije koje odgovaraju skali duž ordinate osi. Grafički prikaz raspodjele carinskih ispostava u uzorku prema vrijednosti VO prikazan je na Sl. 4. Ova vrsta dijagrama se zove histogram .

Rice. 4. Histogram distribucije Sl. 5. Poligon distribucije

Tablični podaci 12 i sl. 4 prikazuju oblik raspodjele karakterističan za mnoge karakteristike: vrijednosti prosječnih intervala karakteristike su češće, a ekstremne (male i velike) vrijednosti karakteristike su manje uobičajene. Oblik ove distribucije je blizak normalnom zakonu raspodjele, koji se formira ako na promjenljivu varijablu utiče veliki broj faktora, od kojih nijedan nema preovlađujući značaj.

Ako postoji diskretna distributivna serija ili se koriste sredine intervala (kao u našem primjeru o VO - u tabeli 12 u 4. koloni sredine intervala se izračunavaju kao polovični zbroj vrijednosti početka i kraj intervala), tada se naziva grafički prikaz takvog niza poligon(vidi sliku 5), koji se dobija spajanjem tačaka sa koordinatama pravim linijama Xi I fi.

U mnogim slučajevima, kada statistička populacija uključuje veliki ili, još više, beskonačan broj varijanti, što se najčešće dešava uz kontinuirane varijacije, praktično je nemoguće i nepraktično formirati grupu jedinica za svaku varijantu. U takvim slučajevima, kombinovanje statističkih jedinica u grupe moguće je samo na osnovu intervala, tj. takva grupa koja ima određene granice za vrijednosti različite karakteristike. Ove granice su označene sa dva broja koja označavaju gornju i donju granicu svake grupe. Korištenje intervala dovodi do formiranja intervalne serije raspodjele.

Interval rad je varijacioni niz čije su varijante predstavljene u obliku intervala.

Intervalni niz se može formirati sa jednakim i nejednakim intervalima, dok izbor principa za konstruisanje ove serije zavisi uglavnom od stepena reprezentativnosti i pogodnosti statističke populacije. Ako je populacija dovoljno velika (reprezentativna) po broju jedinica i potpuno je homogena po svom sastavu, onda je preporučljivo formiranje intervalne serije bazirati na jednakosti intervala. Obično se, koristeći ovaj princip, formira intervalna serija za one populacije kod kojih je raspon varijacije relativno mali, tj. maksimalne i minimalne opcije se obično nekoliko puta razlikuju jedna od druge. U ovom slučaju, vrijednost jednakih intervala se izračunava omjerom raspona varijacije karakteristike prema datom broju formiranih intervala. Odrediti jednako I interval, može se koristiti Sturgessova formula (obično sa malim varijacijama karakteristika intervala i velikim brojem jedinica u statističkoj populaciji):

gdje je x i - jednaka vrijednost intervala; X max, X min - maksimalne i minimalne opcije u statističkom agregatu; n . - broj jedinica u agregatu.

Primjer. Preporučljivo je izračunati veličinu jednakog intervala za gustinu radioaktivne kontaminacije cezijem - 137 u 100 naselja Krasnopoljskog okruga Mogiljevske regije, ako je poznato da je početna (minimalna) opcija jednaka I km / km 2, finale ( maksimalno) - 65 ki/km 2. Koristeći formulu 5.1. dobijamo:

Shodno tome, da bi se formirao intervalni niz sa jednakim intervalima u smislu gustine kontaminacije cezijem - 137 naselja u Krasnopoljskom regionu, veličina jednakog intervala može biti 8 ki/km 2 .

U uslovima neravnomerne distribucije, tj. kada su maksimalne i minimalne opcije stotine puta, pri formiranju intervalne serije možete primijeniti princip nejednako intervalima. Nejednaki intervali se obično povećavaju kako prelazimo na veće vrijednosti karakteristike.

Oblik intervala može biti zatvoren ili otvoren. Zatvoreno Uobičajeno je da se pozivaju intervali koji imaju i donju i gornju granicu. Otvori intervali imaju samo jednu granicu: u prvom intervalu postoji gornja granica, u posljednjem je donja granica.

Preporučljivo je vrednovati intervalne serije, posebno sa nejednakim intervalima, uzimajući u obzir gustina distribucije, najjednostavniji način da izračunate koji je omjer lokalne frekvencije (ili frekvencije) i veličine intervala.

Da biste praktično formirali intervalnu seriju, možete koristiti izgled tabele. 5.3.

Tabela 5.3. Postupak formiranja intervalne serije naselja u Krasnopoljskom regionu prema gustini radioaktivne kontaminacije cezijem –137

Glavna prednost intervalne serije je njen maksimum kompaktnost. istovremeno, u nizu intervalne distribucije, pojedinačne varijante karakteristike su skrivene u odgovarajućim intervalima

Kada se grafički prikazuje intervalni niz u sistemu pravokutnih koordinata, gornje granice intervala se iscrtavaju na osi apscise, a lokalne frekvencije niza na osi ordinata. Grafička konstrukcija intervalne serije razlikuje se od konstrukcije poligona distribucije po tome što svaki interval ima donju i gornju granicu, a dvije apscise odgovaraju jednoj vrijednosti ordinate. Dakle, na grafu intervalnog niza nije označena tačka, kao u poligonu, već prava koja spaja dve tačke. Ove horizontalne linije su međusobno povezane vertikalnim linijama i dobija se lik stepenastog poligona, koji se obično naziva histogram distribucija (slika 5.3).

Kada se grafički konstruiše intervalna serija za dovoljno veliku statističku populaciju, histogram se približava simetrično oblik distribucije. U onim slučajevima kada je statistička populacija po pravilu mala, asimetrično histogram.

U nekim slučajevima je preporučljivo formirati niz akumuliranih frekvencija, tj. kumulativno red. Kumulativni niz može se formirati na osnovu diskretne ili intervalne serije raspodjele. Kada se grafički prikazuje kumulativni niz u sistemu pravokutnih koordinata, varijante se iscrtavaju na os apscisa, a akumulirane frekvencije (frekvencije) na osi ordinata. Rezultirajuća kriva linija se obično naziva kumulativno distribucija (slika 5.4).

Formiranje i grafičko predstavljanje različitih tipova varijacionih serija doprinosi pojednostavljenom proračunu glavnih statističkih karakteristika, koje su detaljno obrađene u temi 6, i pomaže da se bolje razume suština zakona distribucije statističke populacije. Analiza varijacionih serija dobija posebnu važnost u slučajevima kada je potrebno identifikovati i pratiti odnos između opcija i frekvencija (učestalosti). Ova zavisnost se manifestuje u činjenici da je broj predmeta po opciji na određeni način povezan sa veličinom ove opcije, tj. sa povećanjem vrijednosti promjenjive karakteristike, frekvencije (frekvencije) ovih vrijednosti doživljavaju određene, sistematske promjene. To znači da brojevi u stupcu frekvencije (frekvencije) ne fluktuiraju haotično, već se mijenjaju u određenom smjeru, određenim redoslijedom i redoslijedom.

Ako frekvencije pokazuju određenu sistematičnost u svojim promjenama, onda to znači da smo na putu da identifikujemo obrazac. Sistem, red, redosled u promenama frekvencija je odraz opštih uzroka, opštih stanja karakterističnih za celokupnu populaciju.

Ne treba pretpostaviti da je obrazac distribucije uvijek dat u gotovom obliku. Postoji dosta serija varijacija u kojima frekvencije nakazno skaču, ponekad rastu, ponekad opadaju. U takvim slučajevima, preporučljivo je saznati s kakvom se distribucijom istraživač bavi: ili ova distribucija uopće nema inherentne obrasce ili njena priroda još nije otkrivena: prvi slučaj je rijedak, ali drugi slučaj je prilično česta i vrlo raširena pojava.

Dakle, pri formiranju intervalne serije ukupan broj statističkih jedinica može biti mali, a svaki interval sadrži mali broj varijanti (na primjer, 1-3 jedinice). U takvim slučajevima ne može se računati na ispoljavanje bilo kakvog obrasca. Da bi se na osnovu slučajnih posmatranja dobio prirodni rezultat, mora stupiti na snagu zakon velikih brojeva, tj. tako da za svaki interval ne bi bilo nekoliko, već desetine i stotine statističkih jedinica. U tu svrhu moramo pokušati povećati broj zapažanja što je više moguće. Ovo je najsigurniji način otkrivanja obrazaca u masovnim procesima. Ako ne postoji stvarna prilika da se poveća broj opservacija, tada se identificiranje uzorka može postići smanjenjem broja intervala u seriji distribucije. Smanjenjem broja intervala u nizu varijacija, povećava se broj frekvencija u svakom intervalu. To znači da su nasumične fluktuacije svake statističke jedinice superponirane jedna na drugu, „izglađena“, pretvarajući se u obrazac.

Formiranje i konstrukcija varijacionih serija omogućava nam da dobijemo samo opštu, približnu sliku distribucije statističke populacije. Na primjer, histogram samo u grubom obliku izražava odnos između vrijednosti karakteristike i njenih frekvencija (učestalosti), dakle, varijacioni nizovi su u suštini samo osnova za dalje, dubinsko proučavanje unutrašnje pravilnosti statike. distribucija.

TEST PITANJA ZA TEMU 5

1. Šta je varijacija? Šta uzrokuje varijacije u osobini u statističkoj populaciji?

2. Koje vrste varirajućih karakteristika se mogu pojaviti u statistici?

3. Šta je varijacioni niz? Koje vrste varijacionih serija mogu postojati?

4. Šta je rangirana serija? Koje su njegove prednosti i mane?

5. Šta je diskretna serija i koje su njene prednosti i mane?

6. Kakav je postupak formiranja intervalnog niza, koje su njegove prednosti i nedostaci?

7. Šta je grafički prikaz rangiranih, diskretnih, intervalnih serija distribucije?

8. Šta je kumulat distribucije i šta ga karakteriše?

Visoko stručno obrazovanje

„RUSKA AKADEMIJA NARODNE EKONOMIJE I

DRŽAVNA SLUŽBA KOD PREDSJEDNIKA

RUSKA FEDERACIJA"

(filijala Kaluga)

Prirodno-matematički odsjek

TEST

U disciplini "Statistika"

Student___Mayboroda Galina Yurievna______

Dopisni odjel Fakulteta državne i općinske uprave grupe G-12-B

Nastavnik ____________________ Hamer G.V.

Kandidat pedagoških nauka, vanredni profesor

Kaluga-2013

Zadatak 1.

Zadatak 1.1. 4

Problem 1.2. 16

Problem 1.3. 24

Problem 1.4. 33

Zadatak 2.

Zadatak 2.1. 43

Zadatak 2.2. 48

Problem 2.3. 53

Problem 2.4. 58

Zadatak 3.

Zadatak 3.1. 63

Problem 3.2. 68

Problem 3.3. 73

Problem 3.4. 79

Zadatak 4.

Problem 4.1. 85

Problem 4.2. 88

Problem 4.3. 90

Problem 4.4. 93

Spisak korištenih izvora. 96

Zadatak 1.

Zadatak 1.1.

O proizvodnji proizvoda i visini dobiti regionalnih preduzeća dostupni su sljedeći podaci (Tabela 1).

Tabela 1

Podaci o proizvodnji i visini dobiti po preduzećima

Preduzeće br. Proizvodnja proizvoda, milion rubalja. Dobit, milion rubalja Preduzeće br. Proizvodnja proizvoda, milion rubalja. Dobit, milion rubalja
63,0 6,7 56,0 7,2
48,0 6,2 81,0 9,6
39,0 6,5 55,0 6,3
28,0 3,0 76,0 9,1
72,0 8,2 54,0 6,0
61,0 7,6 53,0 6,4
47,0 5,9 68,0 8,5
37,0 4,2 52,0 6,5
25,0 2,8 44,0 5,0
60,0 7,9 51,0 6,4
46,0 5,5 50,0 5,8
34,0 3,8 65,0 6,7
21,0 2,1 49,0 6,1
58,0 8,0 42,0 4,8
45,0 5,7 32,0 4,6

Prema prvim podacima:

1. Konstruisati statističku seriju distribucije preduzeća po proizvodnji, formirajući pet grupa sa jednakim intervalima.

Konstruisati grafove serija distribucije: poligon, histogram, kumulacija. Grafički odredite vrijednost moda i medijana.

2. Izračunati karakteristike distributivnog niza preduzeća prema outputu: aritmetička sredina, disperzija, standardna devijacija, koeficijent varijacije.

Izvucite zaključak.

3. Metodom analitičkog grupisanja utvrditi prisustvo i prirodu korelacije između troškova proizvedenih proizvoda i visine dobiti po preduzeću.

4. Izmjerite bliskost korelacije između troškova proizvodnje i iznosa dobiti koristeći empirijsku korelaciju.

Izvucite opšte zaključke.

Rješenje:

Konstruirajmo statističku seriju distribucije

Za konstruisanje intervalne varijacione serije koja karakteriše distribuciju preduzeća po obimu proizvodnje, potrebno je izračunati vrednost i granice intervala serije.

Kada se konstruiše niz sa jednakim intervalima, veličina intervala h određena formulom:

x max I x min– najveće i najmanje vrijednosti atributa u populaciji preduzeća koja se proučavaju;

k- broj grupa intervalnih serija.

Broj grupa k navedeno u uslovu zadatka. k= 5.

x max= 81 milion rubalja, x min= 21 milion rubalja.

Izračun veličine intervala:

miliona rubalja

Uzastopnim dodavanjem vrijednosti intervala h = 12 miliona rubalja. do donje granice intervala dobijamo sledeće grupe:

Grupa 1: 21 – 33 miliona rubalja.

Grupa 2: 33 – 45 miliona rubalja;

Grupa 3: 45 – 57 miliona rubalja.

Grupa 4: 57 – 69 miliona rubalja.

Grupa 5: 69 – 81 milion rubalja.

Za konstruiranje intervalne serije potrebno je izbrojati broj preduzeća uključenih u svaku grupu ( frekvencijske grupe).

Proces grupisanja preduzeća po obimu proizvodnje prikazan je u pomoćnoj tabeli 2. Kolona 4 ove tabele je neophodna za konstruisanje analitičkog grupisanja (tačka 3 zadatka).

Tabela 2

Tabela za konstruisanje intervalnih redova raspodele i

analitička grupa

Grupe preduzeća po obimu proizvodnje, miliona rubalja. Preduzeće br. Proizvodnja proizvoda, milion rubalja. Dobit, milion rubalja
21-33 21,0 2,1
25,0 2,8
28,0 3,0
32,0 4,6
Ukupno 106,0 12,5
33-45 34,0 3,8
37,0 4,2
39,0 6,5
42,0 4,8
44,0 5,0
Ukupno 196,0 24,3
45-57 45,0 5,7
46,0 5,5
47,0 5,9
48,0 6,2
49,0 6,1
50,0 5,8
51,0 6,4
52,0 6,5
53,0 6,4
54,0 6,0
55,0 6,3
56,0 7,2
Ukupno 606,0 74,0
57-69 58,0 8,0
60,0 7,9
61,0 7,6
63,0 6,7
65,0 6,7
68,0 8,5
Ukupno 375,0 45,4
69-81 72,0 8,2
76,0 9,1
81,0 9,6
Ukupno 229,0 26,9
Ukupno 183,1

Na osnovu grupnih ukupnih linija „Ukupno“ Tabele 3, formira se konačna tabela 3, koja predstavlja intervalnu seriju distribucije preduzeća po obimu proizvodnje.

Tabela 3

Distribucija serije preduzeća po obimu proizvodnje

Zaključak. Konstruisano grupisanje pokazuje da distribucija preduzeća po obimu proizvodnje nije ujednačena. Najčešća su preduzeća sa obimom proizvodnje od 45 do 57 miliona rubalja. (12 preduzeća). Najrjeđe su preduzeća sa obimom proizvodnje od 69 do 81 milion rubalja. (3 preduzeća).

Nacrtajmo grafikone serija distribucije.

Poligon češće se koristi za prikaz diskretnih serija. Da bi se konstruirao poligon u pravokutnom koordinatnom sistemu, vrijednosti argumenta se iscrtavaju na x-osi, tj. opcije (za niz varijacija intervala, sredina intervala se uzima kao argument) i vrijednosti frekvencije nalaze se na osi ordinata. Zatim se u ovom koordinatnom sistemu konstruišu tačke čije su koordinate parovi odgovarajućih brojeva iz varijacionog niza. Rezultirajuće tačke su uzastopno povezane ravnim segmentima. Poligon je prikazan na slici 1.

Histogram – trakasti grafikon. Omogućava vam da procijenite simetriju distribucije. Histogram je prikazan na slici 2.

Slika 1 – Poligon za distribuciju preduzeća po obimu

izdanje proizvoda

Moda

Slika 2 – Histogram distribucije preduzeća po obimu

izdanje proizvoda

Moda– vrijednost atributa koji se najčešće javlja u populaciji koja se proučava.

Za intervalnu seriju, mod se može odrediti grafički iz histograma (slika 2). Da biste to učinili, odaberite najviši pravougaonik, koji je u ovom slučaju modalni (45 - 57 miliona rubalja). Desni vrh modalnog pravougaonika se zatim povezuje sa gornjim desnim uglom prethodnog pravougaonika. I lijevi vrh modalnog pravokutnika - sa gornjim lijevim uglom sljedećeg pravokutnika. Zatim, od točke njihovog presjeka, okomica se spušta na osu apscise. Apscisa točke presjeka ovih linija bit će način distribucije.

Milion rub.

Zaključak. U skupu preduzeća koja se razmatraju najčešća su preduzeća sa proizvodnjom od 52 miliona rubalja.

Kumulira – izlomljena kriva. Izgrađen je korišćenjem akumuliranih frekvencija (izračunatih u tabeli 4). Kumulat počinje od donje granice prvog intervala (21 milion rubalja), akumulirana frekvencija se deponuje na gornjoj granici intervala. Kumulat je prikazan na slici 3.

Medijan

Slika 3 - Kumulativna distribucija preduzeća po obimu

izdanje proizvoda

Median Me– ovo je vrijednost atributa koji se nalazi u sredini rangirane serije. Na obje strane medijane nalazi se isti broj populacijskih jedinica.

U intervalnoj seriji, medijan se može odrediti grafički korištenjem kumulativne krivulje. Da biste odredili medijanu iz tačke na akumuliranoj skali frekvencija koja odgovara 50% (30:2 = 15), povucite pravu liniju paralelnu sa osom apscise dok se ne siječe s kumulatom. Zatim se od točke presjeka označene linije s kumulatom okomica spušta na osu apscise. Apscisa tačke preseka je medijana.

Milion rub.

Zaključak. U skupu preduzeća koja se razmatraju, polovina preduzeća ima obim proizvodnje ne veći od 52 miliona rubalja, a druga polovina - ne manje od 52 miliona rubalja.


Povezane informacije.






greška: Sadržaj zaštićen!!