Odaberite Stranica

Vrste varijacionih serija u statistici. Varijabilne i statističke serije distribucije

(definicija varijacionog niza; komponente varijacionog niza; tri oblika varijacionog niza; izvodljivost konstruisanja intervalnog niza; zaključci koji se mogu izvući iz konstruisanog niza)

Serija varijacija je niz svih elemenata uzorka poredanih u neopadajućem redoslijedu. Ponavljaju se identični elementi

Varijabilne serije su serije izgrađene na kvantitativnoj osnovi.

Varijaciona serija distribucije sastoji se od dva elementa: opcija i frekvencija:

Varijante su numeričke vrijednosti kvantitativne karakteristike u seriji varijacije distribucije. Mogu biti pozitivne i negativne, apsolutne i relativne. Dakle, prilikom grupisanja preduzeća prema rezultatima ekonomska aktivnost Pozitivni brojevi znače dobit, a negativni gubitak.

Učestalosti su brojevi pojedinačnih varijanti ili svake grupe varijantne serije, tj. Ovo su brojevi koji pokazuju koliko se često određene opcije pojavljuju u seriji distribucije. Zbir svih frekvencija naziva se volumen populacije i određen je brojem elemenata cijele populacije.

Frekvencije su frekvencije izražene kao relativne vrijednosti (razlomci jedinica ili postoci). Zbir frekvencija jednak je jedan ili 100%. Zamjena frekvencija frekvencijama omogućava da se uporede serije varijacija s različitim brojem opažanja.

Postoje tri oblika varijacionih serija: rangirane serije, diskretne serije i intervalne serije.

Rangirana serija je raspodjela pojedinačnih jedinica populacije u rastućem ili padajućem redoslijedu karakteristike koja se proučava. Rangiranje vam omogućava da lako podijelite kvantitativne podatke u grupe, odmah otkrijete najmanje i najveća vrijednost karakteristika, istaknite vrijednosti koje se najčešće ponavljaju.

Drugi oblici varijacijskih serija su grupne tablice sastavljene prema prirodi varijacije vrijednosti karakteristike koja se proučava. Prema prirodi varijacije razlikuju se diskretne (diskontinuirane) i kontinuirane karakteristike.

Diskretna serija- ovo je varijacioni niz čija se konstrukcija zasniva na karakteristikama sa diskontinualnim promjenom (diskretne karakteristike). Potonji uključuju tarifnu kategoriju, broj djece u porodici, broj zaposlenih u preduzeću itd. Ove karakteristike mogu uzeti samo konačan broj specifičnih vrijednosti.

Diskretna serija varijacija predstavlja tabelu koja se sastoji od dve kolone. Prva kolona označava specifičnu vrijednost atributa, a druga kolona označava broj jedinica u populaciji sa specifičnom vrijednošću atributa.

Ako se neka karakteristika kontinuirano mijenja (iznos prihoda, radni staž, trošak osnovnih sredstava preduzeća itd., koji može poprimiti bilo koju vrijednost u određenim granicama), tada je za ovu karakteristiku potrebno izgraditi intervalnu varijaciju serije.



Grupna tabela ovdje također ima dvije kolone. Prvi označava vrijednost atributa u intervalu "od - do" (opcije), drugi označava broj jedinica uključenih u interval (učestalost).

Učestalost (učestalost ponavljanja) - broj ponavljanja određene varijante vrijednosti atributa, označava se fi, a zbir frekvencija jednak volumenu populacije koja se proučava.

Gdje je k broj opcija za vrijednosti atributa

Vrlo često se tabela dopunjava kolonom u kojoj se izračunavaju akumulirane frekvencije S, koje pokazuju koliko jedinica u populaciji ima karakterističnu vrijednost ne veću od ove vrijednosti.

Diskretni varijacioni niz distribucije je niz u kojem su grupe sastavljene prema osobini koja se diskretno mijenja i uzima samo cjelobrojne vrijednosti.

Intervalni varijacioni niz distribucije je niz u kojem karakteristika grupisanja koja čini osnovu grupisanja može poprimiti bilo koju vrijednost, uključujući i one frakcijske, u određenom intervalu.

Interval varijantne serije je uređeni skup intervala različitih vrijednosti slučajna varijabla s odgovarajućim frekvencijama ili učestalostima pojavljivanja vrijednosti vrijednosti u svakoj od njih.

Intervalne serije Preporučljivo je konstruisati distribucije, prije svega, za kontinuiranu varijaciju neke karakteristike, a takođe i ako se diskretna varijacija manifestuje u širokom rasponu, tj. broj varijanti diskretne karakteristike je prilično velik.

Iz ove serije već se može izvući nekoliko zaključaka. Na primjer, srednji element varijacione serije (medijan) može biti procjena najvjerovatnijeg rezultata mjerenja. Prvi i posljednji element serije varijacija (tj. minimalni i maksimalni element uzorka) pokazuju širenje elemenata uzorka. Ponekad, ako se prvi ili posljednji element jako razlikuje od ostalih elemenata uzorka, oni se isključuju iz rezultata mjerenja, s obzirom da su te vrijednosti dobivene kao rezultat neke vrste grubog kvara, na primjer, tehnologije.

Statističke distribucijske serije– ovo je uređena distribucija populacijskih jedinica u grupe prema određenim varijabilnim karakteristikama.
U zavisnosti od karakteristika na kojima se formira niz distribucije, postoje atributivne i varijacione serije distribucije.

Prisustvo zajedničke karakteristike je osnova za formiranje statističke populacije, koja predstavlja rezultate opisa ili mjerenja. zajedničke karakteristike objekti istraživanja.

Predmet proučavanja u statistici su promjenjive (promjenjive) karakteristike ili statističke karakteristike.

Vrste statističkih karakteristika.

Redovi distribucije se nazivaju atributivni izgrađen po kriterijumima kvaliteta. Atributivno– ovo je znak koji ima ime (na primjer, profesija: krojačica, učiteljica itd.).
Serija distribucije se obično prikazuje u obliku tabela. U tabeli 2.8 prikazuje seriju raspodjele atributa.
Tabela 2.8 - Distribucija vrsta pravne pomoći koju pružaju advokati građanima jednog od regiona Ruske Federacije.

Varijacijska serija– to su vrijednosti karakteristike (ili intervala vrijednosti) i njihove frekvencije.
Varijabilne serije su distribucijske serije, izgrađen na kvantitativnoj osnovi. Bilo koja serija varijacija sastoji se od dva elementa: opcija i frekvencija.
Varijantama se smatraju pojedinačne vrijednosti karakteristike koje ona uzima u nizu varijacija.
Učestalosti su brojevi pojedinačnih varijanti ili svake grupe varijantne serije, tj. Ovo su brojevi koji pokazuju koliko se često određene opcije pojavljuju u seriji distribucije. Zbir svih frekvencija određuje veličinu cjelokupne populacije, njen volumen.
Frekvencije su učestalosti izražene kao dijelovi jedinice ili kao postotak od ukupnog broja. Prema tome, zbir frekvencija je jednak 1 ili 100%. Varijaciona serija omogućava procjenu oblika zakona raspodjele na osnovu stvarnih podataka.

U zavisnosti od prirode varijacije osobine, postoje diskretne i intervalne varijacione serije.
Primjer diskretne serije varijacija dat je u tabeli. 2.9.
Tabela 2.9 - Distribucija porodica prema broju nastanjenih soba u pojedinačnim stanovima 1989. godine u Ruskoj Federaciji.

Prva kolona tabele predstavlja opcije za diskretnu seriju varijacija, druga kolona sadrži frekvencije serije varijacija, a treća sadrži indikatore frekvencije.

Varijacijska serija

IN stanovništva istražuje se određena kvantitativna osobina. Iz njega se nasumično izdvaja uzorak zapremine n, odnosno broj elemenata uzorka je jednak n. U prvoj fazi statističke obrade, rangiranje uzorci, tj. redosled brojeva x 1 , x 2 , …, x n Uzlazno. Svaka posmatrana vrednost x i pozvao opcija. Frekvencija m i je broj zapažanja vrijednosti x i u uzorku. Relativna frekvencija (frekvencija) w i je omjer frekvencija m i na veličinu uzorka n: .
Prilikom proučavanja varijacionih serija također se koriste koncepti akumulirane frekvencije i akumulirane frekvencije. Neka x neki broj. Zatim broj opcija , čije su vrijednosti manje x, naziva se akumulirana frekvencija: za x i n naziva se akumulirana frekvencija w i max.
Karakteristika se naziva diskretno varijabilnom ako se njene pojedinačne vrijednosti (varijante) razlikuju jedna od druge za određenu konačnu vrijednost (obično cijeli broj). Varijacijski niz takve karakteristike naziva se diskretni varijacioni niz.

Tabela 1. Opšti pogled na diskretnu varijantnu seriju frekvencija

Karakteristične vrijednostix i x 1 x 2 x n
Frekvencijem i m 1 m 2 m n

Karakteristika se naziva kontinuirano promjenjiva ako se njene vrijednosti razlikuju jedna od druge za proizvoljno mali iznos, tj. znak može uzeti bilo koju vrijednost u određenom intervalu. Kontinuirani niz varijacija za takvu karakteristiku naziva se interval.

Tabela 2. Opšti prikaz intervalnih varijacionih serija frekvencija

Tabela 3. Grafičke slike serije varijacija

RedPoligon ili histogramEmpirijska funkcija distribucije
Diskretno
Interval
Pregledom rezultata promatranja utvrđuje se koliko vrijednosti opcija spada u svaki određeni interval. Pretpostavlja se da svaki interval pripada jednom od svojih krajeva: ili u svim slučajevima lijevo (češće) ili u svim slučajevima desno, a frekvencije ili frekvencije pokazuju broj opcija sadržanih unutar navedenih granica. Razlike a i – a i +1 nazivaju se parcijalni intervali. Da bi se pojednostavili naknadni proračuni, niz intervalnih varijacija može se zamijeniti uslovno diskretnim. U ovom slučaju, prosječna vrijednost i-interval se uzima kao opcija x i, i odgovarajuću frekvenciju intervala m i– za frekvenciju ovog intervala.
Za grafički prikaz varijacionih serija najčešće se koriste poligon, histogram, kumulativna kriva i empirijska funkcija raspodjele.

U tabeli 2.3 (Grupacija ruskog stanovništva prema prosječnom dohotku po glavi stanovnika u aprilu 1994.) je prikazana intervalne varijacione serije.
Pogodno je analizirati nizove distribucije pomoću grafičke slike, koja omogućava prosuđivanje oblika distribucije. Vizuelni prikaz prirode promjena u frekvencijama varijacionih serija je dat pomoću poligon i histogram.
Poligon se koristi kada se prikazuje diskretna serija varijacija.
Hajde da, na primjer, grafički prikažemo raspodjelu stambenog fonda po tipu stana (tabela 2.10).
Tabela 2.10 - Raspodjela stambenog fonda urbanog područja prema tipu stana (uslovne brojke).


Rice. Distribucija stambenog prostora


Na osi ordinata mogu se nacrtati ne samo vrijednosti frekvencija, već i frekvencije serije varijacija.
Histogram se koristi za prikaz niza intervalnih varijacija. Prilikom konstruiranja histograma, vrijednosti intervala se iscrtavaju na osi apscise, a frekvencije su prikazane pravokutnicima izgrađenim na odgovarajućim intervalima. Visina stubova u slučaju jednakih intervala treba da bude proporcionalna frekvencijama. Histogram je graf u kojem je niz prikazan u obliku šipki koje se nalaze jedna uz drugu.
Hajde da grafički prikažemo niz intervalne distribucije date u tabeli. 2.11.
Tabela 2.11 - Raspodjela porodica prema veličini stambenog prostora po osobi (uslovne brojke).
N p/p Grupe porodica prema veličini stambenog prostora po osobi Broj porodica sa datom veličinom stambenog prostora Kumulativni broj porodica
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TOTAL 115 ----


Rice. 2.2. Histogram distribucije porodica prema veličini stambenog prostora po osobi


Koristeći podatke akumulirane serije (tabela 2.11), konstruišemo kumulirajuća distribucija.


Rice. 2.3. Kumulativna distribucija porodica prema veličini stambenog prostora po osobi


Reprezentacija varijacione serije u obliku kumulata je posebno efikasna za varijacione serije čije su frekvencije izražene kao razlomci ili procenti zbira frekvencija serija.
Ako promijenimo osi kada grafički prikazujemo niz varijacija u obliku kumulata, onda ćemo dobiti ogiva. Na sl. 2.4 prikazuje ogive konstruisano na osnovu podataka u tabeli. 2.11.
Histogram se može pretvoriti u poligon distribucije pronalaženjem središta stranica pravougaonika, a zatim povezivanjem ovih tačaka pravim linijama. Rezultirajući poligon distribucije prikazan je na Sl. 2.2 sa isprekidanom linijom.
Prilikom konstruiranja histograma distribucije varijacionog niza s nejednakim intervalima, duž ordinatne ose nisu iscrtane frekvencije, već gustoća distribucije karakteristike u odgovarajućim intervalima.
Gustina distribucije je frekvencija izračunata po jedinici širine intervala, tj. koliko jedinica u svakoj grupi ima po jedinici vrijednosti intervala. Primjer izračunavanja gustine distribucije prikazan je u tabeli. 2.12.
Tabela 2.12 - Distribucija preduzeća po broju zaposlenih (uslovne brojke)
N p/p Grupe preduzeća prema broju zaposlenih, ljudi. Broj preduzeća Veličina intervala, ljudi. Gustina distribucije
A 1 2 3=1/2
1 Do 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TOTAL 147 ---- ----

Može se koristiti i za grafički prikaz varijacionih serija kumulativna kriva. Koristeći kumulaciju (krivulja zbira), prikazan je niz akumuliranih frekvencija. Kumulativne frekvencije se određuju uzastopnim zbrajanjem frekvencija po grupama i pokazuju koliko jedinica u populaciji ima vrijednosti atributa ne veće od vrijednosti koja se razmatra.


Rice. 2.4. Ogive raspodjele porodica prema veličini stambenog prostora po osobi

Prilikom konstruiranja kumulata intervalne varijacione serije, varijante niza se crtaju duž ose apscise, a akumulirane frekvencije se crtaju duž ordinatne ose.

Varijacija određuje razlike u vrijednostima karakteristike među različitim jedinicama date populacije u istom periodu (trenutku). Varijacije su uzrokovane različitim uslovima postojanja različitih jedinica stanovništva. Na primjer, čak i blizanci tokom života stiču razlike u visini, težini, kao i u karakteristikama kao što su nivo obrazovanja, prihodi, broj djece itd.

Varijacije nastaju kao rezultat činjenice da se same vrijednosti atributa formiraju pod ukupnim utjecajem različitih uvjeta, koji se u svakom pojedinačnom slučaju kombiniraju na različite načine. Dakle, vrijednost svake opcije je objektivna.

Varijacija je karakteristična na sve pojave prirode i društva, bez izuzetka, osim na zakonom utvrđena normativna značenja individualnih društvenih karakteristika. Studije varijacija u statistici su od velike važnosti, one pomažu da se shvati suština fenomena koji se proučava. Pronalaženje varijacije, otkrivanje njenih uzroka, utvrđivanje uticaja pojedinačnih faktora daju važne informacije za implementaciju naučno zasnovanih upravljačkih odluka.

Prosječna vrijednost daje generaliziranu karakteristiku karakteristike populacije, ali ne otkriva njenu strukturu. Prosječna vrijednost ne pokazuje kako se varijante prosječne karakteristike nalaze oko nje, da li su raspoređene blizu prosjeka ili odstupaju od njega. Prosjek u dvije populacije može biti isti, ali u jednoj verziji sve pojedinačne vrijednosti se neznatno razlikuju od njega, au drugoj su te razlike velike, tj. u prvom slučaju varijacija karakteristike je mala, au drugom je velika to je vrlo važno za karakterizaciju značajnosti prosječne vrijednosti.

Da bi rukovodilac organizacije, menadžer ili istraživač proučavao varijaciju i upravljao njome, statistika je razvila posebne metode za proučavanje varijacija (sistem indikatora). Uz njihovu pomoć pronalazi se varijacija i karakteriziraju njena svojstva. Indikatori varijacije uključuju : raspon varijacije, prosječna linearna devijacija, koeficijent varijacije.

Varijacijski nizovi i njegovi oblici

Varijacijska serija- ovo je uređena distribucija jedinica populacije, često prema rastućim (rjeđe opadajućim) vrijednostima karakteristike i računajući broj jedinica s određenom vrijednošću karakteristike. Kada je broj populacijskih jedinica velik, rangirana serija postaje glomazna i njena izgradnja traje dugo. U takvoj situaciji, niz varijacija se konstruira grupiranjem jedinica populacije prema vrijednostima karakteristike koja se proučava.

Postoje sljedeće oblici varijantnih serija :

  1. Rangirana serija predstavlja listu pojedinačnih jedinica populacije u rastućem (opadajućem) redoslijedu karakteristike koja se proučava.
  2. Diskretne serije varijacija - ovo je tabela koja se sastoji od dva reda ili grafikona: specifične vrijednosti varijabilne karakteristike x i broja jedinica populacije sa datom vrijednošću f - frekvencijska karakteristika. Konstruira se kada atribut poprimi najveći broj vrijednosti.
  3. Intervalne serije.

Opseg varijacije je određen kao apsolutna vrijednost razlike između maksimalne i minimalne vrijednosti (varijanti) karakteristike:

Raspon varijacija pokazuje samo ekstremna odstupanja karakteristike i ne odražavaju pojedinačna odstupanja svih opcija u seriji. Karakterizira granice promjene promjenjive karakteristike i ovisi o fluktuacijama dvije ekstremne opcije i apsolutno nije povezan s frekvencijama u nizu varijacija, odnosno s prirodom distribucije, što ovoj vrijednosti daje slučajan karakter. Da biste analizirali varijaciju, potreban vam je indikator koji odražava sve fluktuacije u karakteristikama varijacije i daje opštu karakteristiku. Najjednostavniji indikator ovog tipa je prosječno linearno odstupanje.

Izgrađeni redovi na kvantitativnoj osnovi, nazivaju se varijacijski.

Serija distribucije se sastoji od opcije(karakteristične vrijednosti) i frekvencije(broj grupa). Zovu se frekvencije izražene kao relativne vrijednosti (razlomci, procenti). frekvencije. Zbir svih frekvencija naziva se volumen serije distribucije.

Prema tipu, distribucijski nizovi se dijele na diskretno(konstruirano na osnovu diskontinuiranih vrijednosti karakteristike) i interval(na osnovu kontinuiranih vrijednosti karakteristike).

Varijacijska serija predstavlja dvije kolone (ili reda); od kojih jedna daje pojedinačne vrijednosti promjenjive karakteristike, nazvane varijante i označene sa X; a u drugom - apsolutni brojevi koji pokazuju koliko puta (koliko često) se svaka opcija pojavljuje. Indikatori u drugoj koloni nazivaju se frekvencijama i konvencionalno se označavaju sa f. Napomenimo još jednom da se u drugoj koloni mogu koristiti i relativni indikatori koji karakterišu udio učestalosti pojedinih opcija u ukupnom zbiru frekvencija. Ovi relativni indikatori se nazivaju frekvencijama i konvencionalno se označavaju sa ω Zbir svih frekvencija u ovom slučaju je jednak jedan. Međutim, frekvencije se mogu izraziti i u procentima, a onda zbir svih frekvencija daje 100%.

Ako su varijante varijacionog niza izražene u obliku diskretnih veličina, onda se takav varijacijski niz naziva diskretno.

Za kontinuirane karakteristike, varijacioni nizovi se konstruiraju kao interval, odnosno vrijednosti atributa u njima su izražene "od... do...". U ovom slučaju, minimalne vrijednosti karakteristike u takvom intervalu nazivaju se donjom granicom intervala, a maksimalne - gornjom granicom.

Intervalne serije varijacija su također konstruirane za diskretne karakteristike koje variraju u velikom rasponu. Intervalne serije mogu biti sa jednaka I nejednako u intervalima.

Razmotrimo kako se određuje vrijednost jednakih intervala. Hajde da uvedemo sljedeću notaciju:

i– veličina intervala;

- maksimalna vrijednost karakteristike za jedinice stanovništva;

– minimalna vrijednost karakteristike za jedinice stanovništva;

n – broj dodijeljenih grupa.

, ako je n poznato.

Ako je broj grupa koje treba identificirati teško unaprijed odrediti, onda se za izračunavanje optimalne veličine intervala s dovoljnom veličinom populacije može preporučiti formula koju je predložio Sturgess 1926.:

n = 1+ 3,322 log N, gdje je N broj jedinica u agregatu.

Veličina nejednakih intervala određuje se u svakom pojedinačnom slučaju, uzimajući u obzir karakteristike predmeta proučavanja.

Statistička distribucija uzorka pozovite listu opcija i njihove odgovarajuće frekvencije (ili relativne frekvencije).

Statistička distribucija uzorka može se navesti u obliku tabele, u čijoj se prvoj koloni nalaze opcije, au drugoj - frekvencije koje odgovaraju ovim opcijama ni, ili relativne frekvencije Pi .

Statistička distribucija uzorka

Intervalne serije su varijantne serije u kojima su vrijednosti karakteristika koje su u osnovi njihovog formiranja izražene u određenim granicama (intervalima). Učestalosti se u ovom slučaju ne odnose na pojedinačne vrijednosti atributa, već na cijeli interval.

Intervalne distribucijske serije konstruiraju se na osnovu kontinuiranih kvantitativnih karakteristika, kao i diskretnih karakteristika koje variraju u značajnim granicama.

Intervalna serija može biti predstavljena statističkom distribucijom uzorka koja ukazuje na intervale i njihove odgovarajuće frekvencije. U ovom slučaju, zbir frekvencija varijanti koje spadaju u ovaj interval uzima se kao frekvencija intervala.

Prilikom grupisanja po kvantitativnim kontinuiranim karakteristikama, određivanje veličine intervala je važno.

Osim srednje vrijednosti uzorka i varijanse uzorka, koriste se i druge karakteristike serije varijacije.

Moda Zove se varijanta koja ima najveću frekvenciju.





greška: Sadržaj zaštićen!!