Válassza az Oldal lehetőséget

Másodlagos csoportosítások. A statisztikák összefoglalása és csoportosítása

Cél: ismeretek generálása az elsődleges adatok osztályozási és rendszerezési módszereiről, valamint a kutatási objektum általános jellemzőinek számítási módszereiről.

Feladatok:

Bővítse a statisztikai összesítés és csoportosítás fogalmait, mutassa be megvalósításuk szakaszait;

Foglalja össze a csoportosítási módszereket, határozza meg a jelentést különböző típusok adatrendszerezési célú csoportosítások;

Mutassa be a statisztikai táblázatok készítésének alapelveit;

Ismertesse az eloszlási sorozat fogalmát, mutassa be az eloszlás főbb mutatóit és a gráfok készítésének szabályait!

Az osztályozás és csoportosítás statisztikai módszerei

Statisztikai összefoglaló a vizsgált sokaság egyes egységeire vonatkozó, statisztikai megfigyelés során nyert elsődleges adatok összegzési folyamata annak érdekében, hogy a vizsgált jelenség/folyamat egészére jellemző jellemzőket és mintázatokat azonosítani lehessen.

Ezt a feladatot a népesség egyes részeire (csoportjaira) és a népesség egészére vonatkozó összesítések kiszámításával valósítják meg, melynek eredménye a statisztikai mutatók rendszere.

Így a statisztikai adatok összeállításának folyamata a következő szakaszokra oszlik:

1. Statisztikai adatok csoportosítása;

2. A mutatórendszer számítása;

3. Az eredmények táblázatos és grafikus bemutatása.

A fent leírt műveleti komplexumot néha összetett összegzésnek is nevezik. Ebben az esetben egy egyszerű összegzés alatt a teljes összegek kiszámítására szolgáló műveletek halmazát értjük.

Az összefoglaló összes szakaszának helyes végrehajtása érdekében azokat a vizsgált jelenség/folyamat átfogó elméleti elemzésének kell megelőznie.

A statisztikai vizsgálat tárgyát képező tömegjelenségek/folyamatok sok egyedi tényből állnak, amelyek mindegyike mindkettőt közös vonásai, és az egyéni jellemzők széles skálája. Az egyes megfigyelési egységek tulajdonságainak különbségei teszik szükségessé csoportosításukat.

A statisztikai összesítés elkészítésének egy szakaszaként a csoportosítás a legfontosabb és egyben az egyik legösszetettebb statisztikai módszer, amely meghatározza a későbbi számítások és következtetések helyességét.

Statisztikai csoportosítás- ez az a folyamat, amikor a vizsgált sokaság számos egységét részekre osztják bizonyos, számukra lényeges jellemzők szerint, hogy minőségileg homogén (bizonyos szempontból) csoportokat kapjanak.

Technikailag a statisztikai adatok csoportosításának folyamata a következő lépésekből áll:

1. Csoportosítási jellemző kiválasztása;

2. A sokaság rangsorolása a kiválasztott csoportosítási szempont szerint;

3. A csoportok számának meghatározása;

4. Az intervallum méretének meghatározása;

5. A lakossági egységek megoszlása ​​a kialakult csoportok között.

Csoportosítás jele, vagy egy csoport alapja, lényeges elméletileg alátámasztott jellemző, amellyel a vizsgált sokaság egyes egységeit csoportokra osztják.


A csoportosítási alap megválasztását a statisztikai vizsgálat célja határozza meg. Egy sajátosság jelentősége azt jelenti, hogy a vizsgált jelenség legjellemzőbb vonásait tükrözi sajátos hely- és időviszonyok között. Csoportosítási jellemzőt tehát csak elméleti elemzés eredményeként lehet kiválasztani.

A csoportosítás alapja lehet minőségi és mennyiségi jellemző is. A minőségi (attribútum) jellemzők a megfigyelt egység állapotát tükrözik (például egy személy neme, a gazdaság ágazata, a vállalkozás tulajdoni típusa stb.). A mennyiségi jellemzőknek számszerű kifejezésük van (például árfolyamok, egy személy életkora, családi jövedelme stb.).

A mennyiségi jellemzők viszont lehetnek diszkrétek és folyamatosak. A diszkrét mutatók korlátozott számú lehetséges értéket vesznek fel, amelyek között nem lehetnek köztesek (például egy családban a gyermekek száma, egy lakás szobáinak száma, turistautak száma stb.). Az általában mérések és számítások eredményeként kapott folyamatos mutatók végtelen számú értéket vehetnek fel, pl. A folyamatos indikátor egyedi értékei között köztes értékek is lehetségesek (például egy termék tömege, emberi magasság stb.).

Fontos figyelembe venni, hogy a statisztikai megfigyelés során a diszkrét jellemzők gyakran úgy viselkednek, mint a folytonosak, és fordítva. Így a „lakók száma” diszkrét attribútum a megfigyelés és a regisztráció során egy adott pillanatban azonnal megváltozik, ezért a címtár átlagolt és kerekített információkat ad. Vagy az ellenkező helyzet, amikor egy lényegében folytonos előjel, valamilyen művelet eredménye egy adott pillanatban rögzül.

Az egy jellemzőn alapuló csoportosítást ún egyszerű. A társadalmi-gazdasági jelenségek összetettsége azonban megkövetelheti a népesség szerkezetének egyidejű, több jellemző alapján történő vizsgálatát (például a népesség kor-nemi szerkezetének vizsgálatát). Akkor kb összetett csoportosítás.

Építéskor összetett csoportosítás Figyelembe kell venni, hogy a csoportosítási jellemzők számának növekedésével a csoportok száma meredeken növekszik. Ez pedig csökkenti a végső csoportosítás láthatóságát és a számított mutatók statisztikai stabilitását.

Az összetett csoportosítások lehetnek kombinált és többdimenziósak.

Műszaki konstrukció kombinációs csoport szekvenciális felosztásból áll egy-egy jellemző alapján csoportokba, majd minden csoport alcsoportokba egy másik jellemző alapján stb. Általában egy attribúciós tulajdonsággal kezdődnek, amelynek csoportjai minőségileg különböznek egymástól. A táblázat a népesség nem és életkor szerinti kombinációs csoportosítását mutatja.

A táblázatból a férfiak és nők közel azonos megoszlása ​​mellett az óvodás, iskolás és munkaképes korcsoportok között a munkaképes kor feletti férfiak száma meredeken csökken a nőkhöz képest. Főleg ennek köszönhetően korcsoport A teljes női populáció meghaladja a férfiakét.

asztal

A népesség nem és életkor szerinti megoszlása ​​2008-ban

Nem. Népességcsoportok nemek szerint Beleértve a lakosság életkor szerinti alcsoportjait Létszám, ezer fő
Férfiak 0-6 éves korig 5 184,8
7-15 éves korig 6 336,2
dolgozó kor 45 928,7
8 267,4
TOTAL a csoporthoz 65 717,1
Nők 0-6 éves korig 4 918,5
7-15 éves korig 6 057,9
dolgozó kor 43 822,9
munkaképes kor felett 21 492,5
TOTAL a csoporthoz 76 291,8
TOTAL alcsoportok szerint 0-6 éves korig 10 103,3
7-15 éves korig 12 394,1
dolgozó kor 89 751,6
munkaképes kor felett 29 759,9
TELJES 142 008,9

Többdimenziós csoportosítás nem szekvenciálisan, hanem egyidejűleg, számos jellemző szerint épül fel, hogy minőségileg homogén csoportokat alkosson az objektumok közelségének felmérésére szolgáló bizonyos eljárás alapján.

Osztályozás- ez egy standard vagy normatív csoportosítás, amely az egyes jelenségek csoportokra, osztályokra, kategóriákra, szakaszokra, típusokra stb. hasonlóságaik és különbségeik alapján. Az osztályozás főbb megkülönböztető jegyei a következők. Először is, az osztályozás alapja egy minőségi jellemző. Másodszor, az osztályokra való felosztás általánosan elfogadott standard jellegű, és nem függ a vizsgálat céljaitól.

Harmadszor, a besorolások stabilak, pl. ne változzon hosszú időn keresztül (változtatás csak új osztályok, rangok stb. megjelenésével történik). Szövetségi szolgálat Az oroszországi állami statisztika (Rosstat) számos osztályozót (kódolt objektumlistákat) tart fenn. Például a makrogazdasági statisztika a fajok osztályozását használja gazdasági aktivitás, munkaügyi statisztika - szakmák osztályozása stb.

A csoportosítás alapjának meghatározása után a vizsgált statisztikai sokaságot a csoportosítási kritérium szerint rangsoroljuk, azaz. minden megfigyelési egység a kiválasztott jellemző értékeinek növekvő vagy csökkenő sorrendjében van elrendezve.

A csoportok számát a következő tényezők határozzák meg: a vizsgálat céljai, a csoport alapja, a populáció nagysága, a jellemző variációs foka (variabilitása).

A vizsgálat céljától függően ugyanaz a populáció különböző számú csoportra osztható.

Például a vizsgaülés eredménye alapján a hallgatók csoportosítása két csoportba tehető, ha a vizsgálat feladata valamely tantárgyból sikeresek és nem sikeresek azonosítása; három csoportban, ha az a feladat, hogy azonosítsák a bukókat, a „kielégítőt” és a „jót” és „kiválót” elérőket stb.

A kiválasztott csoportok számát a kiválasztott csoportosítási jellemző is befolyásolja.

Tehát, ha a csoportosítás alapja egy minőségi jellemző, akkor a csoportok számát ennek a jellemzőnek a fokozatainak, típusainak, állapotainak száma határozza meg. Például a népesség nemek szerinti (minőségi) csoportosítása csak két csoportba történhet: férfiak és nők; a külföldi utazások számának csoportosítása az utazás célja szerint - öt csoportba: üzleti, turisztikai, magán, tranzit, kiszolgáló személyzet stb.

Egy mennyiségi kritériumon alapuló csoport lehet diszkrét és intervallumos. BAN BEN diszkrét csoportosítás minden csoport az attribútum egy meghatározott értékét képviseli intervallum- lehetséges értékek tartománya.

Ez a felosztás nem feltétlenül felel meg a csoportosítandó mennyiségi jellemző természetének (diszkrét vagy folyamatos). Egy diszkrét attribútum intervallumonként csoportosítható, ha a lehetséges gradációk száma túl nagy ahhoz, hogy mindegyiket külön csoportokba lehessen szétválasztani. Például, ha a felnőtteket cipőméret szerint csoportosítanák, akkor legalább 13 csoportra (33-45 méretre) lenne szükség.

Ilyenkor célszerű például két méretet egy csoportba összevonni, így intervallum csoportosítást alkotni. Ha egy diszkrét jellemző lehetséges értékeinek száma kicsi, akkor a végső csoportosítás ideálisan homogén lehet e jellemző szerint (például a családok csoportosítása gyermekszám szerint). Intervallum-csoportosítás felépítésénél a létrehozott csoportok csak többé-kevésbé homogének lesznek.

A táblázat a háztartások diszkrét csoportosítását mutatja a „gyermekek száma” alapján. A táblázatból kitűnik, hogy egy családban a gyermekek számának növekedésével a háztartások arányának újraeloszlása ​​következik be, és nő azok száma, akiknek szubjektív megítélése az életkörülményeikről negatív. Ugyanakkor a gyermeklétszám alapján minden csoportban a háztartások több mint fele csak „kielégítőnek” minősíti életkörülményeit.

A táblázat a személygépkocsik kor szerinti intervallumos csoportosítását mutatja. A táblázat azt mutatja, hogy 2006-2007-ben a „középkorú” autók részaránya kismértékben újraeloszlott a „fiatalabb” autók javára. Ugyanakkor a „régi” autók aránya gyakorlatilag nem változott, a teljes flotta valamivel kevesebb mint felét tették ki.

A 16 év alatti gyermeket nevelő háztartások megoszlása ​​a lakáskörülményeikkel való elégedettség mértéke szerint 2007-ben (a megfelelő kategóriába tartozó háztartások teljes számának százalékában)

1) az „Oroszország lakosságának társadalmi helyzete és életszínvonala” című statisztikai gyűjtemény anyagai alapján. 2008"

A személygépkocsi-állomány korösszetétele 2006 -2007. (év végén a teljes összeg százalékában) 1

1) az „Oroszország lakosságának társadalmi helyzete és életszínvonala” című statisztikai gyűjtemény anyagai alapján. 2008"

A csoportok számának meghatározása mennyiségi jellemzőhöz a foktól függ egységessége statisztikai sokaság.

Ha a kiinduló sokaság minőségileg heterogén, akkor a mennyiségi jellemző alapján csoportosítás felépítésénél meghatározzák a csoportok határait, ahol a mennyiség átalakul új minőséggé.

Ha a vizsgált sokaság minőségileg homogén, akkor a sokaság nagysága és a csoportosítási jellemző fluktuációjának mértéke meghatározó a csoportok számának meghatározásánál. A végső kritérium a leghomogénebb és kellően kitöltött csoportok elérése.

Minden kialakított csoportot kellő számú megfigyeléssel kell „ellátni”, hiszen a véletlenszerűség elfojtása és az általános, a vizsgált jelenség/folyamat szempontjából lényeges azonosítása csak a kellően nagy csoportokra vonatkozó számításoknál fordul elő. A kis csoportokra számított mutatók nem lesznek helyesek vagy nem stabilak.

Ha minden más tényező azonos, minél nagyobb egy jellemző variabilitása, annál több csoportot kell kialakítani, mivel ez hozzájárul a vizsgált objektum/folyamat természetének pontosabb leírásához. A túl sok csoport azonban megnehezíti a minták azonosítását, és automatikusan azt eredményezi, hogy az egyes csoportokba kevesebb megfigyelés esik, ami csökkenti az utólag kiszámított mutatók statisztikai stabilitását.

Csoportosítási technikák.

A csoportok számának meghatározására standard statisztikai eljárások használhatók. A leggyakoribb ezek közül az amerikai tudós, Sturgess képletén alapul :

A Sturgess-képlet korlátja a nagyszámú megfigyelés szükségessége és a csoportosítási jellemző eloszlásának a normálishoz való közelsége.

A csoportok számának meghatározása után alakulnak ki intervallumok csoportosítása- bizonyos határokon belüli jellemző értékek.

Intervallum mérete az intervallum felső és alsó határa közötti különbség, azaz. maximális és minimális értékeket.

Az intervallumhatárok kijelölése a csoportosított jellemző jellegétől függ. Ha egy folytonos attribútumot használunk a csoportosítás alapjául, akkor a felső határt én-edik intervallum egybeesik az alsó határértékkel i+1 th. Ha egy diszkrét attribútum van csoportosítva, akkor az alsó határ i+1-edik intervallum egyenlő a felső határértékkel én th plus 1. A táblázat a csoportok határait mutatja az emberek életkor szerinti megoszlásakor. Az I. lehetőségben az életkor alatt értendő folyamatos mennyiség, a II. lehetőségben pedig diszkrétként. Ebben a példában mindkét esetben az intervallumok szélessége azonos és 10 év.

Lehetőségek csoportok létrehozására az „age” attribútumhoz

A határok megléte alapján megkülönböztetünk nyitott és zárt intervallumokat. Nyitott intervallumok azok, amelyekre csak egy határ van meghatározva: a felső (ha az intervallum az első) vagy az alsó (ha az intervallum az utolsó). Mindkét határ zárt időközönként van meghatározva.

A későbbi számításoknál a nyitott intervallum értékét egyenlőnek tekintjük a vele szomszédos intervallum értékével. Tehát a táblázat I. verziójában az első intervallum értéke egyenlő a második értékével, az utolsó pedig az utolsó előtti értékével, azaz. tíz éves.

Ha e szabály szerint kiderül, hogy a nyitott intervallum elméletileg lehetetlen értékeket kezd tartalmazni, akkor a szélességét a jelenség/folyamat logikája határozza meg. Például a táblázatban a második intervallum értéke négy perc. Ebben az esetben a nyitott intervallum értéke nem lehet egyenlő négy perccel, mivel ez azt jelentené, hogy az első intervallum alsó határa negatív lenne, ami az időjellemzőhöz képest lehetetlen. Ez azt jelenti, hogy logikus a nulla és három perc közötti tartományt venni első intervallumnak.

A vezérlőterem kezelőinek csoportosítása átlagos rendelési feldolgozási idő szerint (feltételes adatok)

A táblázat I. lehetőségében bemutatott típus szerinti határok kialakításakor meg kell határozni, hogy mely csoportokba tartoznak azok a megfigyelési egységek, amelyek attribútumértékei egybeesnek a határértékekkel. Ehhez meg kell határozni, hogy az alsó vagy a felső határok közül melyik alakul ki a „befogadó” elv szerint, és melyik a „kizárólagos” elv szerint. A választott megközelítést minden intervallumban azonos módon kell megvalósítani. Nyitott intervallumok is használhatók a biztonság kedvéért. Példánkban az alsó határ a „befogadó” elv szerint, a felső pedig ennek megfelelően „kizárólagosan” van kialakítva.

Az intervallum nagysága alapján megkülönböztetik egyenlő intervallum(az intervallum nagysága minden csoportnál azonos) ill egyenlőtlen intervallum(az intervallum nagysága csoportonként változó) csoportosítások. Az egyenetlenül elhelyezkedő csoportok pedig fokozatosan növekvő/csökkenő, egyformán töltött, specializált és tetszőleges csoportokra oszlanak.

Ha a vizsgált jellemző viszonylag szűk határok között változik, és eloszlása ​​többé-kevésbé egyenletes, akkor célszerű egyenlő intervallumokkal csoportosítani. Az intervallum méretét a következő képlet határozza meg:

A változási tartomány meghatározásakor fontos, hogy a maximális és/vagy minimum értékek ne legyenek bizonyos értelemben „anomálisak”, pl. nagyon különbözik a szomszédos attribútumértékektől. Ellenkező esetben meg kell határozni a minimálisnál valamivel nagyobb és a maximumnál kisebb értékek közötti különbséget.

Ha az intervallum kapott értéke kerekítést igényel, akkor azt felfelé, nem lefelé kell tenni, ellenkező esetben előfordulhat, hogy egyes megfigyelések nem szerepelnek a végső csoportosításban.

Például legyen a statisztikai sokaság 40 utazási társaságból, amelyek bevételei 50 millió dollár és 650 millió dollár között változnak, amelyek az attribútum minimális és maximális értékei. Ekkor a Sturgess-képlet segítségével megkapjuk: . Az egyenlő intervallumú csoportosítás felépítéséhez szükséges intervallum nagyságát a következőképpen határozzuk meg: (millió dollár). Így a cégek halmaza a bevétel alapján hat egyenlő csoportra lesz osztva: , , , , , (millió dollár).

Bár a későbbi feldolgozás egyszerűsége miatt előnyösebb az egyenlő intervallumú csoportosítás, a legtöbb társadalmi-gazdasági jelenség változási mintája nem felel meg az egyenlő intervallumú csoportosítás követelményeinek. Ha a vizsgált jellemző jelentősen és egyenetlenül változik, akkor egyenlőtlen intervallum-csoportosítást kell felépíteni.

A csoporthatárok kialakításának egyik lehetséges megközelítése aritmetikai vagy geometriai progresszió használatán alapul. Ebben az esetben az intervallumok nagyságát a képletek ennek megfelelően határozzák meg.

Az intervallumok méretének meghatározásához ez a megközelítés használható például a városok lakosságszám szerinti csoportosításánál. Az egyenlő intervallumú csoportosítás lehetetlensége ebben az esetben a ritkán lakott városok nagy számának és a „több milliós városok” kis számának köszönhető.

Általános szabály, hogy a bevételek tanulmányozásakor a vállalat teljesítménye alapján bármely iparágban a „progresszív” megközelítés megfelelőbbnek bizonyul, mint az alapítás. egyenlő időközönként. Ezt az a tény diktálja, hogy az alacsony árbevételű kisvállalkozások száma jelentősen meghaladja a nagy teljesítményű nagyvállalatok számát.

Fentebb leírtuk technikai módszerek Az intervallumok méretének meghatározása nem garantálja, hogy nem jelennek meg kis vagy akár „üres” csoportok, amelyekbe egyetlen megfigyelés sem esik. Ha ez megtörténik, módosítani kell a csoportok számát és/vagy az intervallumok méretét, mivel ez a csoportosítás helytelen.

Az egyes csoportokra számított mutatók statisztikai stabilitásának biztosítására használható egyenlő csoportosítás, amelyben a megfigyelések száma az egyes csoportokban megközelítőleg azonos, és a következő képlet határozza meg:

Ha megkapta n nem egész szám és/vagy a jellemző ismétlődő értékei vannak az aggregátumban, akkor a megfigyelések száma az egyes csoportokban változhat. Ugyanakkor törekednünk kell arra, hogy ezek az eltérések jelentéktelenek legyenek.

Ha a kutatási célok megvalósításához csoporthatárokat kell felállítani, ahol a mennyiség új minőséggé alakul át, speciális intervallumokat kell alkalmazni. Így a lakosság életkor szerinti csoportosításánál a munkaerő-erőforrás felmérése érdekében a korcsoportok határai kategóriák szerint állapíthatók meg: munkaképes kor alattiak (16 éves korig), munkaképes korúak (nőknél 16-54 éves korig, férfiaknál tól 16 és 59 év közöttiek) és munkaképes kornál idősebbek (54 év feletti nőknél, 59 év feletti férfiaknál).

A csoporthatárok önkényesen is meghatározhatók, ha a fent leírt módszerek egyike sem adott jó eredményt.

A csoportosítás felépítésének utolsó szakasza a vizsgált statisztikai sokaság egységeinek csoportokra bontása egy kiválasztott (egy vagy több) csoportosítási kritérium szerint.

Csoportos feladatok. Tipológiai, szerkezeti, analitikai és kombinációs csoportosítások.

A csoportosítási módszer a következő problémák megoldását teszi lehetővé:

1. A jelenségek társadalmi-gazdasági típusainak azonosítása;

2. A jelenség szerkezetének és szerkezeti változásainak tanulmányozása;

3. A jelenségek közötti összefüggések és függőségek azonosítása.

A megoldandó feladatoktól függően a következő típusú csoportosításokat különböztetjük meg: tipológiai, szerkezeti, elemző csoportosítások.

Tipológiai csoportosítás- ez a folyamat a vizsgált minőségileg heterogén populáció homogén csoportokra osztása, amelyek a jelenség társadalmi-gazdasági típusait jellemzik.

Lényegében egy osztályozásról lévén szó, a tipológiai csoportosítások általában az elsődleges statisztikai információk általánosításának első szakaszában épülnek fel, ami legtöbbször heterogén. Fontos megérteni, hogy a vizsgálat céljától függően ugyanaz a populáció lehet minőségileg homogén és heterogén. Például az ipari vállalkozások halmaza homogén a termelési jellemzők értékelése szempontjából, és heterogén az adózás megállapítása szempontjából, mivel ez utóbbi függ a tulajdonformától, a kedvezmények elérhetőségétől stb.

Tipológiai csoportosításra példa a lakosság társadalmi csoportok szerinti csoportosítása, a vállalkozások tulajdonosi típus, gazdasági tevékenység típusa stb.

A létező típusú társadalmi-gazdasági jelenségek dinamikai vizsgálata lehetővé teszi, hogy azonosítsuk a köztük lévő kapcsolatok változásait, új típusok megjelenését vagy a régiek halálát.

A tipológiai csoportosítás felépítése során a vizsgált társadalmi-gazdasági jelenség típusainak azonosítását annak átfogó elméleti elemzésére kell alapozni, ami a típusok közötti nem egyértelmű különbségek miatt gyakran igen nehézkes.

A tipológiai csoportosítás mind minőségi, mind mennyiségi jellemzőkön alapulhat. Ebben az esetben az intervallumhatárok megállapítása nem lehet önkényes, hanem az egyik típusból a másikba való átmenet pontjai határozzák meg, pl. szakosodnak.

A tipológiai csoportosítást a táblázat mutatja be. Ebben a példában öt csoport (típus) van azonosítva a „tulajdonlási forma” attribútumban. Az átlagos éves alkalmazotti létszám időbeli elemzése lehetővé teszi, hogy nyomon kövessük egy új típusú jelenség megjelenését. Látható, hogy 1980-ban számos tulajdonosi forma nem létezett, 1990-től pedig jelentősen csökkent a kormányzatban, ill. önkormányzatok a magánszektorban, valamint a külföldi és közös tulajdonú vállalatoknál a foglalkoztatás egyidejű növekedésével. Mivel ebben az esetben teljes szám a foglalkoztatottak száma nem sokat csökkent, megállapíthatjuk, hogy ilyen változások a foglalkoztatottak egyik szférából a másikba való „átmenete” miatt következtek be.

A gazdaságban foglalkoztatottak átlagos éves száma tulajdontípusok szerint (ezer fő)

Strukturális csoportosítás- ez az a folyamat, amikor egy minőségileg homogén populációt olyan csoportokra osztanak, amelyek valamilyen változó jellemző szerint jellemzik a vizsgált jelenség szerkezetét.

A szerkezeti csoportosítások példái a népesség kor, lakóhely szerinti csoportosítása; vállalkozások létszám, tárgyi eszközök értéke stb. szerint.

Egy társadalmi-gazdasági jelenség szerkezetének tanulmányozása nemcsak annak elemzését jelenti alkatrészek, hanem a köztük lévő kapcsolatokat és e kapcsolatok időbeli változásait is.

A kialakítandó csoportokkal szemben a szerkezeti csoportosítás során a fő követelmény az „üres” és kis intervallumok kiválasztásának megakadályozása. Megengedett, hogy az első és az utolsó csoport kis számú megfigyelést tartalmazhat. Ha ilyen „merülések” fordulnak elő a középső intervallumokban, ez leggyakrabban azt jelzi, hogy keveredés történt különböző típusok jelenségek és az eredeti populáció minőségileg heterogének.

A strukturális csoportosítás lehetővé teszi, hogy következtetéseket vonjunk le arra vonatkozóan, hogy mely értékek fordulnak elő leggyakrabban a vizsgált populációban, és melyek a legkevésbé; milyen természetű a népesség egészének szerkezetében bekövetkezett változás (egyenletes vagy egyenetlen).

A szerkezeti csoportosítást a táblázat mutatja be. A csoportadatok azt mutatják, hogy 2005-ben a lakosság több mint 49%-ának volt az egy főre jutó átlagos jövedelme 6000 rubel alatt. havonta, a fennmaradó valamivel több mint 50% pedig szinte egyenletesen oszlott el négy jövedelmi csoport között, 6000 és 20 000 rubel között. havonta.

A következő három év azt mutatja, hogy a lakosság aránya az alacsony jövedelmű csoportokból a „középosztály” javára, illetve a magasabb jövedelmű csoportok megjelenése irányul. Végső következtetést azonban ezekből az adatokból nem lehet levonni, hiszen itt az egy főre jutó átlagos monetáris jövedelem értéke nominálisan, azaz. indexhez nem igazítva fogyasztói árak. Ezért az elemzéshez össze kell hasonlítani ezeket az adatokat a lakosság reáljövedelmeivel.

A népesség megoszlása ​​az egy főre jutó átlagos monetáris jövedelem szerint (százalék) 1

A teljes lakosság, beleértve az egy főre jutó átlagos készpénzjövedelmet is, rubel. havonta:
4000,0-ig 28,9 20,5 14,3 9,8
4000,1-6000,0 20,3 17,7 14,8 12,0
6000,1-8000,0 14,9 14,7 13,6 12,1
8000,1-10000,0 10,3 11,2 11,3 10,9
10000,1-15000,0 13,9 17,1 19,1 20,1
15000,1-20000,0 11,7 8,4 10,6 12,4
20000,1-30000,0 ... 10,4 9,6 12,4
több mint 30000,0 ... ... 6,7 10,3

Elemző csoportosítás- ez egy olyan csoportosítás, amely lehetővé teszi, hogy azonosítsuk a kapcsolat jelenlétét a vizsgált jelenség különböző jelei és ennek a kapcsolatnak az iránya között.

Az analitikus csoportosítás felépítésének folyamata során a vizsgált sokaság összes jellemzőjét két csoportra osztjuk: faktoriálisokra, amelyek befolyásolják a fennmaradó jellemzőket, és effektívekre, amelyek ennek hatására változnak.

Az összefüggések elemzésének más statisztikai módszereitől eltérően az analitikai csoportosításokkal szemben egyetlen követelményt támasztanak: a sokaság minőségi homogenitását.

Az összefüggések tanulmányozásának mélységétől függően elemző csoportosítás, kombinációs csoportosítás és többdimenziós csoportosítás is kialakítható.

Maga az analitikus csoportosítás felépítése abból áll, hogy egy minőségileg homogén sokaságot egy faktorjellemző szerint csoportokra osztanak, és e csoportok szerint kiszámítják egy vagy több effektív jellemző átlagos értékét, hogy azonosítsák a köztük fennálló kapcsolatot és meghatározzák annak irányát. Egy-egy tényezőjellemző csoportosításánál törekednek egyenlő vagy egyformán kitöltött intervallumok kialakítására.

Az eredő jellemző átlagértékének szisztematikus növekedése vagy csökkenése a faktorértékek növekedése következtében megerősíti, hogy közöttük közvetlen ill. Visszacsatolás illetőleg. Az eredményül kapott jellemző átlagértékének rendszertelen változása azt jelzi, hogy nincs kapcsolat ezzel a tényezővel.

Kombinációs csoportosítás lehetővé teszi a jellemzők közötti kapcsolat és e kapcsolat irányának részletesebb értékelését. A két jellemző kapcsolatának leírására szolgáló kombinációs csoportosítás felépítése abból áll, hogy a faktorkarakterisztikának a csoportjait szekvenciálisan felosztjuk a kapott jellemző alcsoportjaira. Kívánatos, hogy a kialakított csoportok intervallumai egyenlő vagy egyenlő mértékben legyenek kitöltve.

A kapcsolat meglétének és irányának értékeléséhez az oszlopok vagy sorok maximális gyakoriságát elemzik. Ha a bal felső saroktól a jobb alsó sarokig tartó átló mentén helyezkednek el, akkor a jellemzők közötti kapcsolat közvetlen és közel lineáris. Ha a maximális frekvenciák az ellenkező átlón vannak (a jobb felső saroktól a bal alsó sarokhoz), akkor a kapcsolat inverz és közel áll a lineárishoz. Ha a maximális frekvenciák elhelyezkedése kaotikus, akkor nincs kapcsolat a jelek között.

Többdimenziós csoportosítások lehetővé teszik nagyszámú jellemző többirányú kapcsolatának értékelését.

A különböző alanyokra egy idő alatt, vagy egy alanyra időben szerkesztett csoportosítások lehetővé teszik a vizsgált jelenség jellemzőiben bekövetkezett változások elemzését. különböző feltételek helyen és időben. Ugyanakkor az összehasonlítás érdekében a csoportosításokat összehasonlítható formába kell hozni. Ezt a problémát a módszer segítségével oldják meg másodlagos csoportosítás . Ugyanakkor ez a módszer csak a csoportok számában és az intervallumok nagyságában mutatkozó különbségek tekintetében szünteti meg az összehasonlíthatóság problémáját, és nem foglalkozik a forrásadatok és a megfigyelési eljárások összehasonlíthatóságának kérdésével.

nem úgy mint elsődleges csoportosítás elsődleges adatok alapján képzett, a másodlagoshoz az előzőleg elvégzett csoportosítás az anyag.

És így, másodlagos csoportosítás- ez egy meglévő csoport átcsoportosításának folyamata, azaz. ennek alapján új csoportok létrehozása.

Technikailag a másodlagos csoportosítást kétféleképpen lehet végrehajtani: az eredeti intervallumok kombinálásával vagy tört átcsoportosítással.

A kezdeti intervallumok kombinálását a kisebbről nagyobb intervallumra való áttéréskor alkalmazzuk, ha az új határok egybeesnek a régiekkel.

A töredékes átcsoportosítást akkor alkalmazzuk, ha egy adott csoporthoz új határokon belüli hozzárendeléshez meg kell határozni, hogy a sokaság egységeinek mely része kerül át a régi csoportokból az újakba. Technikailag a frakcionált átcsoportosítás abból áll, hogy minden csoporthoz hozzárendelik a népességegységek egy bizonyos hányadát, és ezt a részt új határok mentén osztják el, feltételezve, hogy a népességegységek eloszlása ​​az egyes csoportokon belül egyenletes.

Statisztikai táblázatok. Típusaik és építési elveik.

A második szakaszban az adatgyűjtés a csoportokra és a népesség egészére vonatkozó összesítés kiszámításával folytatódik. Korábban a csoportosítások eredményeit táblázatos formában mutattuk be.

Statisztikai táblázat egy táblázat, amely a vizsgált sokaság összefoglaló numerikus jellemzőit tartalmazza egy vagy több logikailag összefüggő jellemző szerint.

A statisztikai táblázat alapja (csontváza) az ábrán látható.

Táblázat címe* (általános cím)

*Jegyzetek az asztalon

A statisztikai táblázat tárgya számokkal jellemezhető vizsgálati tárgy. Lehetnek egy populáció egységei, egységcsoportok vagy egy populáció egésze. Például cégek, régiók, időszakok stb. Általában a táblázat tárgya a bal oldalon található, a sorok nevében.

Statisztikai táblázat predikátuma olyan mutatórendszer, amely egy összegzés eredménye, és a vizsgálat tárgyát jellemzi. Általában a predikátumot a felső címsorok képviselik, azaz. a gráfok nevei, amelyek balról jobbra vannak elrendezve egy logikai sorrendben.

Az általános címsor a táblázat fő tartalma, tömören és áttekinthetően bemutatva, jelezve azt a helyet és időpontot, amelyre a táblázatot alkotó információ vonatkozik.

A tantárgy jellegétől függően egyszerű, csoportos és kombinált statisztikai táblázatokat különböztetnek meg.

Tantárgy egyszerű asztal objektumok, területek, időrendi dátumok egyszerű listája, azaz. nem rendelkezik a megfigyelési egységek csoportosításáról. Tantárgy csoportasztal populációs egységek csoportosítását tartalmazza egy mennyiségi vagy minőségi jellemző szerint. Tantárgy kombinációs asztal populációs egységek szekvenciális csoportosítását tartalmazza egyidejűleg több jellemző szerint, pl. kombinációs csoport.

A predikátum fejlettségi mélységétől függően egyszerű és összetett statisztikai táblázatokat különböztetünk meg. A predikátum egyszerű fejlesztésével az azt alkotó mutatót nem osztjuk alcsoportokra. A predikátum komplex fejlesztése éppen ellenkezőleg, olyan felosztást feltételez, amely lehetővé teszi az objektum minden csoportjának vagy egységének a jellemzők eltérő kombinációjával történő jellemzését.

A statisztikai táblázat elkészítésekor be kell tartania a következő szabályokat:

1. A táblázat tömörsége és áttekinthetősége; redundáns, lényegtelen adatok hiánya; a bemutatott adatoknak közvetlenül tükrözniük kell a vizsgált jelenséget;

2. A táblázat összes címsorának rövid megfogalmazása;

3. Valamennyi mutató mértékegységének feltüntetése: a címben, ha azonosak, valamint a sorok és oszlopok elnevezésében, ha különböznek; általánosan elfogadott rövidítések használata: pers., rub. stb.;

4. Egységesítő címsorok kialakítása, ha az alany vagy állítmány nevében általános kifejezések szerepelnek;

5. Az egymással összefüggő adatok elhelyezkedése a szomszédos grafikonokon;

6. Logikus az alany és az állítmány elemeinek elrendezési sorrendjében (az egyeditől az általánosig, az abszolút értékektől az átlagig és a relatívig stb.);

7. A numerikus adatok kerekítésének azonos fokú pontossága;

8. Az adatok hiányának helyes megjelenítése: kötőjel - jelenség hiányában „nincs információ” vagy „...” - jelenségre vonatkozó információ hiányában; azokban a cellákban, amelyeket nem kell kitölteni, „X” kerül; ha az érték kisebb, mint az elfogadott pontosság, akkor (0,0) vagy (0,00) stb.

9. Összes sorok/grafikonok szükségessége csoportos és kombinációs táblákban; ha kitöltik a táblázatot, akkor az „Összesen” vagy „Összesen” szavakat használják, ha megnyitják, kiegészítik a „beleértve” szavakkal, majd a specifikációval.

A táblázat elolvasása után, i.e. a tartalom megismerése, elemzése történik, amely a vizsgált jelenség jellemzőinek és fejlődésének fő irányzatainak azonosításából áll. Az elemzési eljárás általában az általános eredményektől a konkrét eredmények felé halad, a legtöbbet azonosítva jellegzetes vonásait, részek összehasonlítása és általános következtetések megfogalmazása a táblázatból.

Eloszlási sorozat: diszkrét, intervallum. Intervallumsorok felépítése. Frekvenciák, frekvenciák, eloszlási sűrűségek. Összesített sorozat.

A csoportosítással nyert adatok feldolgozására szolgáló műveletek szerves része egy eloszlási sorozat felépítése.

Elosztási tartomány- ez a populációs egységek rendezett felosztása csoportokba valamilyen változó jellemző szerint.

Az eloszlássorozat a statisztikai csoportosítás elvei alapján készült. Technikailag ez az érdeklődésre számot tartó jellemzők egyszerű csoportosításával valósul meg, amelyben minden egyes érték vagy intervallum hozzá van rendelve azon populációs egységek számához, amelyek ezt az értéket/intervallumot kielégítik.

Így az elosztási sorozat kettőből áll szerkezeti elemek: opció és frekvenciák és/vagy frekvenciák.

választási lehetőség, egy sorozat változó jellemzőjének fajlagos értéke.

Frekvencia, - az egyes változatok vagy az egyes változatcsoportok száma, amely megmutatja, hogy ezek az értékek milyen gyakran fordulnak elő az elosztási sorozatban. Az összes csoport gyakoriságának összege megegyezik a sokaság térfogatával, azaz:

Frekvencia, az egység töredékében vagy a teljes érték százalékában kifejezett gyakoriság. Az összes csoport gyakoriságának összege 1 vagy 100%, azaz:

A mögöttes jellemzőtől függően attribúciós és variációs eloszlási sorozatokat különböztetünk meg. Mivel egy eloszlási sorozat valójában egy csoportosítás, az eloszlási sorozatok típusai teljes mértékben megfelelnek a csoportosítás fent leírt lehetséges fokozatainak.

Attribútum-eloszlási sorozat- Ez egy minőségi alapon felépített sorozat.

Variációs eloszlási sorozat- ez egy mennyiségi alapon felépített sorozat. Ez utóbbi variáció jellege lehet diszkrét vagy folyamatos. Ennek megfelelően megkülönböztetünk diszkrét és intervallum variációs sorozatokat. A csoportosításhoz hasonlóan, ha egy diszkrét attribútum lehetséges gradációinak száma nagy, akkor intervallum-változat-sorozatot állítunk össze neki.

Például, ha egy érdeklődési évet választ ki, a tábla könnyen átalakítható egy attribútumsorrá, amely az alkalmazottak tulajdonosi típusa szerinti megoszlását mutatja be a kiválasztott évben, és a táblázat - intervallum sorozat a lakosság megoszlása ​​az egy főre jutó átlagos jövedelem szerint.

Az eloszlási sorozatok vizsgálata lehetővé teszi a minta jelenlétének azonosítását és jellegének meghatározását a frekvenciák változásaiban a változó jellemző értékeinek változásával, pl. nyomkövetési eloszlási minták. Az eloszlási minták úgy vannak kialakítva, hogy tükrözzék a vizsgált jelenség alapvető tulajdonságait.

Ugyanakkor a szerkezeti csoportosítások homogenitási követelménye is aktuálissá válik, ellenkező esetben a különböző jelenségeket tükröző eloszlások keverednek. Ennek közvetett megerősítése lehet a fentebb leírt változat a csoportosításkor kis medián intervallumok megjelenésében.

A valódi mintázat azonosítását megnehezítheti az intervallum felépítésének eredményeinek helytelen értelmezése variációs sorozat, amely lehet egyenlő intervallumú vagy nem egyenlő intervallumú.

Egyenlőtlen intervallumú eloszlássorozat felépítésekor a gyakoriságok csoportok közötti összehasonlítása nem megfelelő, mivel az intervallumok határainak megváltoztatása teljesen ellentétes következtetésekhez vezethet. Ezért ahhoz, hogy egy jellemző eloszlását helyesen tükrözzük, meg kell szabadulni az intervallum méretének befolyásától, ami a frekvenciáktól/frekvenciáktól az eloszlássűrűség felé való elmozdulással történik.

Abszolút eloszlási sűrűség, az egységnyi intervallumonként számított gyakoriság, azaz:

Relatív eloszlássűrűség, az egységnyi intervallumonként számított gyakoriság, azaz:

A diszkrét és intervallumértékek eloszlásának összehasonlítására a számításon alapuló univerzális megközelítést alkalmazunk felhalmozott frekvenciák/frekvenciák. Ezeket az értékeket a gyakoriságok/frekvenciák csoportonkénti szekvenciális összegzésével határozzák meg az egyes csoportok végén kiszámított összegekkel.

Felhalmozott frekvencia/frekvencia, / az adottnál nem nagyobb jellemző értékű populációs egységek száma/aránya, azaz:

Ezek a frekvenciákon/frekvenciákon keresztül számolva nem lehetnek negatívak (az első intervallum elején „nulla” értéket vesznek fel), maximumukat pedig a sokaság térfogata korlátozza. Az utolsó csoport végére el kell érni ezt a maximumot. A felhalmozott frekvenciák/frekvenciák kumulatív jellege azt jelenti, hogy a csoportértékek növekedésével a nagyságuk csak növekedhet. És így,:

Ha valamelyik csoportban a felhalmozott frekvencia/gyakoriság értéke egybeesik a korábbi értékével, akkor a szóban forgó csoport egyetlen megfigyelést sem tartalmaz, pl. „üres”, jelezve az átcsoportosítás szükségességét.

A fordított eljárás – a frekvenciák/frekvenciák kiszámítása halmozott frekvenciákon/frekvenciákon keresztül – szintén lehetséges:

Statisztikai adatok grafikus bemutatása.

A legkényelmesebb a disztribúciós sorozatok grafikus ábrázolásával elemezni. A táblázatokkal együtt a grafikon a kezdeti információk összegzésének módszere. A grafikonok lehetővé teszik a vizsgált jelenség érdeklődési körének, összefüggéseinek és tendenciáinak pontosabb és egyszerűbb megértését.

Statisztikai grafikon egy rajz, amely egy adott statisztikai sokaság jellemzőit jeleníti meg geometriai képek vagy jelek segítségével. A statisztikában sokféle grafikus képet használnak, amelyek mind a grafikon választott alapjában (lineáris, síkbeli, térfogati), mind az építési módban (diagramok, statisztikai térképek) különböznek.

A gráf helyes felépítéséhez egy sor szabály betartása szükséges: a külső tervezéstől (a grafikon neve, a léptékek aláírásai, magyarázatok) a gráf fő elemeinek kialakításáig (grafikus kép, grafikonmező, térbeli és léptékű referenciapontok).

A disztribúciós sorozatokkal kapcsolatban a következő grafikus képeket használjuk: poligon, hisztogram, kumulátum, ogive. Mindezek a grafikonok téglalap alakú koordinátarendszerben vannak ábrázolva.

Poligon- egy diszkrét variációs eloszlás sorozat grafikus ábrázolása, amely képet ad a frekvenciák változásának természetéről. Egy sokszög felépítéséhez a változó karakterisztika rangsorolt ​​értékeit az abszcissza tengely mentén, a frekvenciát vagy a frekvenciát pedig az ordináta tengelye mentén ábrázoljuk.

A sokszög az abszciszák és az ordináták metszéspontjait jelöli, amelyeket néha egyenes vonalak kötnek össze az áttekinthetőség érdekében, ami szaggatott vonalat eredményez. Ha egy változó jellemző elméletileg kisebb értékeket vehet fel, mint a regisztrált minimum és/vagy nagyobb, mint a regisztrált maximum, akkor ezeknél az értékeknél a sokszög az x tengelyen zárva van.

A táblázat mutatja diszkrét sorozat az összoroszországi lakásállomány lakástípus szerinti megoszlása. Ennek a sorozatnak a sokszöge az ábrán látható.

Rizs. A lakásállomány lakástípus szerinti megoszlásának poligonja 2008-ban

A hisztogram (szalagdiagram) egy eloszlás intervallumvariáció-sorozatának grafikus ábrázolása, amely képet ad a frekvenciák változásának természetéről. A hisztogram elkészítésekor a megfelelő karakterisztika intervallumainak értékeit az abszcissza tengely mentén, a frekvenciát, a frekvenciát vagy az eloszlássűrűséget az ordináta tengely mentén ábrázoljuk. Egyenlő intervallumú sorozatoknál mind a frekvenciák/frekvenciák, mind a sűrűségek használhatók, az egyenlőtlen intervallumú sorozatoknál - csak a sűrűségek.

A hisztogramot téglalapok képviselik, amelyek szélességét az abszcisszán lévő intervallumok, a magasságot pedig az ordinátán lévő frekvenciák, frekvenciák vagy sűrűségek értékei határozzák meg.

A diszkrét vagy egyenlő intervallumú eloszlássorozatok grafikonjainak összeállítása során a gyakoriságok és gyakoriságok közötti választást az határozza meg, hogy ezeket a grafikonokat össze kell hasonlítani különböző populációkhoz (különböző számú megfigyeléssel) ugyanabban a koordinátarendszerben. Ha szükséges, a frekvenciákat az ordinátatengely mentén kell ábrázolni.

A táblázat a népesség eloszlásának intervallum-változtatási sorozatát mutatja be az egy főre jutó átlagos monetáris jövedelem alapján. Egy adott sorozat eloszlásának helyes értékeléséhez a sűrűségkarakterisztikát használjuk, mert a sorozatok egyenlőtlen intervallumúak. Például a frekvencia/frekvencia szerinti becslés során úgy tűnik, hogy a „legnépszerűbb” intervallum 10 és 15 között van, azonban a frekvencia/frekvencia sűrűség azt mutatja, hogy a valóságban egy ilyen intervallum a 4 és 6 közötti tartomány. Ennek hisztogramja ábrán mutatjuk be a sorozatot.

6 - 8 19,3 13,6 9,7 6,8 8 - 10 16,1 11,3 8,0 5,7 10 - 15 27,2 19,1 5,4 3,8 15 - 25 23,5 16,5 2,3 1,7 25 felett 14,4 10,1 1,4 1,0 TELJES 142,2 100,0 - - -

1) az „Oroszország lakosságának társadalmi helyzete és életszínvonala” című statisztikai gyűjtemény anyagai alapján. 2008"

Rizs. A népesség eloszlásának hisztogramja az egy főre jutó átlagos monetáris jövedelem alapján 2007-ben

Kumulátum - egy kumulatív görbe grafikus ábrázolása, amely képet ad a felhalmozott frekvenciák/frekvenciák változásának természetéről. Egy intervallumváltozat-sorozat kumulátumának megalkotásához az intervallumok értékeit az abszcissza tengely mentén ábrázoljuk, és ha a sorozat diszkrét, akkor a karakterisztika rangsorolt ​​értékeit ábrázoljuk. Mindkét esetben a felhalmozott frekvenciák vagy frekvenciák az ordinátatengely mentén helyezkednek el. Az intervallumok egyenlősége vagy egyenlőtlensége nem számít a kumulált gráf esetében.

Az intervallumvariációs sorozat kumulátuma egy nem csökkenő szaggatott vonal, amely összeköti az intervallumok végeinek metszéspontjait a megfelelő halmozott frekvenciákkal. Ebben az esetben a pontok egyenes vonalakkal való összekapcsolása annak a feltételezésnek köszönhető, hogy az intervallumon belül egyenletesen növekszik a halmozott frekvenciák száma. A kumulált kapcsolat szögegyütthatója jellemzi az eloszlási sűrűséget a megfelelő intervallumban: minél meredekebb a láncszem az abszcissza tengelyhez képest, annál nagyobb a sűrűség ebben az intervallumban.

A táblázat az egy főre jutó átlagos jövedelem jellemzésére felhalmozott sorozatok értékeit mutatja be. Ezen adatok alapján az ábrán látható kumulátum.

A lakosság megoszlása ​​az egy főre jutó átlagos készpénzjövedelem szerint 2007-ben 1

Rizs. A népesség kumulált megoszlása ​​az egy főre jutó átlagos monetáris jövedelem szerint 2007-ben

Egy diszkrét variációs sorozat kumulátuma egy nem csökkenő, lépcsős görbe. Ez a következőképpen épül fel. Egy téglalap alakú koordinátarendszerben pontokat jelölünk, amelyeknek abszcisszája az attribútum értéke, az ordináta a halmozott frekvencia/frekvencia. A pontokból merőlegeseket engedünk le az abszcissza tengelyére. Ezután minden pontból az abszcissza tengellyel párhuzamos szakaszt helyezünk el jobbra, amíg az nem metszi a következő merőlegest.

A táblázat a „szobák száma a lakásban” attribútum kumulatív sorozatának értékeit mutatja be. Ennek a sorozatnak a kumulátuma az ábrán látható.

A lakásállomány lakástípus szerinti megoszlása ​​2008-ban 1

1) a „Russian Statistical Yearbook. 2009"

Rizs. A lakásállomány összesített megoszlása ​​lakástípusonként 2008-ban

Ogiva egy kumulatív görbe grafikus ábrázolása, amelyben a kumulált tengelyek felcserélődnek. ábrán. Bemutatjuk az egy főre jutó átlagos jövedelem eloszlását.

Rizs. A népesség megoszlása ​​az egy főre jutó átlagos monetáris jövedelem szerint 2007-ben.

A populációs egységek megoszlása ​​egy jellemző csoportértékei szerint csak az egyik jellemzője a vizsgált jelenségnek. Az összesített adatfeldolgozás során minden csoportot mutatók egész sora jellemez. Ezért a vizsgált jelenség átfogó értékelése érdekében az eloszlási sorozat felépítése mellett meg kell alkotni a statisztikai mutatók rendszerét, amely abszolút, relatív és átlagos értékekből áll.

Ellenőrző kérdések

1. Mi a statisztikai adatok összesítésének, csoportosításának lényege?

2. Melyek az adatok összesítésének és csoportosításának főbb lépései?

3. Milyen szempontok alapján választják ki a csoportosítást, és milyen különbségeket határoznak meg a csoportosításokban?

4. Mi az összetett csoportosítás?

5. Hogyan határozzák meg a csoportok számát?

6. Milyen megközelítések léteznek a csoportosítási intervallumok értékeinek meghatározására?

7. Nevezze meg a főbb csoportosítási típusokat, és írja le röviden mindegyik lényegét!

8. Mi az a másodlagos csoportosítás, és milyen módon valósul meg?

9. Határozzon meg egy statisztikai táblázatot és főbb elemeit!

10. Milyen szabályokat kell betartani a statisztikai táblázatok készítésekor?

11. Határozzon meg egy eloszlássorozatot és főbb elemeit!

12. Nevezze meg az elosztási sorozatok főbb típusait! Mi alapján történik a felosztásuk?

13. Statisztikai gráf definiálása!

14. Milyen grafikonokat szerkesztenek a variációs sorozatok frekvenciájában bekövetkezett változások megjelenítésére?

15. Mik azok a kumulátumok és ogive-ok, és hogyan épülnek fel?

, ezer rubel/hó Szám
, millió ember

Az elemzett sokaság egyes egységeire vonatkozó, a statisztikai kutatás első szakaszának eredményeként nyert információk a statisztikai megfigyelést annak különböző aspektusaiból jellemzik, mivel számos, időben és térben változó jellemzővel és tulajdonsággal rendelkeznek. Ahhoz, hogy általánosító mutatók segítségével összefoglaló jellemzőt kapjunk a teljes objektumról, rendszerezni és összegezni kell a statisztikai megfigyelés során kapott eredményeket. Ez lehetőséget ad a statisztikai sokaság egészének és egyes összetevőinek sajátosságainak, vonásainak azonosítására, valamint a vizsgált társadalmi-gazdasági jelenségek és folyamatok mintázatainak feltárására. Ezt a rendszerezést az elsődleges statisztikai anyagok összefoglalásának nevezzük.

A statisztikai munka második szakasza statisztikai összefoglaló – ez az elsődleges adatok feldolgozása annak érdekében, hogy a vizsgált jelenségről vagy folyamatról általánosított jellemzőket kapjunk a számára lényeges jellemzők szerint a jelenség vagy folyamat egészében rejlő tipikus jellemzők és minták azonosítása érdekében.

Statisztikai összefoglalóátmenet az egyéni adatokról az egységcsoportokra és a népesség egészére vonatkozó információk felé.

Az összefoglaló elkészítése három szakaszból áll:

1) az előzetes ellenőrzés adatellenőrzés;

2) az adatok adott jellemzők szerinti csoportosítása a származtatott mutatók meghatározása;

3) az összefoglaló eredmények bemutatása statisztikai táblázatok formájában, amelyek kényelmes formát jelentenek a kapott információk észleléséhez;

A statisztikai információk szemantikai konzisztenciája egy előzetes ellenőrzés. A statisztikai összesítő programnak megfelelően a kapott információk érthető formában történő utólagos átadása érdekében az adatok statisztikai csoportosítását alkalmazzák.

A kapott csoportosítási eredményeket a vizsgált sokaság összefoglaló jellemzőjét tartalmazó csoportosítási táblázatok formájában mutatjuk be egy vagy több, az elemzés logikája által összekapcsolt jellemző szerint. Vannak egyszerű és összetett összefoglalók. Az egyes egységekre vonatkozó információkat egy egészként foglaljuk össze anélkül, hogy homogén csoportokra osztanák őket. Az egyszerű statisztikai összegzés eredményei az anyag további feldolgozására szolgálnak, az egyszerű összefoglalónak is van önálló kognitív értéke.

Egyszerű statisztikai összefoglaló egy művelet a megfigyelési egységek halmazára vonatkozó általános végső és csoportadatok kiszámítására, és ennek az anyagnak a táblázatokba rendezésére.

Egy egyszerű statisztikai összefoglalás lehetőséget ad arra, hogy meghatározzuk a vizsgált sokaság egységeinek számát és a vizsgált jellemzők mennyiségét, de így egy egyszerű összefoglaló nem ad képet a sokaság összetételének integritásáról. tanult.

Ha egy sokaság egységeit homogén csoportokra osztjuk, akkor minden csoportra kiszámoljuk az összegeket, majd a teljes sokaság egészére, egy ilyen statisztikai összegzést komplexnek nevezzük. A komplex összefoglaló lehetővé teszi egy populáció összetételének tanulmányozását és egyes jellemzők hatásának azonosítását másokra, vagyis az adott populációban rejlő minták feltárását.

Komplex statisztikai összefoglaló műveletek komplexuma. ideértve a vizsgált társadalmi-gazdasági jelenség vagy folyamat megfigyelési egységeinek csoportokra bontását, a vizsgált jelenséghalmaz tipikus csoportjainak és alcsoportjainak jellemzésére szolgáló mutatórendszer összeállítását, az egyes csoportok egységeinek és eredményeinek megszámlálását, ill. alcsoportok, valamint e munka eredményeinek statisztikai táblázatok formájában történő bemutatása. A vizsgált jelenségek, folyamatok lényegének és tartalmának átfogó elméleti elemzése alapján statisztikai összegzés készül. A statisztikai összesítés elkészítésének programja és terve biztosítja az eredmények megbízhatóságát és érvényességét.

A statisztikai összesítő program tartalmazza azoknak a csoportoknak a listáját, amelyekre a statisztikai megfigyelési egységek halmaza felosztható vagy felosztható, valamint a vizsgált jelenség- és folyamathalmazt összességében és egyes részeire jellemző mutatórendszert. A statisztikai összesítő program a vizsgálat céljaitól és célkitűzéseitől függ. A programfejlesztés a következő szakaszokból áll:

1) egy csoportosítási jellemzőt úgy választunk ki, hogy homogén csoportokat képezzenek;

2) meghatározzák a felállás sorrendjét és a csoportok számát;

3) a csoportok és az objektum egészének jellemzésére statisztikai mutatók rendszerét dolgozzák ki;

4) statisztikai táblázat-elrendezések jönnek létre az összefoglaló eredmények biztosítására.

A statisztikai összesítő programmal együtt annak végrehajtási terve is készül. A tervnek tartalmaznia kell táblázatos formában az összesítés sorrendjéről, időzítéséről, technikájáról, végrehajtóiról, eredményeinek formázási eljárásáról és szabályairól.

Az összefoglaló lehet decentralizált vagy központosított is.

Decentralizált statisztikai összefoglaló- ez az anyag összegzési módja, amely alulról felfelé halad a hierarchikus irányítási létra mentén, és minden szakaszban feldolgozásra kerül. Az adatfeldolgozás helyben történik, azaz a vállalati jelentéseket az alanyok statisztikai hatóságai állítják össze. Orosz Föderáció. A kapott eredményeket elküldik az Orosz Föderáció Állami Statisztikai Bizottságának, majd megjelennek az ország társadalmi-gazdasági helyzetére vonatkozó végső mutatók.

Központosított statisztikai összefoglaló egy olyan módszer, amelyben a statisztikai megfigyelés eredményeként kapott összes elsődleges adatot egyetlen központi szervezetben koncentrálják, és az elejétől a végéig feldolgozzák.

A statisztikai összesítések kivitelezési technikája szerint gépesítettek (elektronikus számítógépek segítségével) és manuálisak.

2. A csoportok lényege és osztályozása

A tudományosan megalapozott csoportos felosztás lehetővé teszi, hogy helyes következtetéseket vonjunk le a vizsgált populációról és a benne zajló folyamatokról.

A tudományos csoportosítás alapelveit V. I. A statisztikai csoportosítás, ahogy V. I. Lenin rámutatott, nem másodlagos kérdés. A vizsgált jelenségek átfogó társadalmi-gazdasági elemzését igényli a statisztikai csoportosításban jó választás jellemzők csoportosítása a statisztikai kutatás céljainak megfelelően. A csoportosítást a vizsgált kérdéskör szempontjából legjelentősebb, legfontosabb jellemzőkre kell alapozni, amelyek lehetővé teszik a jelenségek társadalmi-gazdasági típusainak azonosítását. A statisztikai csoportosítások társadalmi-gazdasági típusok azonosítására való felhasználásának zseniális példája V. I. Lenin „A kapitalizmus fejlődése Oroszországban” című munkájának táblázata.

Statisztikai csoportosítás– Ez a statisztikai kutatások végzésének egyik fő állomása.

A statisztikai sokaság részekre bontásán, vagy a vizsgált statisztikai egységek aggregátumban való összevonásán alapuló homogén csoportok kialakításának folyamatát a rájuk jellemző jellemzők szerint ún. statisztikai csoportosítás Az adatok összesítésének legfontosabb statisztikai módszere a statisztikai csoportosítás.

A statisztikai csoportosítási módszerrel megoldott problémák három fő típusa a következő:

1) a jelenségek társadalmi-gazdasági típusainak azonosítása;

2) a jelenség szerkezetének és a jelenségben bekövetkező szerkezeti eltolódásainak tanulmányozása;

3) a jelenségek és a jelenségeket jellemző jelek közötti kapcsolatok és kölcsönös függőségek azonosítása. A statisztikai csoportosítások következő típusait különböztetjük meg:

1) tipológiai;

2) szerkezeti;

3) elemző.

Az aggregátumok minőségileg homogén csoportjait, azaz a csoportosítási jellemzőikben egymáshoz közel álló objektumokat ún. tipológiai csoportosítás.

Tipológiai csoportosításra példa: a földek tulajdonformák szerinti csoportosítása. A tipológiai csoportosításnál a fő figyelmet a típusok azonosítására és a csoportosítási jellemző kiválasztására kell fordítani. A tipológiai csoportosítás felépítéséhez mennyiségi és minőségi (attribútum) jellemzőket kell használni.

Az attribútum szerinti csoportosítás azt sugallja, hogy az azonosított csoportok száma megfelel az attribútum fokozatainak tényleges számának. Kvantitatív kritériumok alapján szükséges a csoportosítási intervallum helyes beállítása és a szükséges csoportszám meghatározása. A tipológiai csoportosítás intervallumainak meghatározásának problémáját a csoportosítási jellemző változásának olyan mennyiségi határainak azonosítása alapján oldják meg, amelyeknél a jelenség megváltozik vagy új minőséget nyer.

Tipológiai csoportosításban a csoportok száma a meglévő társadalmi-gazdasági típusok számától függ. A jelenségek társadalmi-gazdasági típusai a homogén csoportok összetételétől, szerkezetétől, valamint az azonos típusú populáción és az azonos típusú csoportokon belüli jellemzők változásainak vizsgálatától függenek egy szerkezeti csoportosítás alapján. Strukturális csoportosításnak nevezzük egy homogén populáció bizonyos csoportokra való felosztását, amely a struktúrát egy bizonyos csoportosítási jellemző szerint tovább jellemzi. Itt tárgyaljuk a mennyiségi és attribúciós jellemzőket is. Példa erre a raktári dolgozók képzettség szerinti csoportosítása.

Attribútum szerint a csoportok az attribútum jellegében különböznek egymástól. A mennyiségi jellemző a csoportok számának és az intervallum szélességének meghatározását is magában foglalja.

A statisztikai csoportosítások fő feladata– egy statisztikai sokaság egységeinek jellemzői közötti összefüggések és függőségek vizsgálata, amelyet analitikus csoportosítások felépítésével oldanak meg. Elemző csoportosítás– ez egy olyan csoportosítás, amely feltárja a vizsgált társadalmi-gazdasági jelenségek és az azokat jellemző sajátosságok közötti kapcsolatokat, egymásrautaltságokat.

A statisztikatudomány összes jellemzője faktoriálisra és effektívre osztható. Jelek, amelyek nagy befolyást a hatásos jellemzők megváltoztatására ún faktoriális. A faktorjellemzők hatására változó tulajdonságokat ún hatékony.

Az analitikus csoportosítás felépítésénél fontos feladat azoknak a csoportoknak a megválasztása, amelyekre fel kell osztani a vizsgált megfigyelési egységek halmazát, és határainak meghatározása.

Az analitikai csoportosítások felépítése során teljesítendő követelmények: minden vizsgált csoportnak a csoportosítási jellemzők szerint homogén egységeket kell tartalmaznia a sokaságból, és az egyes vizsgált csoportokban lévő egységek számának elegendőnek kell lennie ahhoz, hogy megkapja a csoport statisztikai jellemzőit. a vizsgált tárgy.

Egyszerűnek hívják csoportosítás, ha a csoport csak egy jellemző szerint alakul. Ha egy csoportot bizonyos jellemzőknek megfelelően alcsoportra oszt, akkor egy ilyen csoportot kombináltnak nevezünk.

Kombináció csoportosításról akkor beszélünk, ha egy populációt két vagy több csoportosítási jellemző alapján, egymással kombinálva (kombinációként) osztunk fel.

A komplex társadalmi-gazdasági jelenségek és folyamatok tanulmányozásakor kombinációs csoportosításokat alkalmaznak. A kombinációs csoportosítás felépítéséhez kellően nagy számú megfigyelés jelenlétét kell azonosítani.

Ahhoz, hogy objektumok (pontok) klaszterét (dimenziós térben) találjuk, alkalmazni kell többdimenziós csoportosítás A felhasznált információk alapján vannak csoportosítások:

1) elsődleges – statisztikai megfigyelés eredményeként nyert kiindulási adatok alapján készült;

2) másodlagos - ez egy csoport összekapcsolásának vagy feldarabolásának eredménye.

3. A csoportosulások felépítésének alapelvei

A statisztikai csoportosítások felépítéséhez ki kell választani egy csoportosítási jellemzőt, majd meg kell határozni azon csoportok számát, amelyekre a vizsgált statisztikai sokaság fel van osztva, és rögzíteni kell a csoportosítási intervallumok határait. Minden csoporthoz meg kell találni a konkrét mutatókat vagy azok rendszerét, amelyek a vizsgált csoportokat jellemezzék.

Csoportosítási jellemző kiválasztása – összetett kérdés a statisztikai csoportosítás elméletében és általában a statisztikai kutatásokban. A csoportosítási jellemző az az alap, amely alapján a sokaság egységeit külön csoportokra osztják. A statisztikai vizsgálat következtetéseinek pontossága a csoportosítási jellemző pontosságának mértékétől függ.

A csoportba mennyiségi és attribúciós (minőségi) jellemzők tartoznak. A mennyiségi jellemzőknek általában numerikus kifejezésük van (például a kibocsátás mennyisége, az ember életkora, a család jövedelme stb.). Az attribúciós jellemzők egy populációs egység minőségi jellemzőjét biztosítják (például nem, Családi állapot, egy személy politikai irányultsága stb.). A csoportban az attribútum szerint kiválasztott csoportoknak el kell térniük egymástól az attribútum minőségi jellemzőiben. Azon csoportok száma, amelyekre a statisztikai sokaság fel van osztva, az attribútum fokozatainak számától függ.

Fontos, hogy tanulj gazdasági lényege a vizsgált jelenség mennyiségi jellemzők alapján történő csoportosítás megalkotásakor.

A csoportok számának meghatározásához használhatja a Sturgess-képletet:

h+ 3,322 ? lg N,

Ahol h– csoportok száma;

N– lakossági egységek száma;

logN – N decimális logaritmusa.

Ez a képlet arra utal, hogy a csoportok számának megválasztása objektíven a populáció méretétől függ. A csoportok számának megállapítása után dől el a csoportosítási intervallumok meghatározása.

A csoportosítási intervallum alapján lehetőség nyílik egyes csoportok mennyiségi megkülönböztetésére a többitől, és felvázolható új minőségük azonosításának határai. A csoportosítási intervallum egy bizonyos csoporton belüli változó jellemző értékeinek intervalluma. Minden intervallumnak saját hossza (szélessége), felső és alsó határa van.

Az intervallum alsó határa az legkisebb érték jellemző az intervallumban, és az intervallum felső határa a legnagyobb értéke. Az első intervallum alsó határa az attribútum legkisebb értéke a megfigyelési egységek halmazában. Az utolsó intervallum felső határa nem lehet kisebb, mint legmagasabb érték jellemző a megfigyelési egységek halmazában.

Intervallum szélessége a különbség a felső és az alsó határ között. A csoportosítási intervallumok szélességüktől függően lehetnek egyenlőek vagy egyenlőtlenek. Az egyenlőtleneket fokozatosan növekvőre, fokozatosan csökkenőre, önkényesre és specializáltra osztják. Ha egy jellemző változása viszonylag szűk határokon belül nyilvánul meg, és az eloszlás egyenletes, akkor egyenlő időközönként épül fel egy csoport.

Az egyenlő intervallum értékét a következő képlet határozza meg:

h = R/n = (x max – x min) / n,

aholx max,x min – az attribútum maximális és minimális értéke az aggregátumban;

n – csoportok száma.

Ezt a képletet intervallumlépésnek nevezzük. Ha egy jellemző variációs tartománya az aggregátumban nagy, és a jellemző értékei egyenetlenül változnak, akkor egyenlőtlen időközökkel történő csoportosítást alkalmazunk. Egyenlőtlen intervallumokat kaphatunk, ha a megszerkesztett egyenlő intervallumú csoportosítás olyan csoportokat tartalmaz, amelyek nem tükrözik a vizsgált jelenség vagy folyamat bizonyos típusait, vagy nem tartalmazzák a sokaság egyetlen egységét sem, növelni kell - kettő vagy több kombinálása szükséges. kicsi vagy „üres” egymást követő egyenlő időközök. Az egyenlő vagy nem egyenlő intervallumok kiválasztása az intervallumok kitöltésének mértékétől függ. A csoportosítási intervallumok zártak vagy nyitottak lehetnek Zárva Az intervallumok olyan intervallumok, amelyekben a felső és az alsó korlátok vannak megadva. A nyitott intervallumoknak csak egy határa van (a felső az első, az alsó az utolsóé). A mennyiségi jellemzők felé folyamatos vagy diszkrét jellemzők közé sorolható. Ha a csoportosítás egy diszkrét attribútumon alapul, akkor az i-edik intervallum alsó határa megegyezik az i-edik intervallum 1-gyel növelt felső határával.

Azokban a csoportosításokban, amelyek a vizsgált sokaság meghatározott egységcsoportjainak minőségi jellemzőit és sajátosságait tükrözik egy bizonyos jellemző szerint, speciális intervallumokat használnak. Speciális intervallumok - ezek az intervallumok, amelyek arra szolgálnak, hogy a különböző körülmények között elhelyezkedő jelenségekben ugyanazokat a típusokat, azonos jellemzők szerint megkülönböztessük az összességtől. Attól függően, hogy a jellemzők milyen szerepet játszanak a vizsgált objektumok, folyamatok vagy jelenségek közötti kapcsolatokban, ezek feloszthatók faktoriálisra és eredőre. A faktorjellemzők más jellemzőket, a termelési jellemzőket pedig más jellemzők befolyásolják.

A statisztikai csoportosítás a megfigyelési egységek egy vagy több jellemző szerinti csoportokba való felosztását jelenti. Ezeket a jeleket csoportosításnak nevezzük. A kutatási céloktól függően tipológiai, szerkezeti és analitikai csoportosítások épülnek fel.

A tipológiai csoportosítás egy minőségileg heterogén populáció megfigyelési egységeinek társadalmi-gazdasági típusok, osztályok és minőségileg homogén csoportok szerinti megoszlása. Például a vállalkozások összességének megoszlása ​​tulajdonosi típusok szerint (3.1. táblázat); gazdasági ágazatok; vállalkozás mérete - kis-, közép- és nagyvállalkozások (egyszerre több kritérium szerint vannak besorolva); bankok - állami és kereskedelmi bankokba stb. A tipológiai csoport fő feladata a vizsgált jelenség típusainak azonosítása és leírása. A kiosztott csoportok számát a típusok, osztályok, homogén csoportok stb. száma határozza meg. a jelenség természetét.

3.1. táblázat. Vállalkozások, szervezetek tulajdonosi típus szerinti megoszlása ​​2006. január 1-től
A tulajdon típusa Vállalkozások és szervezetek száma, ezer
Állapot 160
Városi 252
Nyilvános és vallási egyesületek (szervezetek) tulajdona 252
Magán 3 838
Egyéb tulajdoni formák, beleértve vegyes orosz, külföldi, közös orosz és külföldi 265
Teljes 4 767

Forrás: Oroszország számokban. 2006: Krat. statisztika. Ült. / Rosstat. M., 2006. 167. o.

A strukturális csoportosítással egy homogén populáció egységeinek csoportokra bontása történik annak érdekében, hogy a szerkezetét az egyik jellemző szerint azonosítsuk. Például az alkalmazottak megoszlása ​​nem, életkor szerint; a vállalkozások létszám szerinti megoszlása ​​stb. A strukturális csoportosításra példa a táblázat adatai. 3.2.

3.2. táblázat. Az alkalmazottak felépítése a vállalkozásnál eltöltött idő szerint
Szakmai tapasztalat, évek Alkalmazottak száma Az alkalmazottak száma a teljes létszám százalékában
2-ig 10 5
2-4 20 10
4-6 30 15
6-8 80 40
8 vagy több 60 30
Teljes 200 100

Az analitikai csoportosítások fontos szerepet játszanak a statisztikai elemzésben. Segítségükkel meghatározzák a jelek közötti kapcsolat meglétét és annak irányát. Ebben az esetben az egyik jel hatékony, a másik pedig faktoriális. Az eredményül kapott jellemző a faktorkarakterisztika hatására változik.

Az analitikus csoportosítás felépítésénél mindig egy tényezőjellemzőt választunk csoportosítási jellemzőként. Minden kiválasztott csoportban kiszámítjuk a kapott jellemző átlagos értékét. Például a táblázatban. 3.3 cégek a hirdetési költségek összege szerint vannak csoportosítva. Minden csoportban meghatározzák az átlagos forgalmat. A táblázatból kitűnik, hogy minél nagyobb figyelmet fordítanak a cégek a reklámozásra, annál jelentősebbek lesznek tevékenységük eredménye a forgalom volumenében kifejezve.

A jellemzők közötti kapcsolatot közvetlennek nevezzük, ha a faktorjellemző értékeinek növekedésével a kapott jellemző értékei nőnek. Az összefüggés fordított, ha egy tényezőjellemző értékeinek növekedése a kapott jellemző értékeinek csökkenéséhez vezet. Példánkban a hirdetési költségek növekedése forgalomnövekedést okozott, ami azt jelenti, hogy közvetlen kapcsolat van ezen jellemzők között.

A statisztikai elemzésben a csoportosítással együtt osztályozásokat is használnak. Az osztályozás a populáció általánosan elfogadott, hagyományosan használt, gyakran hivatalosan megállapított csoportokra osztása, amely egy bizonyos szabvány, amelyben szigorú követelményeket támasztanak a megfigyelési egységekkel szemben, hogy megfelelnek-e egy adott csoportnak. Az osztályozás minőségi jellemzőn alapul. A legismertebbek a gazdasági ágazatok, közigazgatási-területi felosztások, gazdasági régiók, gazdasági tevékenységek típusai stb. osztályozásai. Az osztályozások nem valami stabilak, összhangban a gazdasági ill. politikai változások változnak is.

Attól függően, hogy hány jellemző alapján történik a csoportosítás, egyszerű és összetett csoportosításokat különböztetünk meg. Ha a csoportosítást egy jellemző szerint végezzük, akkor azt egyszerűnek nevezzük (lásd 3.1, 3.2 táblázat). Ha egy sokaság egységeit egyszerre két vagy több jellemző szerint csoportosítjuk, akkor az ilyen csoportosítást komplexnek nevezzük. Ráadásul az egyik jellemző szerint kialakított csoportokon belül a sokaság egységei egy másik jellemző szerint alcsoportokra oszlanak. A komplex csoportosításra példa a tanulók csoportosítása egy folyamon két jellemző – nem és életkor – alapján. Eredményeit táblázatos formában is bemutathatjuk (3.4. táblázat).

3.4. táblázat. A patakon tanulók megoszlása ​​nem és életkor szerint
Életkor, évek Padló Teljes
férfiak nők
14-ig 10 8 18
15 8 9 17
16 12 13 25
17 vagy több 11 10 21
Teljes 41 40 81

Másodlagos adatcsoportosítás. A gyakorlatban gyakran adódnak olyan helyzetek, amikor a meglévő csoportosított adatok alapján új csoportosítást kell felépíteni. Ebben az esetben általában az elsődleges adattömb elérhetetlennek bizonyul. Ezután a másodlagos adatcsoportosítás módszereihez folyamodnak.

A másodlagos csoportosítás a már csoportosított adatok átcsoportosítása az elsődleges adattömb elérése nélkül. Erre a célra két megközelítést alkalmaznak: az eredeti intervallumok kombinálását, ha az új és a régi csoport határai egybeesnek, és az adatok töredékes átcsoportosítását, ha a határok nem egyeznek.

A következő példa segítségével bemutatjuk a kezdeti intervallumok kombinálásának módszerét. Tegyük fel, hogy a forrásadat a táblázatban megadott sorozat. 3.5.

3.5. táblázat. A cég alkalmazottainak méret szerinti megoszlása bérek
Intervallum száma Fizetés, dörzsölje. Alkalmazottak száma, fő
1 2 000-3 000 16
2 3 000-4 000 40
3 4 000-5 000 65
4 5 000-6 000 58
5 6 000-7 000 44
6 7000 és több 17
Teljes - 240

Csoportosítsuk át az adatokat, és képezzünk új intervallumokat: "2000-4000", "4000-6000", "6000 és több". Mivel az új és a régi intervallum határai egybeesnek, könnyen belátható, hogy az első új „2000-4000” intervallumban az eredeti csoport első és második szakaszának dolgozói (16 + 40 = 56 fő) szerepelnek majd. új intervallumban az eredeti csoportcsoportok harmadik és negyedik szakaszának dolgozói (65 + 58 = 123 fő), a harmadik új intervallumban az utolsó két intervallum dolgozói (44 + 17 = 61 fő) szerepelnek majd. Az átrendezés eredményeit a táblázat tartalmazza. 3.6.

3.6. táblázat. A vállalati alkalmazottak fizetés szerinti megoszlása ​​(másodlagos csoport)
Intervallum száma Fizetés, dörzsölje. Alkalmazottak száma, fő
1 2 000-4 000 56
2 4 000-6 000 123
3 6000 és több 61
Teljes - 240

A tört átcsoportosítás a megfigyelési egységek egyenletes eloszlásán alapul az intervallumcsoportok határain belül. Megvalósítása eredményeként kiszámításra kerül, hogy a megfigyelési egységek mekkora része kerül át a régi intervallumcsoportból az újba.

A statisztikák elsődleges csoportosításával együtt megállapítja széles körű alkalmazás másodlagos csoportosítások. V Másodlagos csoportosításúj csoportok kialakításának nevezzük a korábban lefolytatott csoportosítás alapján.

A másodlagos csoportosítások különféle problémák megoldására szolgálnak, amelyek közül a legfontosabbak: 1) minőségileg homogén csoportok (típusok) kialakítása mennyiségi jellemzők alapján történő csoportosítások alapján; 2) két (vagy több) eltérő intervallumú csoportosítás egyetlen formába hozása összehasonlíthatóság és elemzés céljából; 3) nagyobb csoportok kialakulása, amelyekben az eloszlás természete világosabban megnyilvánul.

Ennek a technikának az a lényege, hogy összehasonlítható adatokat nyerjünk különböző csoportokra, amelyekre: számszerű összetétel csoportok (százalékkal) minden csoportnál azonos szinten vannak rögzítve; Minden csoportosításban azonos számú csoportot és azonos tartalmú csoporttáblázatokat is kialakítanak. Nem a csoportonkénti abszolút mutatókat kell összehasonlítani és összehasonlítani, hanem a relatív értékeket és százalékokat.

A másodlagos csoportosításnak két módja van: 1) az elsődleges csoportosítás intervallumainak átalakításával (általában az intervallumok egyszerű kinagyításával) és 2) úgy, hogy minden csoporthoz hozzárendeljük a sokaságegységek egy bizonyos részét (részleges átcsoportosítás). E másodlagos csoportosítási módszerek alkalmazásakor általában azt feltételezik, hogy a jellemző intervallumokon belüli eloszlása ​​egyenletes lesz.

A következő példával szemléltetjük a másodlagos csoportosítás használatát, amellyel két különböző intervallumú csoportosítást egyetlen formába hozhatunk az összehasonlíthatóság érdekében. Ehhez két régió elsődleges csoportosításának adatait használjuk az állattenyésztők száma szerint (3.7. táblázat).

3.7. táblázat. Két járás gazdaságainak csoportosítása az állattenyésztők száma szerint

I. kerület

kerület II

tanyacsoportok által

tanyacsoportok által

végül is

alkalmazottak száma, fő

végül is

A két körzet csoportosítására vonatkozó közvetlen adatok nem összehasonlíthatók, mivel a gazdaságok különböző időközönként csoportosulnak: 20 fő. az I. régióban és 30 fő. régióban a II. A kiosztott csoportok száma sem azonos.

Ahhoz, hogy a két csoportosítást összehasonlítható formába hozzuk, egy másodlagos csoportosítást végzünk. Ennek érdekében az anyagokat olyan csoportokba csoportosítjuk, amelyek mindkét régióban azonosak: vegyünk 40 fős intervallumot. (3.8. táblázat).

Mivel lehetőség van a régió gazdaságainak másodlagos csoportosítására az intervallumok egyszerű kinagyításával (két csoportosításban az alsó és felső intervallum egybeesése van), ezért ezt a módszert alkalmazzuk a probléma megoldására.

Magyarázzuk meg a számítások sorrendjét. A gazdaságok első csoportja 160 főig. az I. és II. csoportba tartozó gazdaságokat foglalja magában.

3.8. táblázat. A gazdaságok másodlagos csoportosítása két járásban az állattenyésztők száma szerint

A gazdaságok aránya ezekben a csoportokban végső soron 16% lesz (4+12). A gazdaságok második csoportja 160-200 fős munkaerővel. a III. és IV. csoportba tartozó gazdaságokat foglalja magában fajsúlyösszesen 45% lesz (18+27). A számításokat a fennmaradó csoportok kialakításakor is hasonlóan végezzük.

Átcsoportosítjuk a II. régió gazdaságait. Mivel a II. régióban lévő gazdaságok intervallumainak növelése nem alkalmas és nem oldja meg a problémát, az elsődleges csoportosítási adatok részleges átcsoportosításának módszerét alkalmazzuk.

A II. körzet első, újonnan létrehozott, legfeljebb 160 fős állattenyésztői létszámú gazdaságcsoportja teljes egészében az elsődleges csoportba tartozó gazdaságokat foglalja majd magába, azonos időközönként. Ebben a csoportban a gazdaságok aránya 8%.

A második csoportba tartozó gazdaságok 160-200 fős létszámmal. csoportba tartozó gazdaságok (16%) és a III. csoportba tartozó gazdaságok egy része teljes egészében beletartozik. A III. csoportba tartozó gazdaságok azon részének meghatározásához, amelyet 190 - 200, 200 - 210, 210 - 220 fős munkavállalói létszámú alcsoportokra kell osztani. Ezekben az alcsoportokban a gazdaságok részesedésének mutatóit az intervallum felosztásával arányosan határozzuk meg. Az általunk figyelembe vett intervallum 30 fő. és három egyenlő részre oszlik. A szükséges intervallum eléréséhez 160-200 fő. csoport intervallumának értékéhez (160 - 190 fő) hozzá kell adni a III. csoport intervallumának egyharmadát (190 - 220 fő) és az e csoportba tartozó gazdaságok azonos részét.

Tehát egy másik, újonnan létrehozott gazdaságcsoportba a második csoportba tartozó gazdaságok 16%-a, a III. csoport egyharmada - 10% (1/3-30), ami az összes gazdaság 26%-át teszi ki. régióban a II.

A másodlagos csoport gazdaságainak III. csoportjába (200-240 fő) a III. csoport gazdaságainak egy része (190-220 fő) fog tartozni, amely megmaradt - 20% (% -30) és kétharmada a III. IV. csoport (220 - 250 fő) - 14% (%-21), azaz a II. régió összes gazdaságának 34%-a.

Hasonló számításokat végeznek a fennmaradó, újonnan létrehozott gazdaságcsoportok kialakításakor: 240-280 és több mint 280 fő. Mintha a táblázatban lenne. A 3.7. pontban a gazdaságok csoportonkénti részesedésére vonatkozó adatokkal együtt adtuk meg a létszámadatokat, majd az újonnan létrehozott csoportokban a gazdaságok arányával megegyező arányban történne számítás.

A másodlagos csoportosítást követően az elsődleges anyag összehasonlíthatóvá válik, mivel a két régióra ugyanazokat a létszám szerinti csoportokat vettük. táblázatban szereplő adatokból. A 3.8. táblázat azt mutatja, hogy a két régióban jelentősen eltér a gazdaságok állattenyésztési létszám szerinti megoszlása: az I. régióban a legfeljebb 200 állattenyésztőt foglalkoztató gazdaságok dominálnak. (az összes gazdaság 61%-a), a II. régióban - állattenyésztéssel foglalkozó gazdaságok - 200 fő felett. (az összes gazdaság 66%-a).

10. kérdés Másodlagos csoportosítás, megvalósításának módjai.

Csoportosítás - ez a vizsgált statisztikai sokaság részekre bontása egy vagy több csoportosítási jellemző szerint. A helyesen végzett csoportosítás nagymértékben biztosítja a teljes statisztikai vizsgálat megbízhatóságát.

Elsődleges csoportosítás az elsődleges forrásadatok rendezése alapján készül.

Az azonos időtartam alatt, de különböző régiókra, vagy fordítva, ugyanarra a régióra, de két különböző időszakra felépített csoportosítások összehasonlíthatatlanok lehetnek a kiválasztott csoportok eltérő száma vagy a határok egyenlőtlensége miatt. időközönként. Ebben az esetben az adatokat másodlagos csoportosítással át kell csoportosítani.

Másodlagos csoportosítás - új csoportok létrehozásának művelete egy korábban végrehajtott csoportosítás alapján.

Új csoportok létrehozásának két módja van.

1. A legegyszerűbb és legáltalánosabb módja a kezdeti intervallumok megváltoztatása (általában nagyítása).

2. Dbaloldali átcsoportosítás- a módszer abból áll, hogy új csoportokat hoznak létre az alapján, hogy minden csoporthoz hozzárendelnek egy bizonyos arányt a sokaságon belül.

Példa.Át kell csoportosítani az adatokat, új csoportokat képezve legfeljebb 500, 500 - 1000, 1000 - 2000, 2000 - 3000, 3000 rubel felett. az építőipari társasági szerződések nyereség szerinti megoszlására vonatkozó adatok szerint.

Asztal. Építőipari cégszerződések nyereség szerinti megoszlása¹

Az első új csoportba a teljes 1. szerződéscsoport és a 2. csoport egy része tartozik majd. Egy legfeljebb 500 ezer rubelből álló csoport létrehozásához 100 ezer rubelt kell venni a 2. csoport intervallumából. A csoport intervallumának mérete 600 ezer rubel lesz. Ezért ennek 1/6-át kell felvenni (100: 600) Az újonnan alakuló új csoportban hasonló részt kell venni a szerződések számából, azaz 20 1/6 - 3 szerződést. Akkor az 1. csoportban 16 + 3 = 19 szerződés lesz. A második új csoportot a 2. csoport szerződései alkotják, mínusz az 1. csoporthoz rendelt szerződések, azaz 20 - 3 = 17 egység. Az újonnan alakult harmadik csoportba a 3. csoport összes szerződése és a 4. szerződések egy része tartozik majd. Ennek a résznek az 1800-3000 intervallumból történő meghatározásához (az intervallum szélessége 1200 ezer rubel), hozzá kell adni 200 ezer rubelt az előzőhöz. (úgy, hogy az intervallum felső határa 2000 rubel legyen). Ezért az intervallum 200:1200-nak megfelelő részét, azaz 1/6-ot kell venni. Ebben a csoportban 74 szerződés van, ami azt jelenti, hogy 74 ¦ (1: 6) = 12 egységet kell vennie. A harmadik új csoport a következőket tartalmazza: 44 N-12 - 56 szerződés. Az újonnan alakult negyedik csoportba: 74 - 12 = 62 szerződés maradt az előző 4. csoportból. Az ötödik, újonnan alakult csoport az 5. és 6. korábbi csoport szerződéseiből áll majd: 37 + 9 = 46 szerződés. Az átcsoportosítás technikáját a táblázat mutatja.



hiba: A tartalom védett!!