Tipuri de serii de variații în statistică. Serii de distribuție variațională și statistică

(definiție serie de variații; componente ale seriei de variații; trei forme de serie de variații; fezabilitatea construirii unei serii de intervale; concluzii care pot fi trase din seria construită)

O serie variațională este o succesiune a tuturor elementelor unui eșantion aranjate în ordine nedescrescătoare. Se repetă aceleași elemente

Variaționale - acestea sunt serii construite pe o bază cantitativă.

Seriile de distribuție variațională constau din două elemente: variante și frecvențe:

Variantele sunt valorile numerice ale unei trăsături cantitative din seria de variații a distribuției. Ele pot fi pozitive sau negative, absolute sau relative. Deci, la gruparea întreprinderilor în funcție de rezultate activitate economică numerele pozitive sunt profituri, iar numerele negative sunt pierderi.

Frecvențele sunt numerele de variante individuale sau fiecare grup al seriei de variații, adică. acestea sunt numere care arată cât de des apar anumite opțiuni într-o serie de distribuție. Suma tuturor frecvențelor se numește volumul populației și este determinată de numărul de elemente ale întregii populații.

Frecvențele sunt frecvențe exprimate ca valori relative (fracții de unități sau procente). Suma frecvențelor este egală cu unu sau 100%. Înlocuirea frecvențelor cu frecvențe face posibilă compararea seriilor variaționale cu numere diferite de observații.

Există trei forme de serie de variații: serii clasificate, serii discrete și serii cu intervale.

O serie clasificată este distribuția unităților individuale ale populației în ordine crescătoare sau descrescătoare a trăsăturii studiate. Clasificarea facilitează împărțirea datelor cantitative în grupuri, detectarea imediată a celor mai mici și cea mai mare valoare caracteristică, evidențiați valorile care se repetă cel mai des.

Alte forme ale seriei de variații sunt tabele de grup compilate în funcție de natura variației valorilor trăsăturii studiate. Prin natura variației, se disting semne discrete (discontinue) și continue.

Serii discrete- aceasta este o astfel de serie variațională, a cărei construcție se bazează pe semne cu schimbare discontinuă (semne discrete). Acestea din urmă includ categoria tarifară, numărul de copii din familie, numărul de angajați din întreprindere etc. Aceste semne pot lua doar un număr finit de anumite valori.

O serie variațională discretă este un tabel care constă din două coloane. Prima coloană indică valoarea specifică a atributului, iar a doua - numărul de unități de populație cu o anumită valoare a atributului.

Dacă un semn are o schimbare continuă (valoarea venitului, experiența de muncă, costul mijloacelor fixe ale unei întreprinderi etc., care poate lua orice valoare în anumite limite), atunci trebuie construită o serie de variații de interval pentru acest semn.



Tabelul de grup de aici are și două coloane. Primul indică valoarea caracteristicii în intervalul „de la - la” (opțiuni), al doilea - numărul de unități incluse în interval (frecvență).

Frecvența (frecvența de repetare) - numărul de repetări ale unei anumite variante a valorilor atributului, notat fi, și suma frecvențelor egală cu volumul populației studiate, notat

Unde k este numărul de opțiuni de valoare de atribut

Foarte des, tabelul este completat cu o coloană în care se calculează frecvențele acumulate S, care arată câte unități ale populației au o valoare caracteristică nu mai mare decât această valoare.

O serie de distribuție variațională discretă este o serie în care grupurile sunt compuse în funcție de o caracteristică care variază discret și ia doar valori întregi.

Seria de variație a intervalului de distribuție este o serie în care atributul de grupare, care formează baza grupării, poate lua orice valori într-un anumit interval, inclusiv cele fracționale.

interval serie variațională se numește un set ordonat de intervale de variație a valorilor variabilă aleatorie cu frecvențele corespunzătoare sau frecvențele de valori ale mărimii lovind fiecare dintre ele.

Este oportun să se construiască o serie de distribuție de intervale, în primul rând, cu o variație continuă a unei trăsături și, de asemenea, dacă o variație discretă se manifestă pe o gamă largă, de ex. numărul de opțiuni pentru o caracteristică discretă este destul de mare.

Din această serie se pot trage deja câteva concluzii. De exemplu, elementul mediu al unei serii de variații (mediana) poate fi o estimare a rezultatului cel mai probabil al unei măsurători. Primul și ultimul element al seriei variaționale (adică elementul minim și maxim al eșantionului) arată răspândirea elementelor eșantionului. Uneori, dacă primul sau ultimul element este foarte diferit de restul eșantionului, atunci ele sunt excluse din rezultatele măsurătorii, având în vedere că aceste valori au fost obținute ca urmare a unui fel de defecțiune gravă, de exemplu, tehnologie.

Serii de distribuție statistică- aceasta este o distribuție ordonată a unităților de populație în grupuri în funcție de un anumit atribut variabil.
În funcție de trăsătura care stă la baza formării unei serii de distribuție, există serie de distribuție de atribute și variații.

Prezența unei trăsături comune este baza pentru formarea unei populații statistice, care este rezultatul unei descrieri sau măsurători aspecte comune obiecte de cercetare.

Subiectul de studiu în statistică sunt caracteristici în schimbare (variabile) sau caracteristici statistice.

Tipuri de caracteristici statistice.

Seriile de distribuție sunt numite serii de atribute. construit pe temeiuri de calitate. Atributiv- acesta este un semn care are un nume (de exemplu, o profesie: croitoreasă, profesor etc.).
Se obișnuiește să se aranjeze seria de distribuție sub formă de tabele. În tabel. 2.8 prezintă o serie de atribute de distribuție.
Tabelul 2.8 - Distribuția tipurilor de asistență juridică oferite de avocați cetățenilor uneia dintre regiunile Federației Ruse.

Seria de variații sunt valori caracteristice (sau intervale de valori) și frecvențele acestora.
Serii de variații sunt serii de distribuție construit pe o bază cantitativă. Orice serie variațională constă din două elemente: variante și frecvențe.
Variantele sunt valori individuale ale unei caracteristici pe care aceasta le ia într-o serie de variații.
Frecvențele sunt numerele de variante individuale sau fiecare grup al seriei de variații, adică. acestea sunt numere care arată cât de des apar anumite opțiuni într-o serie de distribuție. Suma tuturor frecvențelor determină dimensiunea întregii populații, volumul acesteia.
Frecvențele se numesc frecvențe, exprimate în fracții de unitate sau ca procent din total. În consecință, suma frecvențelor este egală cu 1 sau 100%. Seria variațională ne permite să evaluăm forma legii de distribuție pe baza datelor reale.

În funcție de natura variației trăsăturii, există serie de variații discrete și interval.
Un exemplu de serie variațională discretă este dat în tabel. 2.9.
Tabelul 2.9 - Distribuția familiilor după numărul de camere ocupate în apartamente individuale în 1989 în Federația Rusă.

Prima coloană a tabelului prezintă variante ale unei serii variaționale discrete, a doua coloană conține frecvențele seriei variaționale, iar a treia coloană conține indicatorii de frecvență.

Seria de variații

ÎN populatia se cercetează o trăsătură cantitativă. Din el se extrage aleatoriu o mostră de volum n, adică numărul de elemente din eșantion este n. În prima etapă a procesării statistice, variind mostre, adică ordonarea numerelor x 1 , x 2 , …, x n Ascendent. Fiecare valoare observată x i numit opțiune. Frecvență m i este numărul de observații ale valorii x iîn probă. Frecvența relativă (frecvența) w i este raportul de frecvență m i la dimensiunea eșantionului n: .
Când se studiază o serie variațională, se folosesc și conceptele de frecvență cumulativă și frecvență cumulativă. Lăsa X oarecare număr. Apoi numărul de opțiuni , ale căror valori sunt mai mici X, se numește frecvență acumulată: pentru x i n se numeste frecventa cumulata w i max .
Un atribut se numește variabil discret dacă valorile sale individuale (variantele) diferă unele de altele printr-o cantitate finită (de obicei un număr întreg). O serie variațională a unei astfel de caracteristici se numește serie variațională discretă.

Tabelul 1. Vedere generală a seriei variaționale discrete de frecvențe

Valori caracteristicex i x 1 x2 x n
Frecvențelem i m 1 m2 m n

Un atribut se numește variabil continuu dacă valorile sale diferă unele de altele printr-o cantitate arbitrar mică, adică semnul poate lua orice valoare într-un anumit interval. O serie de variații continue pentru o astfel de trăsătură se numește serie de intervale.

Tabelul 2. Vedere generală a seriei de variație a intervalului de frecvențe

Tabelul 3. Imagini grafice ale seriei de variații

RândPoligon sau histogramăFuncția de distribuție empirică
Discret
interval
Privind rezultatele observațiilor, se determină câte valori ale variantelor au căzut în fiecare interval specific. Se presupune că fiecare interval aparține unuia dintre capetele sale: fie în toate cazurile stânga (mai des), fie în toate cazurile dreptului, iar frecvențele sau frecvențele arată numărul de opțiuni conținute în limitele indicate. Diferențele a i – a i +1 se numesc intervale parțiale. Pentru a simplifica calculele ulterioare, seria de variații de interval poate fi înlocuită cu una condițional discretă. În acest caz, valoarea medie i-al-lea interval este luat ca opțiune x i, și frecvența intervalului corespunzătoare m i- pentru frecventa acestui interval.
Pentru reprezentarea grafică a seriilor variaționale, cel mai des sunt utilizate poligonul, histograma, curba cumulativă și funcția de distribuție empirică.

În tabel. 2.3 (Gruparea populației Rusiei în funcție de mărimea venitului mediu pe cap de locuitor în aprilie 1994) este prezentată serie de variații de interval.
Este convenabil să se analizeze seria de distribuție folosind o reprezentare grafică, care face, de asemenea, posibilă aprecierea formei distribuției. O reprezentare vizuală a naturii modificării frecvențelor seriei variaționale este dată de poligon și histogramă.
Poligonul este utilizat la afișarea unor serii variaționale discrete.
Să descriem, de exemplu, grafic distribuția fondului de locuințe pe tipuri de apartamente (Tabelul 2.10).
Tabel 2.10 - Distribuția fondului de locuințe din mediul urban pe tip de apartamente (cifre condiționate).


Orez. Poligon de distribuție a locuințelor


Pe axa y, pot fi reprezentate nu numai valorile frecvențelor, ci și frecvențele seriei de variații.
Histograma este luată pentru a afișa seria variației intervalului. La construirea unei histograme, valorile intervalelor sunt reprezentate pe axa absciselor, iar frecvențele sunt reprezentate prin dreptunghiuri construite pe intervalele corespunzătoare. Înălțimea coloanelor în cazul intervalelor egale ar trebui să fie proporțională cu frecvențele. O histogramă este un grafic în care o serie este prezentată ca bare adiacente una cu cealaltă.
Să reprezentăm grafic seria de distribuție a intervalelor prezentată în tabel. 2.11.
Tabel 2.11 - Distribuția familiilor după mărimea spațiului de locuit per persoană (cifre condiționate).
N p / p Grupuri de familii după mărimea spațiului de locuit per persoană Numărul de familii cu o anumită dimensiune a spațiului de locuit Numărul cumulat de familii
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TOTAL 115 ----


Orez. 2.2. Histograma distribuției familiilor după mărimea spațiului de locuit per persoană


Folosind datele seriei acumulate (Tabelul 2.11), construim distribuție cumulativă.


Orez. 2.3. Distribuția cumulativă a familiilor în funcție de dimensiunea spațiului de locuit per persoană


Reprezentarea unei serii variaționale sub formă de cumulat este eficientă în special pentru seriile variaționale ale căror frecvențe sunt exprimate ca fracții sau procente din suma frecvențelor seriei.
Dacă schimbăm axele în reprezentarea grafică a seriei variaționale sub formă de cumulat, atunci obținem ogivu. Pe fig. 2.4 prezintă o ogivă construită pe baza datelor din tabel. 2.11.
O histogramă poate fi convertită într-un poligon de distribuție prin găsirea punctelor medii ale laturilor dreptunghiurilor și apoi conectând aceste puncte cu linii drepte. Poligonul de distribuție rezultat este prezentat în fig. 2,2 linie punctată.
La construirea unei histograme a distribuției unei serii variaționale cu intervale inegale, de-a lungul axei ordonatelor, nu se aplică frecvențe, ci densitatea de distribuție a caracteristicii în intervalele corespunzătoare.
Densitatea de distribuție este frecvența calculată pe unitatea de lățime a intervalului, adică câte unități din fiecare grup sunt pe unitatea de valoare a intervalului. Un exemplu de calcul al densității de distribuție este prezentat în tabel. 2.12.
Tabel 2.12 - Distribuția întreprinderilor după numărul de angajați (cifrele sunt condiționate)
N p / p Grupuri de întreprinderi după numărul de angajați, pers. Numărul de întreprinderi Dimensiunea intervalului, pers. Densitatea de distribuție
A 1 2 3=1/2
1 până la 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TOTAL 147 ---- ----

Pentru o reprezentare grafică a variației pot fi folosite și serii curba cumulativă. Cu ajutorul cumulatului (curba sumelor) se afișează o serie de frecvențe acumulate. Frecvențele acumulate sunt determinate prin însumarea secvențială a frecvențelor pe grupuri și arată câte unități ale populației au valori caracteristice nu mai mari decât valoarea considerată.


Orez. 2.4. Ogiva repartizarea familiilor în funcție de mărimea spațiului de locuit per persoană

Când se construiește cumulul unei serii de variații de interval, variantele seriei sunt reprezentate de-a lungul axei absciselor, iar frecvențele acumulate de-a lungul axei ordonatelor.

Variația determină diferențe în valorile oricărui atribut în diferite unități ale unei populații date în aceeași perioadă (punct în timp). Motivul variației îl reprezintă condițiile diferite de existență a diferitelor unități ale populației. De exemplu, chiar și gemenii în procesul vieții dobândesc diferențe de înălțime, greutate, precum și în semne precum nivelul de educație, venitul, numărul de copii etc.

Variația apare ca urmare a faptului că valorile atributului în sine sunt formate sub influența totală a diferitelor condiții care sunt combinate în moduri diferite în fiecare caz individual. Astfel, valoarea oricărei opțiuni este obiectivă.

Variația este caracteristică tuturor fenomenelor naturii și societății, fără excepție, cu excepția valorilor normative stabilite prin lege ale caracteristicilor sociale individuale. Studiile de variație în statistică sunt de mare importanță, ele ajută la înțelegerea esenței fenomenului studiat. Găsirea variației, elucidarea cauzelor acesteia, identificarea influenței factorilor individuali oferă informații importante pentru implementarea deciziilor de management bazate pe dovezi.

Valoarea medie oferă o caracteristică generalizată a trăsăturii populației, dar nu dezvăluie structura acesteia. Valoarea medie nu arată cum sunt situate variantele caracteristicii medii în jurul acesteia, indiferent dacă sunt distribuite în apropierea mediei sau dacă se abat de la aceasta. Media în două seturi poate fi aceeași, dar într-o variantă toate valorile individuale diferă ușor de aceasta, iar în cealaltă, aceste diferențe sunt mari, adică. în primul caz, variația trăsăturii este mică, iar în al doilea caz este mare; acest lucru este foarte important pentru caracterizarea semnificației valorii medii.

Pentru ca șeful organizației, managerul, cercetătorul să poată studia variația și să o gestioneze, statistica a dezvoltat metode speciale de studiere a variației (un sistem de indicatori). Cu ajutorul lor, se găsește variația, se caracterizează proprietățile acesteia. Indicatorii variaţiei sunt : interval de variație, abatere liniară medie, coeficient de variație.

Seria de variații și formele sale

Seria de variații- aceasta este o distribuție ordonată a unităților populației mai des prin creșterea (mai rar descrescătoare) valorilor atributului și numărarea numărului de unități cu una sau alta valoare a atributului. Când numărul de unități de populație este mare, seria clasată devine greoaie, construcția ei durează mult. Într-o astfel de situație, se construiește o serie variațională prin gruparea unităților populației în funcție de valorile trăsăturii studiate.

Există următoarele forme de serie de variații :

  1. rând clasat este o listă de unități individuale ale populației în ordine crescătoare (descrescătoare) a trăsăturii studiate.
  2. Serii de variații discrete - acesta este un tabel format din două rânduri sau un grafic: valori specifice ale caracteristicii variabilei x și numărul de unități din populație cu valoarea dată f - caracteristica frecvențelor. Este construit atunci când atributul preia cel mai mare număr de valori.
  3. serie de intervale.

Gama de variație este determinată ca valoare absolută a diferenței dintre valorile maxime și minime (opțiuni) ale atributului:

Gama de variație arată doar abateri extreme ale trăsăturii și nu reflectă abaterile individuale ale tuturor variantelor din serie. Caracterizează limitele de modificare a unui atribut variabil și este dependentă de fluctuațiile celor două opțiuni extreme și nu are absolut nicio legătură cu frecvențele din seria de variații, adică cu natura distribuției, ceea ce conferă acestei valori un caracter aleatoriu. caracter. Pentru a analiza variația, aveți nevoie de un indicator care să reflecte toate fluctuațiile unei trăsături de variație și să ofere o caracteristică generală. Cel mai simplu indicator de acest fel este deviația liniară medie.

Rândurile construite dupa cantitate, sunt numite variațională.

Seria de distribuție consta în Opțiuni(valori caracteristice) şi frecvente(numar de grupuri). Se numesc frecvențele exprimate ca valori relative (acțiuni, procente). frecvente. Suma tuturor frecvențelor se numește volumul seriei de distribuție.

După tip, seriile de distribuție sunt împărțite în discret(construit pe valori discontinue ale caracteristicii) și interval(construit pe valori continue ale caracteristicilor).

Seria de variații reprezintă două coloane (sau rânduri); dintre care unul oferă valori individuale ale atributului variabil, numite variante și notate cu X; iar în celălalt - numere absolute care arată de câte ori (cât de des) apare fiecare opțiune. Indicatorii celei de-a doua coloane se numesc frecvențe și sunt notați în mod convențional cu f. Încă o dată, observăm că în a doua coloană pot fi utilizați și indicatori relativi care caracterizează ponderea frecvenței variantelor individuale în cantitatea totală de frecvențe. Acești indicatori relativi se numesc frecvențe și se notează convențional cu ω. Suma tuturor frecvențelor în acest caz este egală cu unu. Cu toate acestea, frecvențele pot fi exprimate și ca procent, iar apoi suma tuturor frecvențelor dă 100%.

Dacă variantele seriei variaționale sunt exprimate ca valori discrete, atunci se numește o astfel de serie variațională discret.

Pentru caracteristici continue, serii de variații sunt construite ca interval, adică valorile atributului din ele sunt exprimate „de la ... la ...”. În acest caz, valorile minime ale atributului într-un astfel de interval se numesc limita inferioară a intervalului, iar maxima - limita superioară.

Serii variaționale cu intervale sunt, de asemenea, construite pentru caracteristici discrete care variază într-o gamă largă. Seria de intervale poate fi egalȘi inegal intervale.

Luați în considerare modul în care este determinată valoarea intervalelor egale. Să introducem următoarea notație:

i– valoarea intervalului;

- valoarea maximă a atributului pentru unităţi ale populaţiei;

- valoarea minimă a atributului pentru unităţi ale populaţiei;

n- numărul de grupuri alocate.

dacă n este cunoscut.

Dacă numărul de grupuri alocate este dificil de determinat în prealabil, atunci formula propusă de Sturgess în 1926 poate fi recomandată pentru a calcula dimensiunea optimă a intervalului cu o dimensiune suficientă a populației:

n = 1+ 3,322 log N, unde N este numărul celor din populație.

Valoarea intervalelor inegale este determinată în fiecare caz individual, ținând cont de caracteristicile obiectului de studiu.

Distribuția statistică a eșantionului apelați lista de opțiuni și frecvențele corespunzătoare (sau frecvențele relative).

Distribuția statistică a eșantionului poate fi specificată sub forma unui tabel, în prima coloană a căruia există opțiuni, iar în a doua - frecvențele corespunzătoare acestor opțiuni. ni, sau frecvențe relative Pi .

Distribuția statistică a eșantionului

Serii de intervale se numesc serii de variații în care valorile caracteristicilor care stau la baza formării lor sunt exprimate în anumite limite (intervale). Frecvențele în acest caz nu se referă la valori individuale ale atributului, ci la întregul interval.

Seriile de distribuție pe intervale sunt construite în funcție de caracteristici cantitative continue, precum și în funcție de caracteristici discrete, variind într-un interval semnificativ.

Seria de intervale poate fi reprezentată prin distribuția statistică a eșantionului, indicând intervalele și frecvențele corespunzătoare acestora. În acest caz, suma frecvențelor variantei care a intrat în acest interval este luată ca frecvență a intervalului.

La gruparea după caracteristici continue cantitative, este important să se determine dimensiunea intervalului.

Pe lângă media eșantionului și varianța eșantionului, sunt utilizate și alte caracteristici ale seriei de variații.

Modă numiți varianta care are cea mai mare frecvență.



eroare: Conținutul este protejat!!