Odaberite Stranica

Varijanca primjera slučajne varijable. Izračun varijance u Microsoft Excel-u

Disperzija u statistici nalazi se kao pojedinačne vrijednosti karakteristike u kvadratu od . Ovisno o početnim podacima, određuje se jednostavnim i ponderiranim formulama varijanse:

1. (za negrupirane podatke) se izračunava po formuli:

2. Ponderirana varijansa (za seriju varijacija):

gdje je n frekvencija (faktor ponovljivosti X)

Primjer pronalaženja varijanse

Ova stranica opisuje standardni primjer pronalaženja varijanse, možete pogledati i druge zadatke za njeno pronalaženje

Primjer 1. Za grupu od 20 dopisnih studenata imamo sljedeće podatke. Treba izgraditi intervalne serije distribuciju karakteristike, izračunati srednju vrijednost karakteristike i proučiti njenu varijansu

Hajde da napravimo intervalno grupisanje. Odredimo raspon intervala po formuli:

gde je X max maksimalna vrednost obeležja grupisanja;
X min je minimalna vrijednost obilježja grupisanja;
n je broj intervala:

Prihvatamo n=5. Korak je: h = (192 - 159) / 5 = 6,6

Napravimo intervalno grupiranje

Za dalje proračune napravićemo pomoćnu tabelu:

X'i je sredina intervala. (na primjer, sredina intervala 159 - 165,6 = 162,3)

Prosječan rast učenika određen je formulom aritmetičkog ponderiranog prosjeka:

Određujemo disperziju po formuli:

Formula varijanse se može pretvoriti na sljedeći način:

Iz ove formule slijedi da varijansa je razlika između srednje vrijednosti kvadrata opcija i kvadrata i srednje vrijednosti.

Disperzija u varijantne serije With u jednakim intervalima metodom momenata može se izračunati na sljedeći način koristeći drugo svojstvo disperzije (dijeleći sve opcije vrijednošću intervala). Definicija varijanse, izračunato metodom momenata, prema sljedećoj formuli je manje dugotrajno:

gdje je i vrijednost intervala;
A - uslovna nula, što je pogodno za korištenje sredine intervala s najvećom frekvencijom;
m1 je kvadrat momenta prvog reda;
m2 - trenutak drugog reda

(ako se u statističkoj populaciji atribut mijenja na način da postoje samo dvije međusobno isključive opcije, tada se takva varijabilnost naziva alternativa) može se izračunati po formuli:

Zamjenom u ovoj formuli disperzije q = 1- p, dobijamo:

Vrste disperzije

Ukupna varijansa mjeri varijaciju osobine u cijeloj populaciji kao cjelini pod utjecajem svih faktora koji uzrokuju ovu varijaciju. Ona je jednaka srednjem kvadratu odstupanja pojedinačnih vrijednosti atributa x od ukupne prosječne vrijednosti x i može se definirati kao prosta varijansa ili ponderirana varijansa.

karakterizira slučajnu varijaciju, tj. dio varijacije, koji je posljedica utjecaja neuračunatih faktora i ne zavisi od faktora znaka koji leži u osnovi grupisanja. Ova varijansa je jednaka srednjem kvadratu odstupanja pojedinačnih vrijednosti atributa unutar X grupe od aritmetičke sredine grupe i može se izračunati kao jednostavna varijansa ili kao ponderisana varijansa.

dakle, mjere varijance unutar grupe varijacija osobine unutar grupe i određena je formulom:

gdje je xi - prosjek grupe;
ni je broj jedinica u grupi.

Na primjer, unutargrupne varijanse, koje se moraju utvrditi u zadatku proučavanja uticaja kvalifikacija radnika na nivo produktivnosti rada u radnji, pokazuju varijacije u proizvodnji u svakoj grupi uzrokovane svim mogućim faktorima ( tehničko stanje opreme, dostupnosti alata i materijala, starosti radnika, intenziteta rada itd.), osim razlika u kvalifikacionoj kategoriji (unutar grupe svi radnici imaju iste kvalifikacije).

Prosjek varijansi unutar grupe odražava slučajni, odnosno onaj dio varijacije koji je nastao pod utjecajem svih ostalih faktora, osim faktora grupisanja. Izračunava se po formuli:

Karakteriše sistematsku varijaciju rezultujuće osobine, koja je posledica uticaja faktora osobine koji leži u osnovi grupisanja. Jednaka je srednjem kvadratu odstupanja grupnih srednjih vrijednosti od ukupne srednje vrijednosti. Međugrupna varijansa se izračunava po formuli:

Pravilo dodavanja varijanse u statistici

Prema pravilo dodavanja varijanse ukupna varijansa je jednaka zbroju prosjeka unutargrupnih i međugrupnih varijansi:

Značenje ovog pravila je da je ukupna varijansa koja nastaje pod uticajem svih faktora jednaka zbiru varijansi koje nastaju pod uticajem svih ostalih faktora, i varijanse koja nastaje usled faktora grupisanja.

Koristeći formulu za dodavanje varijansi, možemo odrediti po dva poznate varijanse treća nepoznata, kao i da se proceni jačina uticaja obeležja grupisanja.

Svojstva disperzije

1. Ako se sve vrijednosti atributa smanje (povećaju) za istu konstantnu vrijednost, tada se varijansa neće promijeniti od ovoga.
2. Ako se sve vrijednosti atributa smanje (povećaju) za isti broj puta n, tada će se varijansa shodno tome smanjiti (povećati) za n^2 puta.

Glavni generalizirajući indikatori varijacije u statistici su disperzija i standardna devijacija.

Disperzija to aritmetička sredina kvadratna odstupanja vrijednosti svake karakteristike od ukupne srednje vrijednosti. Varijanca se obično naziva srednjim kvadratom odstupanja i označava se  2 . U zavisnosti od početnih podataka, varijansa se može izračunati iz aritmetičke sredine, jednostavne ili ponderisane:

 neponderisana (jednostavna) disperzija;

 ponderisana varijansa.

Standardna devijacija je generalizirajuća karakteristika apsolutnih dimenzija varijacije osobina u agregatu. Izražava se u istim jedinicama kao i znak (u metrima, tonama, procentima, hektarima, itd.).

Standardna devijacija je kvadratni korijen varijanse i označava se sa :

 neponderisana standardna devijacija;

 ponderisana standardna devijacija.

Standardna devijacija je mjera pouzdanosti srednje vrijednosti. Što je manja standardna devijacija, to bolje aritmetička sredina odražava cjelokupnu zastupljenu populaciju.

Izračunavanju standardne devijacije prethodi izračunavanje varijanse.

Procedura za izračunavanje ponderisane varijanse je kako slijedi:

1) odrediti aritmetički ponderisani prosek:

2) izračunajte odstupanja opcija od prosjeka:

3) kvadrat odstupanja svake opcije od srednje vrijednosti:

4) pomnožiti kvadrate odstupanja sa težinama (frekvencijama):

5) sumirati prispele radove:

6) dobijeni iznos se podijeli sa zbirom pondera:

Primjer 2.1

Izračunajte aritmetički ponderisani prosjek:

Vrijednosti odstupanja od srednje vrijednosti i njihovi kvadrati prikazani su u tabeli. Definirajmo varijansu:

Standardna devijacija će biti jednaka:

Ako su izvorni podaci predstavljeni kao interval distribucijske serije , tada prvo trebate odrediti diskretnu vrijednost značajke, a zatim primijeniti opisanu metodu.

Primjer 2.2

Pokažimo proračun varijanse za intervalnu seriju podataka o raspodjeli zasejane površine kolektivne farme po prinosu pšenice.

Aritmetička sredina je:

Izračunajmo varijansu:

6.3. Proračun disperzije prema formuli za pojedinačne podatke

Tehnika proračuna disperzija složeno, a za velike vrijednosti opcija i frekvencija može biti glomazno. Proračuni se mogu pojednostaviti korištenjem svojstava disperzije.

Disperzija ima sljedeća svojstva.

1. Smanjenje ili povećanje težine (učestalosti) promjenljive karakteristike za određeni broj puta ne mijenja disperziju.

2. Smanjenje ili povećanje vrijednosti svake karakteristike za istu konstantnu vrijednost A disperzija se ne menja.

3. Smanjenje ili povećanje vrijednosti svake karakteristike za određeni broj puta k odnosno smanjuje ili povećava varijansu u k 2 puta standardna devijacija  u k jednom.

4. Varijanca karakteristike u odnosu na proizvoljnu vrijednost je uvijek veća od varijanse u odnosu na aritmetičku sredinu za kvadrat razlike između prosječne i proizvoljne vrijednosti:

Ako A 0, tada dolazimo do sljedeće jednakosti:

tj. varijansa neke karakteristike je jednaka razlici između srednjeg kvadrata vrijednosti obilježja i kvadrata srednje vrijednosti.

Svako svojstvo se može koristiti samostalno ili u kombinaciji s drugim prilikom izračunavanja varijanse.

Procedura za izračunavanje varijanse je jednostavna:

1) odrediti aritmetička sredina :

2) kvadrat aritmetičke sredine:

3) kvadrat odstupanja svake varijante serije:

X i 2 .

4) pronađite zbir kvadrata opcija:

5) podijeliti zbir kvadrata opcija njihovim brojem, odnosno odrediti prosječan kvadrat:

6) odrediti razliku između srednjeg kvadrata karakteristike i kvadrata srednje vrednosti:

Primjer 3.1 Imamo sljedeće podatke o produktivnosti radnika:

Napravimo sljedeće proračune:

Za grupisane podatke rezidualna disperzija- prosek od varijanse unutar grupe:

Gdje je σ 2 j unutargrupna varijansa j -te grupe.

Za negrupisane podatke rezidualna disperzija je mjera tačnosti aproksimacije, tj. aproksimacija linije regresije originalnim podacima:
gdje je y(t) prognoza prema jednadžbi trenda; y t – početni niz dinamike; n je broj bodova; p je broj koeficijenata regresione jednadžbe (broj varijabli koje objašnjavaju).
U ovom primjeru se zove nepristrasna procjena varijanse.

Primjer #1. Raspodjelu radnika tri preduzeća jednog udruženja po tarifnim kategorijama karakterišu sljedeći podaci:

Kategorija plate radnikaBroj radnika u preduzeću
preduzeće 1preduzeće 2preduzeće 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

Definiraj:
1. disperzija za svako preduzeće (unutargrupna disperzija);
2. prosjek unutargrupnih disperzija;
3. međugrupna disperzija;
4. ukupna varijansa.

Rješenje.
Prije nego što se pristupi rješavanju problema, potrebno je utvrditi koja je karakteristika efektivna, a koja faktorijalna. U primjeru koji se razmatra, efektivni atribut je “Tarifna kategorija”, a faktor faktora je “Broj (naziv) preduzeća”.
Tada imamo tri grupe (preduzeća) za koje je potrebno izračunati grupni prosjek i unutargrupne varijanse:


Kompanijaprosek grupe,varijansa unutar grupe,
1 4 1,8

Prosek varijansi unutar grupe ( rezidualna disperzija) izračunato po formuli:


gdje možete izračunati:
ili:


onda:
Ukupna disperzija bit će jednaka: s 2 = 1,6 + 0 = 1,6.
Ukupna varijansa se također može izračunati korištenjem jedne od sljedeće dvije formule:

Prilikom rješavanja praktičnih problema često se mora suočiti sa znakom koji ima samo dvije alternativne vrijednosti. U ovom slučaju se ne govori o težini određene vrijednosti neke karakteristike, već o njenom udjelu u agregatu. Ako se udio populacijskih jedinica koje imaju ispitivanu osobinu označi sa " R", a ne posjedovanje - kroz" q“, tada se disperzija može izračunati po formuli:
s 2 = p×q

Primjer #2. Prema podacima o razvijenosti šest radnika brigade utvrditi međugrupnu varijansu i procijeniti uticaj radne smjene na njihovu produktivnost rada ako je ukupna varijansa 12,2.

br. radne brigadeRadni učinak, kom.
u prvoj smjeniu 2. smjeni
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

Rješenje. Početni podaci

Xf1f2f 3f4f5f6Ukupno
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
Ukupno 31 33 37 37 40 38

Tada imamo 6 grupa za koje je potrebno izračunati grupnu sredinu i unutargrupne varijanse.
1. Pronađite prosječne vrijednosti svake grupe.







2. Pronađite srednji kvadrat svake grupe.







Rezultate proračuna sumiramo u tabeli:
Broj grupeGrupni prosjekUnutargrupna varijansa
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. Unutargrupna varijansa karakteriše promjenu (varijaciju) proučavane (rezultirajuće) osobine unutar grupe pod uticajem svih faktora, osim faktora koji leži u osnovi grupisanja:
Izračunavamo prosjek unutargrupnih disperzija koristeći formulu:


4. Međugrupna varijansa karakteriše promjenu (varijaciju) proučavane (rezultirajuće) osobine pod utjecajem faktora (faktorske osobine) koji leži u osnovi grupisanja.
Međugrupna disperzija se definiše kao:

Gdje


Onda

Ukupna varijansa karakteriše promjenu (varijaciju) proučavane (rezultirajuće) osobine pod utjecajem svih faktora (faktorskih osobina) bez izuzetka. Po uslovu zadatka jednak je 12,2.
Empirijska korelacija mjeri koliko je ukupne fluktuacije rezultirajućeg atributa uzrokovano proučavanim faktorom. Ovo je omjer faktorske varijanse prema totalna varijansa:

Određujemo empirijsku korelaciju:

Veze između karakteristika mogu biti slabe ili jake (bliske). Njihovi kriterijumi se vrednuju na Chaddock skali:
0,1 0,3 0,5 0,7 0,9 U našem primjeru, odnos između faktora X karakteristike Y je slab
Koeficijent determinacije.

Definirajmo koeficijent determinacije:

Tako je 0,67% varijacije rezultat razlika između osobina, a 99,37% drugih faktora.
Zaključak: u ovom slučaju učinak radnika ne zavisi od rada u određenoj smjeni, tj. uticaj radne smjene na njihovu produktivnost rada nije značajan i uzrokovan je drugim faktorima.

Primjer #3. Na osnovu prosjeka plate i kvadrata odstupanja od njegove vrijednosti za dvije grupe radnika, pronađite ukupnu varijansu primjenom pravila sabiranja varijansi:

Rješenje:
Prosjek varijansi unutar grupe

Međugrupna disperzija se definiše kao:


Ukupna varijansa će biti: 480 + 13824 = 14304

Međutim, sama ova karakteristika nije dovoljna za proučavanje slučajna varijabla. Zamislite dva strijelca koji pucaju u metu. Jedan precizno šutira i pogađa blizu centra, a drugi ...samo se zabavlja a ni ne nišani. Ali ono što je smiješno je to prosjek rezultat će biti potpuno isti kao kod prvog strijelca! Ovu situaciju uslovno ilustruju sledeće slučajne varijable:

"Snajpersko" matematičko očekivanje je, međutim, jednako , za "zanimljivu osobu": - takođe je nula!

Stoga, postoji potreba da se kvantifikuje koliko daleko rasuti metke (vrijednosti slučajne varijable) u odnosu na centar mete ( matematičko očekivanje). dobro i rasipanje prevedeno sa latinskog samo kao disperzija .

Pogledajmo kako se ova numerička karakteristika određuje u jednom od primjera iz 1. dijela lekcije:

Tamo smo pronašli razočaravajuće matematičko očekivanje ove igre, a sada moramo izračunati njenu varijansu, koja označeno kroz .

Hajde da saznamo koliko su pobede/gubici "razbacani" u odnosu na prosečnu vrednost. Očigledno, za ovo moramo izračunati razlike između vrijednosti slučajne varijable i ona matematičko očekivanje:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Sada se čini da je potrebno sumirati rezultate, ali ovaj način nije dobar - iz razloga što će se oscilacije lijevo poništavati jedna drugu sa oscilacijama udesno. Tako, na primjer, "amaterski" strijelac (primjer iznad) razlike će biti , a kada se dodaju dat će nulu, tako da nećemo dobiti nikakvu procjenu disperzije njegovog gađanja.

Da biste zaobišli ovu smetnju, razmislite moduli razlike, ali tehnički razlozi pristup se ukorijenio kada su na kvadrat. Pogodnije je rasporediti rješenje u tablicu:

I ovdje počinje računati prosjećna težina vrijednost kvadrata odstupanja. Šta je? Njihova je očekivanu vrijednost, što je mjera raspršenja:

definicija disperzija. Iz definicije je odmah jasno da varijansa ne može biti negativna- obratite pažnju na vežbu!

Prisjetimo se kako pronaći očekivanje. Pomnožite kvadratne razlike sa odgovarajućim vjerovatnoćama (nastavak tabele):
- figurativno rečeno, ovo je "vlačna sila",
i sumirajte rezultate:

Ne mislite li da je na pozadini dobitaka rezultat ispao prevelik? Tako je - bili smo na kvadrat, a da bismo se vratili u dimenziju naše igre, potrebno je izvući Kvadratni korijen. Ova vrijednost se zove standardna devijacija i označeno grčko pismo"sigma":

Ponekad se ovo značenje naziva standardna devijacija .

Šta je njegovo značenje? Ako odstupimo od matematičkog očekivanja ulijevo i udesno za standardnu ​​devijaciju:

– tada će najvjerovatnije vrijednosti slučajne varijable biti „koncentrirane“ na ovom intervalu. Šta zapravo vidimo:

Međutim, dogodilo se da se u analizi raspršenja gotovo uvijek operira konceptom disperzije. Hajde da vidimo šta to znači u odnosu na igre. Ako u slučaju strijelaca govorimo o "preciznosti" pogodaka u odnosu na centar mete, onda disperzija karakterizira dvije stvari:

Prvo, očigledno je da kako se stope povećavaju, raste i varijansa. Tako, na primjer, ako povećamo za 10 puta, onda će se matematičko očekivanje povećati za 10 puta, a varijansa će se povećati za 100 puta (čim je kvadratna vrijednost). Ali imajte na umu da se pravila igre nisu promijenila! Samo su se stope promijenile, grubo rečeno, prije smo se kladili na 10 rubalja, sada 100.

Drugo, više zanimljiva poenta je da varijansa karakterizira stil igre. Mentalno popravi stopu igre na nekom određenom nivou, i pogledajte šta je šta ovdje:

Igra niske varijance je oprezna igra. Igrač ima tendenciju da bira najpouzdanije šeme, gde ne gubi/dobija previše u jednom trenutku. Na primjer, crveno/crni sistem u ruletu (vidi primjer 4 članka slučajne varijable) .

Igra velike varijance. Često je zovu disperzija igra. Ovo je avanturistički ili agresivni stil igre gdje igrač bira "adrenalinske" šeme. Da se barem setimo "Martingale", u kojoj su sume u igri za redove veličine veće od „tihe“ igre iz prethodnog paragrafa.

Situacija u pokeru je indikativna: postoje tzv čvrsto igrači koji imaju tendenciju da budu oprezni i "tresaju" svojim sredstvima za igru (bankroll). Nije iznenađujuće da njihov bankroll ne fluktuira mnogo (mala varijansa). Suprotno tome, ako igrač ima veliku varijansu, onda je to agresor. Često rizikuje, pravi velike opklade i može i razbiti ogromnu banku i propasti.

Ista stvar se dešava i na Forexu, i tako dalje - ima mnogo primera.

Štaviše, u svim slučajevima nije bitno da li je igra za peni ili za hiljade dolara. Svaki nivo ima svoje igrače niske i velike varijacije. Pa za prosječnu pobjedu, koliko se sjećamo, "odgovorno" očekivanu vrijednost.

Vjerovatno ste primijetili da je pronalaženje varijanse dug i mukotrpan proces. Ali matematika je velikodušna:

Formula za pronalaženje varijanse

Ova formula je izvedena direktno iz definicije varijanse i odmah je puštamo u promet. Kopiraću ploču sa našom igrom odozgo:

i pronađeno očekivanje.

Izračunavamo varijansu na drugi način. Prvo, pronađimo matematičko očekivanje - kvadrat slučajne varijable. By definicija matematičkog očekivanja:

U ovom slučaju:

Dakle, prema formuli:

Kako kažu, osjetite razliku. A u praksi je, naravno, bolje primijeniti formulu (osim ako uvjet ne zahtijeva drugačije).

Savladavamo tehniku ​​rešavanja i projektovanja:

Primjer 6

Pronađite njegovo matematičko očekivanje, varijansu i standardnu ​​devijaciju.

Ovaj zadatak se nalazi svuda i, po pravilu, nema smislenog značenja.
Možete zamisliti nekoliko sijalica sa brojevima koje svijetle u ludnici sa određenim vjerovatnoćama :)

Rješenje: Pogodno je sumirati glavne proračune u tabeli. Prvo upisujemo početne podatke u gornja dva reda. Zatim izračunavamo proizvode, zatim i na kraju zbrojeve u desnoj koloni:

Zapravo, skoro sve je spremno. U trećem redu nacrtano je gotovo matematičko očekivanje: .

Disperzija se izračunava po formuli:

I na kraju, standardna devijacija:
- lično, obično zaokružujem na 2 decimale.

Svi proračuni se mogu izvršiti na kalkulatoru, a još bolje - u Excelu:

Ovde je teško pogrešiti :)

Odgovori:

Oni koji žele mogu još više pojednostaviti svoj život i iskoristiti moje kalkulator (demo), što ne samo da će odmah riješiti ovaj zadatak, ali i graditi tematske grafike (dođi uskoro). Program može preuzeti u biblioteci– ako ste preuzeli barem jedan materijal za učenje ili primili drugi način. Hvala na podršci projektu!

Nekoliko zadataka za samostalno rješavanje:

Primjer 7

Izračunajte varijansu slučajne varijable iz prethodnog primjera po definiciji.

I sličan primjer:

Primjer 8

Diskretna slučajna varijabla je data sopstvenim zakonom distribucije:

Da, vrijednosti slučajne varijable mogu biti prilično velike (primjer iz stvarnog rada), a ovdje, ako je moguće, koristite Excel. Kao, usput, u primjeru 7 - brže je, pouzdanije i ugodnije.

Rješenja i odgovori na dnu stranice.

U zaključku 2. dijela lekcije analizirat ćemo još jedan tipičan zadatak, moglo bi se reći i mali rebus:

Primjer 9

Diskretna slučajna varijabla može imati samo dvije vrijednosti: i , i . Vjerovatnoća, matematičko očekivanje i varijansa su poznati.

Rješenje: Počnimo s nepoznatom vjerovatnoćom. Budući da slučajna varijabla može uzeti samo dvije vrijednosti, onda je zbir vjerovatnoća odgovarajućih događaja:

i od tada .

Ostaje da se pronađe..., lako je reći :) Ali dobro, počelo je. Po definiciji matematičkog očekivanja:
- zamijenite poznate vrijednosti:

- i ništa se više ne može istisnuti iz ove jednadžbe, osim što je možete prepisati u uobičajenom smjeru:

ili:

O daljim akcijama, mislim da možete pretpostaviti. Kreirajmo i riješimo sistem:

Decimale- ovo je, naravno, potpuna sramota; pomnožite obje jednačine sa 10:

i podijeli sa 2:

To je bolje. Iz 1. jednačine izražavamo:
(ovo je lakši nacin)- zamjena u 2. jednačini:


Mi gradimo na kvadrat i napravi pojednostavljenja:

Množimo sa:

Kao rezultat, kvadratna jednačina, pronađite njegov diskriminant:
- Super!

i dobijamo dva rješenja:

1) ako , To ;

2) ako , To .

Prvi par vrijednosti zadovoljava uslov. Sa velikom vjerovatnoćom, sve je tačno, ali, ipak, zapisujemo zakon distribucije:

i izvršite provjeru, odnosno pronađite očekivanje:

Uz proučavanje varijacije osobine u cijeloj populaciji u cjelini, često je potrebno pratiti kvantitativne promjene osobine po grupama na koje je populacija podijeljena, kao i po grupama. Ova studija varijacije se postiže proračunom i analizom razne vrste disperzija.
Razlikovati ukupnu, međugrupnu i unutargrupnu disperziju.
Ukupna varijansa σ 2 mjeri varijaciju osobine u cijeloj populaciji pod utjecajem svih faktora koji su uzrokovali ovu varijaciju, .

Međugrupna varijansa (δ) karakterizira sistematsku varijaciju, tj. razlike u veličini osobine koja se proučava, koja nastaje pod uticajem faktora osobine koji leži u osnovi grupisanja. Izračunava se po formuli:
.

Varijanca unutar grupe (σ) odražava nasumične varijacije, tj. dio varijacije koji se javlja pod utjecajem neobračunatih faktora i ne zavisi od faktora osobine koji leži u osnovi grupisanja. Izračunava se po formuli:
.

Prosjek varijansi unutar grupe: .

Postoji zakon koji povezuje 3 vrste disperzije. Ukupna varijansa je jednaka zbiru prosjeka unutargrupe i međugrupna varijansa: .
Ovaj omjer se zove pravilo dodavanja varijanse.

U analizi se široko koristi mjera, a to je udio varijanse između grupa u ukupnoj varijansi. Nosi ime empirijski koeficijent determinacije (η 2): .
Kvadratni korijen empirijskog koeficijenta determinacije naziva se empirijski odnos korelacije (η):
.
Karakterizira utjecaj atributa koji leži u osnovi grupiranja na varijaciju rezultirajućeg atributa. Empirijski odnos korelacije varira od 0 do 1.
Hajde da to pokažemo praktična upotreba u sljedećem primjeru (tabela 1).

Primjer #1. Tabela 1 - Produktivnost rada dve grupe radnika jedne od radionica NPO "Ciklon"

Izračunajte ukupne i grupne prosjeke i varijanse:




Početni podaci za izračunavanje prosjeka unutargrupne i međugrupne disperzije prikazani su u tabeli. 2.
tabela 2
Obračun i δ 2 za dvije grupe radnika.


Radničke grupe
Broj radnika, osoba Prosjek, det./sm. Disperzija

Prošao tehničku obuku

5 95 42,0

Nije tehnički obučen

5 81 231,2

Svi radnici

10 88 185,6
Hajde da izračunamo rezultate. Prosjek varijansi unutar grupe:
.
Međugrupna varijansa

Ukupna varijansa:
Dakle, empirijski odnos korelacije: .

Uz variranje kvantitativnih osobina, može se uočiti i varijacija kvalitativnih osobina. Ova studija varijacije se postiže izračunavanjem sljedećih tipova varijansi:

Varijanca udjela unutar grupe određena je formulom

Gdje n i– broj jedinica u odvojenim grupama.
Udio proučavane osobine u cijeloj populaciji, koji se određuje formulom:
Tri vrste disperzije su međusobno povezane na sljedeći način:
.

Ovaj omjer varijansi naziva se teorem o dodavanju varijanse udjela udjela.



greška: Sadržaj je zaštićen!!