Odaberite Stranica

Kako se medijan razlikuje od srednje vrijednosti. Prosjek ili još uvijek medijan

Pretpostavimo da želite da odredite prosječan nivo u distribuciji ocjena učenika ili u uzorku podataka kontrole kvaliteta. Da biste to učinili, morate izračunati medijan skupa brojeva pomoću funkcije MEDIAN.

Ova funkcija je jedan od načina da se izmjeri središnja tendencija, tj. lokacija centra skupa brojeva u statistička distribucija. Postoje tri najčešća načina za određivanje središnjeg trenda.

    Prosječna vrijednost- ovo je vrijednost koja je aritmetička sredina, odnosno izračunava se dodavanjem skupa brojeva, nakon čega slijedi dijeljenje rezultirajućeg zbroja njihovim brojem. Na primjer, prosjek za brojeve 2, 3, 3, 5, 7 i 10 je 5 (rezultat dijeljenja zbira ovih brojeva, koji je 30, njihovim brojem, koji je 6).

    Medijan- broj koji je sredina skupa brojeva: polovina brojeva ima vrijednosti veće od medijane, a polovina brojeva ima manje vrijednosti. Na primjer, medijana za brojeve 2, 3, 3, 5, 7 i 10 je 4.

    Moda- broj koji se najčešće javlja u datom skupu brojeva. Na primjer, način rada za brojeve 2, 3, 3, 5, 7 i 10 bi bio 3.

Sa simetričnom distribucijom skupa brojeva, sve tri vrijednosti središnje tendencije će se poklopiti. Uz pristrasnu distribuciju skupa brojeva, vrijednosti mogu biti različite.

Snimke ekrana u ovom članku snimljene su u programu Excel 2016. Ako koristite drugu verziju, sučelje može izgledati malo drugačije, ali funkcionalnost je ista.

Primjer

Da biste ovaj primjer lakše razumjeli, kopirajte ga na prazan list.

savjet: Za prebacivanje između pregleda rezultata i pregleda formula koje vraćaju te rezultate, pritisnite CTRL+` (apostrof) ili na kartici Formule u grupi Zavisnosti formule pritisnite dugme Prikaži formule.

Medijan- ovo je vrijednost karakteristike koja dijeli rangiranu seriju distribucije na dva jednaka dijela - sa vrijednostima karakteristika manjim od medijane i sa vrijednostima karakteristika većim od medijane. Da biste pronašli medijanu, morate pronaći vrijednost osobine koja se nalazi u sredini poredanog niza.

Pogledajte rješenje problema pronalaženja modusa i medijana Možeš

U rangiranim serijama, negrupisani podaci za pronalaženje medijane svode se na pronalaženje rednog broja medijane. Medijan se može izračunati pomoću sljedeće formule:

gdje je Xm donja granica srednjeg intervala;
im - srednji interval;
Sme je zbir zapažanja koji je akumuliran prije početka srednjeg intervala;
fme je broj opservacija u srednjem intervalu.

srednja svojstva

  1. Medijan ne ovisi o onim vrijednostima atributa koje se nalaze na obje njegove strane.
  2. Analitičke operacije s medijanom su prilično ograničene, pa kada se kombiniraju dvije distribucije sa poznati medijani nemoguće je unaprijed predvidjeti medijan nove distribucije.
  3. Medijan ima minimalno svojstvo. Njegova suština leži u činjenici da je zbroj apsolutnih odstupanja x vrijednosti od medijane minimalna vrijednost u odnosu na odstupanje X od bilo koje druge vrijednosti

Grafička definicija medijane

Za utvrđivanje medijane grafička metoda koristiti akumulirane frekvencije na kojima se gradi kumulativna kriva. Vrhovi ordinata koji odgovaraju akumuliranim frekvencijama povezani su ravnim segmentima. Podijelivši na pola posljednju ordinatu, koja odgovara ukupnom zbiru frekvencija, i nacrtajući okomicu sjecišta sa kumulativnom krivom na nju, pronađite ordinatu željene vrijednosti medijane.

Definicija mode u statistici

Moda - vrijednost karakteristika, koji ima najveću frekvenciju u statističke serije distribucija.

Definicija mode se proizvodi na različite načine, a to ovisi o tome da li je varijabla predstavljena kao diskretna ili intervalne serije.

Pronalaženje mode a medijana se radi jednostavnim gledanjem kroz frekvencijski stupac. U ovoj koloni pronađite najveći broj koji karakterizira najveću frekvenciju. Odgovara određenoj vrijednosti atributa, a to je način rada. U nizu varijacija intervala, središnja varijanta intervala sa najvećom frekvencijom se približno smatra modom. U ovoj seriji distribucije mod se izračunava po formuli:

gdje je XMo donja granica modalnog intervala;
imo - modalni razmak;
fm0, fm0-1, fm0+1 su frekvencije u modalnim, prethodnim i narednim modalnim intervalima.

Modalni interval je određen najvišom frekvencijom.

Moda se široko koristi u statističkoj praksi u analizi potražnje potrošača, registraciji cijena itd.

Odnosi između aritmetičke sredine, medijane i moda

Za unimodalni simetrični niz raspodjele, medijan i mod su isti. Za iskrivljene distribucije, one se ne poklapaju.

K. Pearson je, na osnovu poravnanja različitih tipova krivulja, utvrdio da za umjereno asimetrične distribucije vrijede sljedeće približne veze između aritmetičke sredine, medijane i moda:

4. Moda. Medijan. Opšta i uzorkovana sredina

Režim je na ekranu, medijana je u trouglu, a prosjeci su temperatura u bolnici i na odjelu. Nastavljamo naše praktični kurs zabavna statistika (Lekcija 1) proučavanje centralnih karakteristika statistička populacija, čija imena vidite u zaglavlju. I krenućemo od njegovog kraja, jer prosječne vrijednosti govor je došao skoro od prvih pasusa teme. Za napredne čitaoce sadržaj:

  • Opšta i uzorkovana sredina– proračun prema primarnim podacima i za generisane diskretne varijantne serije;
  • Moda– definicija i nalaz za diskretni slučaj;
  • Medijan– opšta definicija kako pronaći medijanu;
  • Srednja vrijednost, mod i medijan intervalne varijacijske serije– proračun iz primarnih podataka i iz gotovih serija. Formule moda i medijana,
  • Kvartili, decili, percentili - ukratko o glavnoj stvari.

Pa, bolje je da se "lutke" upoznaju sa materijalom kako bi:

Pa hajde da istražimo neke stanovništva zapremine, odnosno njegove numeričke karakteristike, nije bitno diskretno ili kontinuirano (Lekcije 2, 3).

Opća sekundarna pozvao prosjek sve vrijednosti ovog skupa:

Ako su brojevi isti (što je tipično za diskretne serije) , tada se formula može napisati u kompaktnijem obliku:
, Gdje
opcija ponovljeni puta;
opcija - vremena;
opcija - vremena;

opcija - puta.

Primjer izračuna uživo opšte sekundarno sreo u primjer 2, ali da ne bi bilo dosadno, neću ni podsjećati na njegov sadržaj.

Dalje. Kao što se sjećamo, obrada svih stanovništvačesto teško ili nemoguće, pa se stoga organizuju predstavnik uzorkovanje volumen, a na osnovu proučavanja ovog uzorka dolazi se do zaključka o cjelokupnoj populaciji.

Uzorak srednji pozvao prosjek sve vrijednosti uzorka:

i u prisustvu istih opcija, formula će biti napisana kompaktnije:
- kao zbir proizvoda varijante na odgovarajuću frekvencije .

Srednja vrijednost uzorka nam omogućava da precizno procijenimo pravu vrijednost , što je sasvim dovoljno za mnoge studije. Što je veći uzorak, to će ta procjena biti tačnija.

Počnimo sa praksom, odnosno nastavimo diskretne serije varijacija i poznato stanje:

Primjer 8

Prema rezultatima selektivne studije radnika radionice, utvrđene su njihove kvalifikacione kategorije: 4, 5, 6, 4, 4, 2, 3, 5, 4, 4, 5, 2, 3, 3, 4, 5 , 5, 2, 3, 6, 5, 4, 6, 4, 3.

Kako odlučiti zadatak? Ako nam je dato primarni podaci(originalne sirove vrijednosti), onda se one mogu glupo sabrati i podijeliti s veličinom uzorka:
- prosječna kvalifikaciona kategorija radnika radnje.

Ali u mnogim problemima potrebno je sastaviti varijacioni niz (cm. Primjer 4) :

- ili je ova serija prvobitno predložena (što se češće dešava). I onda, naravno, koristimo "civiliziranu" formulu:

Moda . Mod diskretne varijacione serije je opcija sa maksimalnom frekvencijom. U ovom slučaju . Modu je lako pronaći na stolu, a još lakše frekvencijski opseg je apscisa najviše tačke:


Ponekad postoji nekoliko takvih vrijednosti (sa istom maksimalnom frekvencijom), a onda se svaka od njih smatra modom.

Ako sve ili skoro sve opcije drugačije (što je tipično za intervalne serije), tada se modalna vrijednost određuje na nešto drugačiji način, o čemu se govori u 2. dijelu lekcije.

Medijan . Medijan serije varijacija * - ovo je vrijednost koja ga dijeli na dva jednaka dijela (prema broju opcija).

Ali sada moramo pronaći srednju vrijednost, modus i medijan.

Rješenje: naći srednji prema primarnim podacima, najbolje je zbrojiti sve opcije i rezultat podijeliti s obimom populacije:
den. jedinice

Ovi proračuni, inače, neće oduzeti mnogo vremena čak ni kada koristite offline kalkulator. Ali ako postoji Excel, onda, naravno, rezultat u bilo kojoj slobodnoj ćeliji =SUM(, odaberite sve brojeve mišem, zatvorite zagradu ) , staviti znak podjele / , unesite broj 30 i pritisnite Enter. Spreman.

Što se tiče mode, njena procjena na osnovu početnih podataka postaje neupotrebljiva. Iako među njima vidimo iste brojeve, ali među njima lako može biti pet ili šest ili sedam opcija sa istom maksimalnom frekvencijom, na primjer frekvencija 2. Osim toga, cijene se mogu zaokružiti. Stoga se modalna vrijednost izračunava prema generiranoj intervalnoj seriji (više o tome kasnije).

Šta možete reći o medijani: uključivanje u excel =MEDIAN(, odaberite sve brojeve mišem, zatvorite zagradu ) i kliknite Enter: . Štaviše, ovdje čak ni ne morate ništa sortirati.

Ali unutra Primjer 6 sortirano uzlaznim redom (zapamti i sortiraj - link iznad), a ovo je dobra prilika da se ponovi formalni algoritam za pronalaženje medijane. Uzorak dijelimo na pola:

A budući da se sastoji od parnog broja opcija, medijana je jednaka aritmetičkoj sredini 15. i 16. opcije uredno(!) varijantne serije:

den. jedinice

Situacija dva. Kada je data gotova intervalna serija (tipičan zadatak za učenje).

Nastavljamo analizirati isti primjer sa čizmama, gdje je, prema početnim podacima je sastavio IVR. Da izračunam srednji potrebne su sredine intervala:

– da koristimo poznatu formulu za diskretni padež:

- odličan rezultat! Nepodudarnost sa tačnijom vrijednošću () izračunatom iz primarnih podataka iznosi samo 0,04.

Zapravo, ovdje smo aproksimirali intervalni niz diskretnim, i ova aproksimacija se pokazala vrlo efikasnom. Međutim, tu nema posebne koristi, jer. pod modernim softver nije teško izračunati tačnu vrijednost čak i za vrlo veliki niz primarnih podataka. Ali ovo pod uslovom da su nam poznati :)

Sa ostalim centralnim indikatorima sve je zanimljivije.

Da biste pronašli modu, morate je pronaći modalni razmak (sa maksimalnom frekvencijom)- u ovom problemu, ovo je interval sa frekvencijom 11, i koristite sljedeću ružnu formulu:
, Gdje:

je donja granica modalnog intervala;
je dužina modalnog intervala;
je frekvencija modalnog intervala;
– učestalost prethodnog intervala;
– učestalost narednog intervala.

ovako:
den. jedinice - kao što vidite, "modna" cijena za cipele se značajno razlikuje od aritmetičkog prosjeka.

Ne ulazeći u geometriju formule, jednostavno ću dati histogram relativnih frekvencija i napomena:


odakle se jasno vidi da je mod pomaknut u odnosu na centar modalnog intervala prema lijevom intervalu sa višom frekvencijom. Logično.

Za referencu, analizirat ću rijetke slučajeve:

– ako je modalni interval ekstreman, onda ili ;

- ako se nađu 2 modalna intervala koja su u blizini, na primjer, i , tada smatramo modalni interval , dok se obližnji intervali (lijevo i desno), ako je moguće, također povećavaju za 2 puta.

- ako postoji razmak između modalnih intervala, tada primjenjujemo formulu na svaki interval, čime se dobivaju 2 ili više načina.

Evo takvog moda za otpremu :)

I medijana. Ako je data gotova intervalna serija, tada se medijana izračunava koristeći malo manje strašnu formulu, ali u početku je zamorno (Frojdovska tipkarska greška :)) pronaći srednji interval - ovo je interval koji sadrži varijantu (ili 2 varijante), koji dijeli varijantni niz na dva jednaka dijela.

Gore sam opisao kako odrediti medijanu, fokusirajući se na relativne kumulativne frekvencije, ovdje je zgodnije izračunati "obične" akumulirane frekvencije. Algoritam proračuna je potpuno isti - prva vrijednost je srušena s lijeve strane (crvena strelica), a svaki sljedeći se dobija kao zbir prethodnog sa trenutnom frekvencijom iz lijevog stupca (zelene oznake kao primjer):

Da li svi razumiju značenje brojeva u desnoj koloni? - ovo je broj opcija koje su se uspjele "akumulirati" na svim "pređenim" intervalima, uključujući i trenutni.

Pošto imamo paran broj opcija (30 komada), medijana će biti interval koji sadrži 30/2 = 15. i 16. opcije. A fokusirajući se na akumulirane frekvencije, lako je doći do zaključka da su ove opcije sadržane u intervalu .

Srednja formula:
, Gdje:
- obim statističke populacije;
je donja granica srednjeg intervala;
je dužina srednjeg intervala;
frekvencija srednji interval;
kumulativna frekvencija prethodni interval.

ovako:
den. jedinice - Primetite, to srednja vrijednost, naprotiv, pokazalo se da je pomaknut udesno, jer By desna ruka postoji značajan broj opcija:


I za posebne slučajeve.

TEST

Na temu: "Mode. Medijan. Metode za njihovo izračunavanje"


Uvod

Srednje vrijednosti i povezani indikatori varijacije igraju vrlo važnu ulogu u statistici, što je zbog predmeta njenog proučavanja. Stoga je ova tema jedna od centralnih u kursu.

Prosjek je vrlo čest generalizirajući indikator u statistici. Ovo se objašnjava činjenicom da je samo uz pomoć prosjeka moguće karakterizirati populaciju prema kvantitativno promjenjivom atributu. Prosječna vrijednost u statistici je generalizirajuća karakteristika skupa fenomena istog tipa prema nekom kvantitativno promjenjivom atributu. Prosjek pokazuje nivo ovog atributa u odnosu na jedinicu populacije.

Proučavajući društvene pojave i nastojeći da identifikuju njihove karakteristične, tipične osobine u specifičnim uslovima mesta i vremena, statističari se široko koriste prosečnim vrednostima. Uz pomoć prosjeka, različite populacije se mogu porediti jedna s drugom prema različitim karakteristikama.

Prosjeci koji se koriste u statistici pripadaju klasi prosječnih snaga. Od prosječnih snaga najčešće se koristi aritmetička sredina, rjeđe harmonijska sredina; harmonijska sredina se koristi samo pri izračunavanju prosječnih stopa dinamike, a srednja kvadratna - samo pri izračunavanju indikatora varijacije.

Aritmetička sredina je količnik dijeljenja zbira opcija njihovim brojem. Koristi se u slučajevima kada se volumen varijabilnog atributa za cijelu populaciju formira kao zbir vrijednosti atributa za njene pojedinačne jedinice. Aritmetička sredina je najčešći tip prosjeka, budući da odgovara prirodi društvenih pojava, gdje se obim različitih znakova u agregatu najčešće formira upravo kao zbir vrijednosti atributa u pojedinim jedinicama stanovništva.

U skladu sa svojim definitivnim svojstvom, harmonijsku sredinu treba koristiti kada se ukupni volumen atributa formira kao zbir recipročnih vrijednosti varijante. Koristi se kada se, ovisno o raspoloživom materijalu, težine ne moraju množiti, već podijeliti na opcije ili, što je isto, pomnožiti s njihovom inverznom vrijednošću. Harmonična sredina u ovim slučajevima je recipročna vrijednost aritmetičke sredine recipročnih vrijednosti atributa.

Harmoničku sredinu treba koristiti u slučajevima kada ponderi nisu jedinice populacije – nosioci obilježja, već proizvodi tih jedinica i vrijednosti obilježja.


1. Definicija modusa i medijana u statistici

Aritmetička i harmonijska sredina su generalizirajuće karakteristike populacije prema jednom ili drugom promjenjivom atributu. Pomoćne deskriptivne karakteristike distribucije varijabilnog atributa su mod i medijan.

U statistici, moda je vrijednost osobine (varijante) koja se najčešće nalazi u datoj populaciji. U seriji varijacija, ovo će biti varijanta sa najvećom frekvencijom.

Medijan u statistici se naziva varijanta, koja se nalazi u sredini serije varijacija. Medijan dijeli niz na pola, s obje njegove strane (gore i dolje) nalazi se isti broj populacijskih jedinica.

Mod i medijan, za razliku od eksponencijalnih prosjeka, su specifične karakteristike, njihova vrijednost je svaka posebna varijanta u nizu varijacija.

Režim se koristi u slučajevima kada je potrebno okarakterizirati vrijednost osobine koja se najčešće pojavljuje. Ako trebate, na primjer, saznati najčešću veličinu plate u preduzeću, tržišnu cijenu po kojoj je prodato najveći broj roba, veličina cipela koju potrošači najviše traže itd., u tim slučajevima pribjegavaju modi.

Medijan je zanimljiv po tome što pokazuje kvantitativnu granicu vrijednosti varijabilne karakteristike koju je dostigla polovina pripadnika populacije. Neka prosječna plata zaposlenih u banci iznosi 650.000 rubalja. Mjesečno. Ova karakteristika se može dopuniti ako kažemo da je polovina radnika primala platu od 700.000 rubalja. i više, tj. uzmimo medijanu. Mod i medijan su tipične karakteristike u slučajevima kada su populacije homogene i velike po broju.


2. Pronalaženje moda i medijana u nizu diskretnih varijacija

Pronalaženje moda i medijana u varijacionom nizu, gdje su vrijednosti atributa date određenim brojevima, nije jako teško. Razmotrite tabelu 1. sa distribucijom porodica po broju djece.

Tabela 1. Distribucija porodica prema broju djece

Očigledno je da će u ovom primjeru moda biti porodica sa dvoje djece, jer ova vrijednost opcija odgovara najvećem broju porodica. Mogu postojati distribucije u kojima su sve varijante podjednako učestale, u tom slučaju nema mode, ili, drugim riječima, za sve varijante se može reći da su jednako modalne. U drugim slučajevima, ne jedna, već dvije opcije mogu biti najveća frekvencija. Tada će postojati dva načina, distribucija će biti bimodalna. Bimodalne distribucije mogu ukazivati ​​na kvalitativnu heterogenost populacije prema osobini koja se proučava.

Da biste pronašli medijan u diskretnom nizu varijacija, trebate podijeliti zbir frekvencija na pola i rezultatu dodati ½. Dakle, u raspodjeli 185 porodica po broju djece, medijana će biti: 185/2 + ½ = 93, tj. 93. opcija, koja naručeni red dijeli na pola. Šta znači 93. opcija? Da biste to saznali, morate akumulirati frekvencije, počevši od najmanjih opcija. Zbir frekvencija 1. i 2. opcije je 40. Jasno je da ovdje nema 93 opcije. Ako učestalost 3. opcije dodamo 40, onda ćemo dobiti zbir jednak 40 + 75 = 115. Dakle, 93. opcija odgovara trećoj vrijednosti varijabilnog atributa, a medijana će biti porodica sa dvoje djece .

Mod i medijan u ovom primjeru su se poklopili. Ako smo imali paran zbir frekvencija (na primjer, 184), onda primjenom gornje formule dobijamo broj medijana opcija, 184/2 + ½ = 92,5. Budući da nema frakcijskih opcija, rezultat pokazuje da je medijan u sredini između 92 i 93 opcije.

3. Proračun moda i medijana u nizu varijacije intervala

Deskriptivna priroda modusa i medijana je zbog činjenice da oni ne nadoknađuju pojedinačna odstupanja. Uvijek odgovaraju određenoj varijanti. Stoga, mod i medijan ne zahtijevaju kalkulacije da bi ih pronašli ako su poznate sve vrijednosti značajke. Međutim, u nizu varijacije intervala, proračuni se koriste za pronalaženje približne vrijednosti moda i medijana unutar određenog intervala.

Za izračunavanje određene vrijednosti modalne vrijednosti znaka zatvorenog u intervalu, koristi se sljedeća formula:

M o \u003d X Mo + i Mo * (f Mo - f Mo-1) / ((f Mo - f Mo-1) + (f Mo - f Mo + 1)),

gdje je X Mo minimalna granica modalnog intervala;

i Mo je vrijednost modalnog intervala;

fMo je frekvencija modalnog intervala;

f Mo-1 - frekvencija intervala koji prethodi modalnom;

f Mo+1 je frekvencija intervala nakon modalnog.

Proračun režima prikazat ćemo na primjeru datom u tabeli 2.


Tabela 2. Raspodjela radnika preduzeća prema primjeni standarda proizvodnje

Da bismo pronašli mod, prvo odredimo modalni interval date serije. Iz primjera se može vidjeti da najveća frekvencija odgovara intervalu u kojem se varijanta nalazi u rasponu od 100 do 105. Ovo je modalni interval. Vrijednost modalnog intervala je 5.

Zamjenom numeričkih vrijednosti iz tabele 2. u gornju formulu, dobijamo:

M o \u003d 100 + 5 * (104 -12) / ((104 - 12) + (104 - 98)) = 108,8

Značenje ove formule je sljedeće: vrijednost onog dijela modalnog intervala, koji se mora dodati njegovoj minimalnoj granici, određuje se ovisno o veličini frekvencija prethodnog i narednog intervala. U ovom slučaju dodajemo 8,8 na 100, tj. više od polovine intervala, jer je frekvencija prethodnog intervala manja od frekvencije sljedećeg intervala.

Izračunajmo sada medijanu. Da bismo pronašli medijanu u nizu varijacija intervala, prvo odredimo interval u kojem se nalazi (interval medijane). Takav interval će biti onaj čija je kumulativna frekvencija jednaka ili veća od polovine zbira frekvencija. Kumulativne frekvencije se formiraju postepenim zbrajanjem frekvencija, počevši od intervala od najmanju vrijednost sign. Polovina zbira frekvencija koje imamo je 250 (500:2). Dakle, prema tabeli 3. srednji interval će biti interval sa vrednošću zarada od 350.000 rubalja. do 400.000 rubalja.

Tabela 3. Izračunavanje medijane u nizu varijacije intervala

Prije ovog intervala, zbir akumuliranih frekvencija bio je 160. Stoga, da bi se dobila vrijednost medijane, potrebno je dodati još 90 jedinica (250 - 160).

Plate u različitim sektorima privrede, temperatura i padavine na istom području u uporedivim vremenskim periodima, prinosi useva u različitim geografskim regionima, itd. Međutim, prosek nikako nije jedini generalizujući pokazatelj - u nekim slučajevima za precizniji procjena je vrijednost kao što je medijana odgovarajuća. U statistici se široko koristi kao pomoćna deskriptivna karakteristika distribucije obilježja u jednoj populaciji. Pogledajmo po čemu se razlikuje od prosjeka i šta je izazvalo potrebu za njegovom upotrebom.

Medijan u statistici: definicija i svojstva

Zamislite sledeću situaciju: 10 ljudi radi zajedno sa direktorom u kompaniji. Obični zaposlenici dobijaju po 1.000 grivna, a njihov menadžer, koji je osim toga vlasnik, prima 10.000 grivna. Ako izračunamo aritmetičku sredinu, ispada da je prosječna plata u ovom preduzeću 1900 UAH. Hoće li ova izjava biti tačna? Ili da uzmemo ovaj primjer, u istoj bolničkoj sobi nalazi se devet osoba sa temperaturom od 36,6°C i jedna osoba sa temperaturom od 41°C. Aritmetička sredina u ovom slučaju je: (36,6 * 9 + 41) / 10 \u003d 37,04 ° C. Ali to ne znači da su svi prisutni bolesni. Sve ovo govori da sam prosjek često nije dovoljan, te se zato uz njega koristi i medijan. U statistici se ovaj indikator naziva varijantom koja se nalazi tačno u sredini uređene serije varijacija. Ako to izračunate za naše primjere, dobit ćete, respektivno, 1000 UAH. i 36,6 °S. Drugim riječima, medijan u statistici je vrijednost koja dijeli niz na pola na način da se na obje njegove strane (dolje ili gore) nalazi isti broj jedinica date populacije. Zbog ovog svojstva, ovaj indikator ima nekoliko drugih naziva: 50. percentil ili kvantil 0,5.

Kako pronaći medijanu u statistici

Metoda izračunavanja ove vrijednosti u velikoj mjeri ovisi o tome koju vrstu varijacionog niza imamo: diskretnu ili intervalnu. U prvom slučaju, medijan u statistici je prilično jednostavan. Sve što trebate učiniti je pronaći zbir frekvencija, podijeliti sa 2, a zatim rezultatu dodati ½. Najbolje bi bilo objasniti princip proračuna na sljedećem primjeru. Pretpostavimo da smo grupisali podatke o plodnosti i želimo da saznamo koliki je medijan.

Broj porodične grupe prema broju djece

Broj porodica

Nakon nekoliko jednostavnih proračuna, dobijamo da je željeni indikator jednak: 195/2 + ½ = opcija. Da biste saznali što to znači, trebali biste uzastopno akumulirati frekvencije, počevši od najmanjih opcija. Dakle, zbir prva dva reda nam daje 30. Jasno je da ovdje nema 98 opcija. Ali ako rezultatu dodamo frekvenciju treće opcije (70), dobićemo zbir jednak 100. Sadrži samo 98. opciju, što znači da će medijana biti porodica koja ima dvoje djece.

Što se tiče intervalne serije, ovdje se obično koristi sljedeća formula:

M e \u003d X Me + i Me * (∑f / 2 - S Me-1) / f Me, u kojem:

  • X Me - prva vrijednost srednjeg intervala;
  • ∑f je broj serije (zbir njenih frekvencija);
  • i Me - vrijednost srednjeg raspona;
  • f Me - frekvencija srednjeg opsega;
  • S Me-1 - zbir kumulativnih frekvencija u opsezima koji prethode medijani.

Opet, teško je ovo shvatiti bez primjera. Pretpostavimo da postoje podaci o vrijednosti

Plata, hiljada rubalja

Akumulirane frekvencije

Da bismo koristili gornju formulu, prvo moramo odrediti srednji interval. Kao takav opseg bira se jedan, čija akumulirana frekvencija prelazi ili je jednaka polovini ukupnog zbira frekvencija. Dakle, dijeleći 510 sa 2, dobivamo da ovaj kriterij odgovara intervalu s vrijednošću plaće od 250.000 rubalja. do 300.000 rubalja Sada možete zamijeniti sve podatke u formuli:

M e \u003d X Me + i Me * (∑f / 2 - S Me-1) / f Me = 250 + 50 * (510/2 - 170) / 115 \u003d 286,96 hiljada rubalja.

Nadamo se da je naš članak bio koristan, a sada imate jasnu ideju o tome što je medijan u statistici i kako ga treba izračunati.



greška: Sadržaj je zaštićen!!