Odaberite Stranica

Šta znači medijana? Formula za mod i medijan u statistici

Median Me oni nazivaju vrijednost atributa koja se nalazi u sredini rangiranog niza i dijeli ga na dva dijela jednaka po broju jedinica. Dakle, u rangiranom redu distribucije, jedna polovina reda ima vrijednosti atributa koje prelaze medijanu, druga polovina je manja od medijane.

Medijan se koristi umjesto aritmetičke sredine kada se ekstremne opcije rangiranog niza (najmanji i najveći) u usporedbi s ostalima pokažu pretjerano velikim ili pretjerano malim.

IN diskretno u nizu varijacija koji sadrži neparan broj jedinica, medijana je jednaka varijanti karakteristike koja ima broj:
,
gdje je N broj jedinica stanovništva.
U diskretnoj seriji koja se sastoji od parnog broja populacijskih jedinica, medijana je definirana kao prosjek opcija koje imaju brojeve i:
.
U distribuciji radnika prema radnom stažu, medijana je jednaka prosjeku opcija koje imaju brojeve 10 u rangiranoj seriji: 2 = 5 i 10: 2 + 1 = 6. Opcije za peti i šesti atribut su jednake do 4 godine, dakle
godine
Prilikom izračunavanja medijane in interval red prvi nađi srednji interval, (tj. sadrži medijanu), za koje se koriste akumulirane frekvencije ili frekvencije. Medijan je interval čija je akumulirana učestalost jednaka ili veća od polovine ukupnog volumena populacije. Tada se srednja vrijednost izračunava pomoću formule:
,
gdje je donja granica srednjeg intervala;
– širina srednjeg intervala;
– akumulirana frekvencija intervala koji prethodi medijani;
– frekvencija srednjeg intervala.
Izračunajmo medijan distribucije radnika po platama (vidjeti predavanje „Sažetak i grupisanje statističkih podataka“).
Medijan je interval plate 800-900 UAH, jer je njegova kumulativna frekvencija 17, što premašuje polovinu zbroja svih frekvencija (). Onda
Me=800+100 UAH.
Dobijena vrijednost pokazuje da polovina radnika ima plate ispod 875 UAH, ali je to iznad prosjeka.
Da biste odredili medijanu, možete koristiti kumulativne frekvencije umjesto kumulativnih frekvencija.
Medijan, kao i mod, ne ovisi o ekstremnim vrijednostima varijante, pa se također koristi za karakterizaciju centra u distribucijskim serijama s nesigurnim granicama.
Median property : zbroj apsolutnih vrijednosti odstupanja od medijane manji je od bilo koje druge vrijednosti (uključujući i aritmetičku sredinu):

Ovo svojstvo medijane koristi se u transportu prilikom projektovanja lokacije tramvajskih i trolejbuskih stajališta, benzinskih pumpi, sabirnih mesta itd.
Primjer. Uz autoput dug 100 km nalazi se 10 garaža. Za projektovanje izgradnje benzinske pumpe prikupljeni su podaci o broju očekivanih putovanja na benzinsku pumpu za svaku garažu.
Tabela 2 - Podaci o broju putovanja do benzinske pumpe za svaku garažu.

Potrebno je ugraditi benzinsku pumpu kako bi ukupna kilometraža vozila za dopunu goriva bila minimalna.
Opcija 1. Ako je benzinska pumpa postavljena na sredini autoputa, odnosno na 50. kilometru (središte raspona promjena atributa), tada će kilometraža, uzimajući u obzir broj putovanja, biti:
a) u jednom pravcu:
;
b) suprotno:
;
c) ukupna kilometraža u oba smjera: .

Opcija 2. Ako je benzinska pumpa postavljena na srednjem dijelu autoputa, određena formulom aritmetičkog prosjeka uzimajući u obzir broj putovanja:

Medijan se može odrediti grafički, koristeći kumulat (vidjeti predavanje „Sažetak i grupisanje statističkih podataka“). Da biste to učinili, posljednja ordinata, jednaka zbroju svih frekvencija ili frekvencija, dijeli se na pola. Iz rezultirajuće točke vraća se okomica dok se ne siječe s kumulatom. Apscisa tačke preseka daje vrednost medijane.

Uz prosječne vrijednosti, strukturni prosjeci se izračunavaju kao statističke karakteristike varijacionih serija distribucija - moda I medijana.
Moda(Mo) predstavlja vrijednost karakteristike koja se proučava, koja se ponavlja sa najvećom učestalošću, tj. mod – vrijednost karakteristike koja se najčešće javlja.
Medijan(Me) je vrijednost atributa koja se nalazi u sredini rangirane (uređene) populacije, tj. medijan je centralna vrijednost varijacione serije.
Glavno svojstvo medijane je da je zbir apsolutnih odstupanja vrijednosti atributa od medijane manji nego od bilo koje druge vrijednosti ∑|x i - Me|=min.

Određivanje načina i medijana iz negrupisanih podataka

Hajde da razmotrimo određivanje moda i medijana iz negrupisanih podataka. Pretpostavimo da radni tim od 9 ljudi ima sljedeće tarifne kategorije: 4 3 4 5 3 3 6 2 6. S obzirom da ova brigada ima najviše radnika 3. kategorije, ova tarifna kategorija će biti modalna. Mo = 3.
Za određivanje medijane potrebno je izvršiti rangiranje: 2 3 3 3 4 4 5 6 6 . Centralni radnik u ovoj seriji je radnik 4. kategorije, dakle, ova kategorija će biti medijana. Ako rangirana serija uključuje paran broj jedinica, tada se medijan definira kao prosjek dvije centralne vrijednosti.
Ako mod odražava najčešću varijantu vrijednosti atributa, tada medijan praktično obavlja funkciju prosjeka za heterogenu populaciju koja ne poštuje normalni zakon distribucije. Ilustrirajmo njegov kognitivni značaj na sljedećem primjeru.
Recimo da treba okarakterisati prosječan prihod grupe ljudi od 100 ljudi, od kojih 99 ima primanja u rasponu od 100 do 200 dolara mjesečno, a mjesečni prihod potonjih iznosi 50.000 dolara (tabela 1).
Tabela 1 - Mjesečni prihodi ispitivane grupe ljudi. Ako koristimo aritmetički prosjek, dobijamo prosječan prihod od otprilike 600 - 700 dolara, što ima malo zajedničkog sa prihodima glavnog dijela grupe. Medijan, u ovom slučaju jednak Me = 163 dolara, omogućiće nam da damo objektivan opis nivoa prihoda 99% ove grupe ljudi.
Razmotrimo određivanje moda i medijana iz grupisanih podataka (serija distribucije).
Pretpostavimo da raspodela radnika celog preduzeća u celini prema tarifnoj kategoriji ima sledeći oblik (tabela 2).
Tabela 2 - Raspodjela radnika preduzeća po tarifnim kategorijama

Izračunavanje moda i medijana za diskretnu seriju

Izračunavanje moda i medijana za intervalne serije

Izračunavanje moda i medijana za varijacioni niz

Određivanje moda iz diskretne serije varijacija

Koristi se prethodno konstruisana serija vrijednosti atributa, sortirana po vrijednosti. Ako je veličina uzorka neparna, uzimamo centralnu vrijednost; ako je veličina uzorka paran, uzimamo aritmetičku sredinu dvije centralne vrijednosti.
Određivanje moda iz diskretne serije varijacija: 5. tarifna kategorija ima najveću frekvenciju (60 osoba), dakle, modalna. Mo = 5.
Da bi se odredila srednja vrijednost neke karakteristike, broj srednje jedinice serije (N Me) nalazi se korištenjem sljedeće formule: , gdje je n volumen populacije.
u našem slučaju: .
Rezultirajuća frakciona vrijednost, koja se uvijek javlja kada je broj jedinica u populaciji paran, pokazuje da se tačna sredina nalazi između 95 i 96 radnika. Potrebno je utvrditi kojoj grupi pripadaju radnici sa ovim rednim brojevima. To se može učiniti izračunavanjem akumuliranih frekvencija. Radnika sa ovim brojem nema u prvoj grupi, gdje je samo 12 osoba, au drugoj grupi nema ih (12+48=60). 95. i 96. radnici su u trećoj grupi (12+48+56=116), dakle medijana je 4. tarifna kategorija.

Proračun moda i medijana u intervalnim serijama

Za razliku od diskretnih varijacijskih serija, određivanje moda i medijane iz intervalnih serija zahtijeva određene proračune zasnovane na sljedećim formulama:
, (5.6)
Gdje x 0– donja granica modalnog intervala (interval sa najvećom frekvencijom naziva se modalni);
i– vrijednost modalnog intervala;
f Mo– učestalost modalnog intervala;
f Mo -1– učestalost intervala koji prethodi modalnom;
f Mo +1– učestalost intervala koji slijedi nakon modalnog.
(5.7)
Gdje x 0– donja granica srednjeg intervala (medijana je prvi interval čija akumulirana frekvencija prelazi polovinu ukupnog zbira frekvencija);
i– vrijednost srednjeg intervala;
S Me -1– akumulirani interval koji prethodi medijani;
f Me– frekvencija srednjeg intervala.
Ilustrujmo primjenu ovih formula koristeći podatke u tabeli. 3.
Interval sa granicama 60 – 80 u ovoj distribuciji će biti modalni, jer ima najveću frekvenciju. Koristeći formulu (5.6), definiramo način rada:

Za utvrđivanje srednjeg intervala potrebno je odrediti akumuliranu frekvenciju svakog sljedećeg intervala sve dok ne pređe polovinu zbira akumuliranih frekvencija (u našem slučaju 50%) (tabela 5.11).
Utvrđeno je da je medijan interval sa granicama od 100 - 120 hiljada rubalja. Odredimo sada medijanu:

Tabela 3 - Raspodjela stanovništva Ruske Federacije prema nivou prosječnog nominalnog novčanog dohotka po glavi stanovnika u martu 1994. godine.
Grupe prema nivou prosječnog mjesečnog prihoda po glavi stanovnika, hiljada rubalja.Udio stanovništva, %
Do 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Preko 3007,7
Ukupno100,0

Tabela 4 – Određivanje srednjeg intervala
Dakle, aritmetička sredina, mod i medijan mogu se koristiti kao generalizirana karakteristika vrijednosti određenog atributa za jedinice rangirane populacije.
Glavna karakteristika distributivnog centra je aritmetička sredina, koju karakteriše činjenica da sva odstupanja od nje (pozitivna i negativna) iznose nulu. Medijan se odlikuje činjenicom da je zbir odstupanja od njega u modulu minimalan, a mod je vrijednost atributa koji se najčešće javlja.
Odnos moda, medijane i aritmetičke sredine ukazuje na prirodu distribucije karakteristike u agregatu i omogućava nam da procenimo njenu asimetriju. U simetričnim raspodjelama, sve tri karakteristike se poklapaju. Što je veća nesklad između moda i aritmetičke sredine, to je serija asimetričnija. Za umjereno asimetrične serije, razlika između moda i aritmetičke sredine je približno tri puta veća od razlike između medijane i srednje vrijednosti, tj.
|Po –`x| = 3 |Me –`x|.

Određivanje moda i medijana grafičkom metodom

Mod i medijan in intervalne serije može se odrediti grafički. Način je određen histogramom distribucije. Da biste to učinili, odaberite najviši pravougaonik, koji je u ovom slučaju modalni. Zatim povezujemo desni vrh modalnog pravougaonika sa gornjim desnim uglom prethodnog pravougaonika. I lijevi vrh modalnog pravokutnika - sa gornjim lijevim uglom sljedećeg pravokutnika. Od tačke njihovog presjeka spuštamo okomicu na osu apscise. Apscisa presečne tačke ovih linija biće režim distribucije (slika 5.3).


Rice. 5.3. Grafičko određivanje načina rada pomoću histograma.


Rice. 5.4. Grafičko određivanje medijane kumulacijom
Da biste odredili medijan iz tačke na skali akumuliranih frekvencija (učestalosti) koja odgovara 50%, povucite pravu liniju paralelnu osi apscise dok se ne siječe s kumulatom. Zatim, od točke presjeka, okomita se spušta na x-osu. Apscisa tačke preseka je medijana.

Kvartili, decili, percentili

Slično, pronalaženjem medijane u nizu varijacija distribucije, možete pronaći vrijednost atributa za bilo koju jedinicu rangirane serije. Tako, na primjer, možete pronaći vrijednost atributa za jedinice koje dijele niz na četiri jednaka dijela, na 10 ili 100 dijelova. Ove vrijednosti se nazivaju "kvartili", "decili", "percentili".
Kvartili predstavljaju vrijednost karakteristike koja rangiranu populaciju dijeli na 4 jednaka dijela.
Postoji donji kvartil (Q 1), koji odvaja ¼ populacije sa najnižim vrednostima atributa, i gornji kvartil (Q 3), koji odvaja ¼ dela sa najviše vrijednosti sign. To znači da će 25% jedinica u populaciji biti manje vrijednosti Q 1 ; 25% jedinica će biti sadržano između Q 1 i Q 2 ; 25% je između Q2 i Q3, a preostalih 25% prelazi Q3. Srednji kvartil Q2 je medijan.
Za izračunavanje kvartila koristeći niz intervalnih varijacija, koriste se sljedeće formule:
, ,
Gdje x Q 1– donja granica intervala koji sadrži donji kvartil (interval je određen akumuliranom frekvencijom, prva prelazi 25%);
x Q 3– donja granica intervala koji sadrži gornji kvartil (interval je određen akumuliranom frekvencijom, prva prelazi 75%);
i– veličina intervala;
S Q 1-1– akumulirana frekvencija intervala koji prethodi intervalu koji sadrži donji kvartil;
S Q 3-1– akumulirana frekvencija intervala koji prethodi intervalu koji sadrži gornji kvartil;
f Q 1– učestalost intervala koji sadrži donji kvartil;
f Q 3– frekvencija intervala koji sadrži gornji kvartil.
Razmotrimo izračun donjeg i gornjeg kvartila prema podacima u tabeli. 5.10. Donji kvartil je u rasponu 60 – 80, čija je kumulativna učestalost 33,5%. Gornji kvartil se nalazi u rasponu 160 – 180 sa akumuliranom frekvencijom od 75,8%. Uzimajući ovo u obzir dobijamo:
,
.
Pored kvartila, decili se mogu odrediti u rasponima varijacije distribucije - opcijama koje dijele rangirani varijacijski niz na deset jednakih dijelova. Prvi decil (d 1) dijeli stanovništvo u omjeru 1/10 prema 9/10, drugi decil (d 1) - u omjeru 2/10 prema 8/10, itd.
Oni se izračunavaju pomoću formula:
, .
Karakteristične vrijednosti koje dijele niz na sto dijelova nazivaju se percentili. Odnosi medijana, kvartila, decila i percentila prikazani su na Sl. 5.5.

Strukturni (pozicioni) prosjeci– to su prosječne vrijednosti koje zauzimaju određeno mjesto (poziciju) u rangiranoj seriji varijacija.

Moda(Mo) je vrijednost atributa koji se najčešće javlja u populaciji koja se proučava.

Za diskretne serije varijacija moda će biti vrijednost opcija s najvećom frekvencijom

Primjer. Odredite način rada koristeći dostupne podatke (tabela 7.5).

Tabela 7.5 – Distribucija ženske obuće koja se prodaje u prodavnici obuće N, februar 2013

Prema tabeli. 5 jasno je da je najveća frekvencija f max= 28, odgovara vrijednosti atributa x= veličina 37. dakle, Mo= 37 veličina cipela, tj. Upravo je ova veličina cipela bila najtraženija cipele veličine 37;

IN prvo utvrđeno modalni interval, tj. koji sadrži mod – interval sa najvećom frekvencijom (u slučaju distribucije intervala sa u jednakim intervalima, u slučaju nejednakih intervala - prema najvećoj gustoći).

Modus se približno smatra sredinom modalnog intervala. Specifična vrijednost moda za intervalnu seriju određena je formulom:

Gdje x Mo– donja granica modalnog intervala;

i Mo– vrijednost modalnog intervala;

f Mo– učestalost modalnog intervala;

f Mo -1– učestalost intervala koji prethodi modalnom;

f Mo +1– učestalost intervala koji slijedi nakon modalnog.

Primjer. Odredite način rada koristeći dostupne podatke (tabela 7.6).

Tabela 7.6 – Raspodjela zaposlenih prema radnom stažu

Prema tabeli. 6 jasno je da je najveća frekvencija f max= 35, odgovara intervalu: 6-8 godina (modalni interval). Odredimo način rada pomoću formule:

godine.

dakle, Mo= 6,8 godina, tj. Većina zaposlenih ima 6,8 godina iskustva.

Naziv medijana je preuzet iz geometrije, gdje se odnosi na segment koji povezuje jedan od vrhova trougla sa sredinom suprotne stranice i tako dijeli stranicu trougla na dva jednaka dijela.

Medijan(Ja) Ovo je vrijednost atributa koja se nalazi u sredini rangirane populacije. Inače, medijan je vrijednost koja dijeli broj uređene varijacijske serije na dva jednaka dijela - jedan dio ima vrijednosti varijabilne karakteristike manje od prosječne opcije, a drugi ima veće vrijednosti.

Za rangirana serija(tj. uređeno - izgrađeno u rastućem ili opadajućem redoslijedu pojedinačnih vrijednosti karakteristike) s neparnim brojem pojmova ( n= neparan) medijan je opcija koja se nalazi u sredini reda. Redni broj medijane ( N Me) definira se na sljedeći način:

N Me =(n+1)/ 2.

Primjer. U nizu od 51 člana, srednji broj je (51+1)/2 = 26, tj. Medijan je opcija koja je 26. po redu.

Za rangiranu seriju s parnim brojem pojmova ( n=čak) – medijan će biti aritmetička sredina dvije vrijednosti atributa smještenih u sredini serije. Serijski brojevi dvije centralne opcije određuju se na sljedeći način:

N Me 1 =n/ 2; N Me 2 =(n/ 2)+ 1.

Primjer. Kada je n=50; N Me1 = 50/2 = 25; N Me2= (50/2)+1 = 26, tj. Medijan je prosjek opcija koje su 25. i 26. po redu.

IN diskretne serije varijacija Medijan se nalazi po akumuliranoj frekvenciji koja odgovara serijskom broju medijane ili je po prvi put premašuje. Inače, akumulirana frekvencija je jednaka ili po prvi put prelazi polovinu zbira svih frekvencija serije.

Primjer. Odredite medijanu na osnovu dostupnih podataka (Tabela 7.7).

Tabela 7.7 – Distribucija ženske obuće koja se prodaje u prodavnici obuće N, februar 2013

Prema tabeli. 7 određujemo redni broj medijane: N Me =( 67+1)/2=34.

Moda. Medijan. Metode njihovog izračunavanja (strana 1 od 2)

Akumulirana frekvencija koja prelazi ovu vrijednost po prvi put S= 41, odgovara vrijednosti atributa x= veličina 37. dakle, Ja= 37 veličina cipela, tj. Polovina pari se kupuje manja od veličine 37, a druga polovina veća.

U ovom primjeru, mod i medijan su isti, ali možda nisu isti.

IN intervalne varijacione serije akumulirane frekvencije se određuju, na osnovu podataka o akumuliranim frekvencijama se nalaze srednji interval– interval u kojem je akumulirana frekvencija polovina ili po prvi put prelazi polovinu ukupnog zbira frekvencija. Formula za određivanje medijane u nizu intervalne distribucije je sljedeća:

.

Gdje x Me– donja granica srednjeg intervala;

i Me– vrijednost srednjeg intervala;

f i– zbir frekvencija serije;

S Me -1– zbir akumuliranih frekvencija intervala koji prethodi medijani;

f Me– frekvencija srednjeg intervala.

Primjer. Odredite medijanu na osnovu dostupnih podataka (Tabela 7.8).

Tabela 7.8 – Raspodjela zaposlenih prema radnom stažu

Prema tabeli. 8 određujemo redni broj medijane: N Me =100/2=50. Akumulirana frekvencija koja prelazi ovu vrijednost po prvi put S= 82, odgovara intervalu od 6-8 godina (medijan interval). U ovom primjeru, modalni interval i srednji interval su isti, ali možda nisu isti. Odredimo medijan koristeći formulu:

godine

dakle, Ja= 6,2 godine, tj. polovina radnika ima manje od 6,2 godine iskustva, a druga polovina više od 6,2 godine iskustva.

Mod i medijan su pronađeni široka primena u različitim oblastima privrede. Dakle, izračunavanje modalne produktivnosti rada, modalne cijene itd. omogućava ekonomisti da proceni preovlađujuće trenutno njihov nivo. Ovu karakteristiku treba koristiti za identifikaciju rezervi naše privrede. Moda je važna za rješavanje praktičnih problema. Tako se prilikom planiranja masovne proizvodnje odjeće i obuće utvrđuje veličina proizvoda za kojom je najveća potražnja (modal size). Mod se može koristiti kao približna karakteristika nivoa karakteristike koja se proučava umjesto aritmetičke sredine ako je distribucija frekvencije blizu simetrične i ima jedan neravni vrh.

Medijan treba koristiti kao prosječnu vrijednost u slučajevima kada nema dovoljno povjerenja u homogenost populacije koja se proučava. Na medijan utječu ne toliko same vrijednosti koliko broj slučajeva na određenom nivou. Također treba napomenuti da je medijana uvijek specifična (sa velikim brojem zapažanja ili u slučaju neparnog broja članova populacije), jer ispod Meh neki stvarni stvarni element populacije se podrazumijeva, dok aritmetička sredina često poprima vrijednost koju nijedna druga jedinica u populaciji ne može uzeti.

Glavna nekretnina Meh je da je zbroj apsolutnih odstupanja vrijednosti atributa od medijane manji nego od bilo koje druge vrijednosti: . Ova nekretnina Meh može se koristiti npr. pri određivanju gradilišta javnih zgrada, jer Meh određuje tačku koja daje najkraću udaljenost, na primjer, vrtića od mjesta prebivališta roditelja, štićenika naselje iz bioskopa, prilikom projektovanja tramvajskih i trolejbuskih stajališta itd.

U sistemu strukturnih indikatora indikatori karakteristika oblika distribucije su opcije koje zauzimaju određeno mjesto u rangiranoj varijacionoj seriji (svaka četvrta, peta, deseta, dvadeset peta itd.). Slično, pronalaženjem medijane u nizu varijacija, možete pronaći vrijednost karakteristike za bilo koju jedinicu rangirane serije.

Kvartili– karakteristične vrijednosti koje dijele rangiranu populaciju na četiri jednaka dijela. Postoje niži kvartili ( P 1), prosjek ( P 2) i vrh ( P 3). Donji kvartil odvaja 1/4 populacije s najnižim vrijednostima atributa, gornji kvartil odvaja 1/4 populacije s najvišim vrijednostima atributa. To znači da će 25% jedinica u populaciji biti manje veličine P 1; 25% jedinica će biti ugovoreno između P 1 I P 2; 25% – između P 2 I P 3; preostalih 25% premašuje P 3. srednji kvartil ( P 2) je medijan .

Da biste izračunali kvartile koristeći niz intervala, koristite sljedeće formule:

;

.

Gdje x Q1– donja granica intervala koji sadrži donji kvartil (interval je određen akumuliranom frekvencijom, prva prelazi 25%);

x Q3– donja granica intervala koji sadrži gornji kvartil (interval je određen akumuliranom frekvencijom, prva prelazi 75%);

S Q 1-1– akumulirana frekvencija intervala koji prethodi intervalu koji sadrži donji kvartil;

S Q 3-1– akumulirana frekvencija intervala koji prethodi intervalu koji sadrži gornji kvartil;

f Q1– učestalost intervala koji sadrži donji kvartil;

f Q3– frekvencija intervala koji sadrži gornji kvartil.

Decili– ovo su varijantne vrijednosti koje dijele rangirani niz na deset jednakih dijelova: 1. decil ( d 1) dijeli stanovništvo u omjeru 1/10 prema 9/10, 2. decil ( d 2) - u omjeru od 2/10 do 8/10, itd. Decili se izračunavaju po istoj shemi kao medijana i kvartili:

;

.

Upotreba distribucije karakteristika o kojima je bilo riječi u analizi varijacijskih serija omogućava nam da detaljno i detaljno okarakteriziramo populaciju koja se proučava.

VIDI VIŠE:

Strukturni proseci

Zajedno sa prosjecima snage, strukturni prosjeci su postali široko rasprostranjeni.

Struktura statističkih agregata varira. Štaviše, što je distribucija jedinica populacije simetričnija, što je njen sastav kvalitativno homogeniji prema osobini koja se proučava, to je bolja i pouzdanija prosječna vrijednost karakteristike koja karakterizira fenomen koji se proučava. Ali za slučajeve oštre iskrivljenosti (asimetrije) distributivnog niza, aritmetička sredina više nije tako tipična. Na primjer, prosječna veličina depozita u štedionicama ne predstavlja poseban interes, budući da je većina doprinosa ispod ovog nivoa, a na prosjek značajno utiču veliki doprinosi, kojih je malo i koji nisu tipični za masu priloga.

moda (statistika)

U takvim slučajevima statistika koristi drugi sistem – sistem pomoćnih strukturnih prosjeka. To uključuje mod, medijan, kao i kvartele, kvintele, decele, procente.

moda (pon.)– najčešća vrijednost karakteristike, au diskretnom nizu varijacija – ovo je varijanta s najvećom frekvencijom.

U statističkoj praksi moda se koristi u proučavanju prihoda stanovništva, potražnje potrošača, registracije cijena, te u analizi određenih tehničko-ekonomskih pokazatelja uspješnosti preduzeća.

U nekim slučajevima je interesantan mod, a ne aritmetička sredina. Ponekad se koristi umjesto aritmetičke sredine, na primjer, za karakterizaciju strukture distribucijskih serija.

Procedura za određivanje moda zavisi od vrste distributivnog niza. Ako je promjenljiva karakteristika predstavljena u obliku diskretne serije, tada nisu potrebni proračuni za određivanje moda. U takvoj seriji, mod će biti vrijednost atributa koji ima najveću frekvenciju.

Ako je vrijednost karakteristike predstavljena u obliku intervalne serije varijacije s jednakim intervalima, tada se mod određuje izračunavanjem pomoću formule:

Gdje X Mo– donja granica modalnog intervala,

i Mo– vrijednost modalnog intervala,

f Mo , f Mo-1 , f Mo+1– frekvencije modalnih, premodalnih (prethodnih) i postmodalnih (slijedećih modalnih) intervala.

medijana (ja)– to je vrijednost karakteristike koja se nalazi u sredini rangiranog niza varijacija, gdje su pojedinačne vrijednosti karakteristike (varijante) raspoređene u rastućem ili opadajućem redoslijedu (po rangu).

Medijan treba koristiti kao prosječnu vrijednost u slučajevima kada nema dovoljno povjerenja u homogenost populacije koja se proučava. Medijan se koristi u marketinškim aktivnostima. Na primjer, lokacija liftova, primarnih vinarija, tvornica konzervi, zbir udaljenosti do kojih bi od dobavljača sirovina trebao biti najmanji.

Medijan se, kao i mod, definira na različite načine. To ovisi o strukturi distribucijske serije.
Za određivanje medijane u diskretnim nizovima varijacija:

1) pronađite njegov serijski broj koristeći formulu

N Me =
2) izgraditi niz akumuliranih frekvencija

3) pronaći akumuliranu frekvenciju koja je jednaka serijskom broju medijane ili je veća

4) opcija koja odgovara datoj akumuliranoj frekvenciji je medijan.

Ako je broj članova diskretnog niza neparan, tada je medijana u sredini niza i dijeli ovaj niz na pola na dva jednaka dijela prema broju članova niza. Redni broj medijane u ovom slučaju izračunava se po formuli:

N Me =(f + 1)2,

Gdje f broj članova serije.

U intervalnim serijama prvo se određuje srednji interval. Za ovo, isto kao u diskretne serije, izračunajte serijski broj medijane. Akumulirana frekvencija, koja je jednaka srednjem broju ili prva koja ga prelazi, u nizu varijacije intervala odgovara srednjem intervalu. Označimo ovu akumuliranu frekvenciju S Me. Medijan se direktno izračunava pomoću formule:

,
gdje je donja granica srednjeg intervala

- vrijednost srednjeg intervala

— akumulirana frekvencija intervala koji prethodi medijani

— frekvencija srednjeg intervala

Grafička definicija moda i medijana
Mod i medijan u nizu intervala mogu se odrediti grafički.

Način je određen histogramom distribucije. Da biste to učinili, odaberite najviši pravougaonik, koji je u ovom slučaju modalni. Zatim povezujemo desni vrh modalnog pravougaonika sa gornjim desnim uglom prethodnog pravougaonika. I lijevi vrh modalnog pravokutnika - sa gornjim lijevim uglom sljedećeg pravokutnika. Zatim, od točke njihovog presjeka, okomica se spušta na osu apscise. Apscisa tačke preseka ovih linija biće mod distribucije (slika 1). Medijan se izračunava iz kumulata (slika 2). Da bi se to odredilo, iz tačke na skali akumuliranih frekvencija (frekvencija) koja odgovara 50%, povlači se ravna linija paralelna s apscisnom osom dok se ne siječe s kumulatom. Zatim se od točke presjeka označene linije s kumulatom okomica spušta na osu apscise. Apscisa tačke preseka je medijana.

Indikatori varijacije u statistici.

U procesu statističke analize može nastati situacija kada se vrijednosti prosječnih vrijednosti poklope, a populacije na osnovu kojih se izračunavaju sastoje se od jedinica čije se vrijednosti atributa međusobno prilično razlikuju. U ovom slučaju se izračunavaju indeksi varijacije.

Katalog: preuzimanja -> Sotrudniki
preuzimanja -> N. L. Ivanova M. F. Lukanina
preuzimanja -> Predavanje za predškolce i roditelje “Prevencija agresivnog ponašanja djece predškolskog uzrasta”
preuzimanja -> Psihološka profesionalna adaptacija ličnosti
preuzimanja -> Odeljenje za obrazovanje i nauku Kemerovske oblasti Regionalni psihološki i valeološki centar Kemerovo
preuzimanja -> Federalna služba Odjel za kontrolu droga Ruske Federacije za regiju Kemerovo
Sotrudniki -> Luk Čuvaške Republike SPO "chetk" Ministarstvo obrazovanja Čuvašije
preuzimanja -> Karakteristike psihološko-pedagoške podrške razvoju predškolske djece
preuzimanja -> Mishina M. M. Razvoj mišljenja u zavisnosti od uključenosti u porodične i plemenske odnose
Sotrudniki -> Formiranje profesionalno značajnih kvaliteta kod učenika sa intelektualnim teškoćama po zanimanju

TEST

Na temu: "Mod. Medijan. Metode za njihovo izračunavanje"

Uvod

Prosječne vrijednosti i povezani indikatori varijacije igraju vrlo važnu ulogu u statistici, što je zbog predmeta njenog proučavanja. Stoga je ova tema jedna od centralnih u predmetu.

Prosjek je vrlo uobičajena sumarna mjera u statistici. To se objašnjava činjenicom da se samo uz pomoć prosjeka populacija može okarakterizirati kvantitativno promjenjivom karakteristikom. U statistici, prosječna vrijednost je generalizirajuća karakteristika skupa sličnih pojava zasnovana na nekoj kvantitativno promjenjivoj karakteristici. Prosjek pokazuje nivo ove karakteristike po jedinici stanovništva.

Kada proučavaju društvene pojave i pokušavaju da identifikuju njihove karakteristične, tipične karakteristike u specifičnim uslovima mesta i vremena, statističari se široko koriste prosečnim vrednostima. Koristeći prosjeke, možete međusobno upoređivati ​​različite populacije prema različitim karakteristikama.

Prosjeci koji se koriste u statistici pripadaju klasi prosječnih snaga. Od prosječnih snaga najčešće se koristi aritmetička sredina, rjeđe harmonijska sredina; Harmonična sredina se koristi samo kada se izračunaju prosječne stope dinamike, a srednji kvadrat se koristi samo kada se izračunaju indeksi varijacije.

Aritmetička sredina je količnik dijeljenja zbira varijanti njihovim brojem. Koristi se u slučajevima kada se volumen varirajuće karakteristike za cijelu populaciju formira kao zbroj karakterističnih vrijednosti njenih pojedinačnih jedinica. Aritmetička sredina je najčešći tip prosjeka, jer odgovara prirodi društvenih pojava, gdje se obim različitih karakteristika u agregatu najčešće formira upravo kao zbir karakterističnih vrijednosti pojedinih jedinica stanovništva. .

U skladu sa svojim definitivnim svojstvom, harmonijsku sredinu treba koristiti kada se ukupni volumen atributa formira kao zbir inverznih vrijednosti varijante. Koristi se kada se, u zavisnosti od materijala, težine ne moraju množiti, već podeliti na opcije ili, što je isto, pomnožiti sa njihovom recipročnom vrednošću. Harmonična sredina u ovim slučajevima je recipročna vrijednost aritmetičke sredine recipročnih vrijednosti karakteristike.

Harmoničnoj sredini treba pribjeći u slučajevima kada se kao težine ne koriste jedinice populacije - nosioci karakteristike, već proizvodi tih jedinica po vrijednosti karakteristike.

1. Definicija moda i medijana u statistici

Aritmetička i harmonijska sredina su generalizirajuće karakteristike populacije prema jednoj ili drugoj promjenljivoj osobini. Pomoćne deskriptivne karakteristike distribucije varijabilne karakteristike su mod i medijan.

U statistici, mod je vrijednost karakteristike (varijante) koja se najčešće nalazi u datoj populaciji. U seriji varijacija, ovo će biti opcija s najvećom frekvencijom.

U statistici, medijan je opcija koja se nalazi u sredini serije varijacija. Medijan dijeli niz na pola s obje strane (gore i dolje) nalazi se isti broj populacijskih jedinica.

Mod i medijana, za razliku od srednjih vrijednosti, su specifične karakteristike; njihovo značenje je dodijeljeno bilo kojoj specifičnoj opciji u nizu varijacija;

Mod se koristi u slučajevima kada je potrebno okarakterizirati vrijednost karakteristike koja se najčešće pojavljuje.

5.5 Mod i medijan. Njihov proračun u diskretnim i intervalnim varijantnim serijama

Ako trebate, na primjer, saznati najčešću stopu plata u preduzeću, cijenu na tržištu po kojoj je prodato najveći broj roba, veličina cipela koja je najtraženija među potrošačima itd., u tim slučajevima pribjegavaju modi.

Medijana je interesantna po tome što pokazuje količinsku granicu vrijednosti jedne varijable karakteristike koju je dostigla polovina pripadnika populacije. Neka prosječna plata zaposlenih u banci bude 650.000 rubalja. mjesečno. Ova karakteristika se može dopuniti ako kažemo da je polovina radnika primala platu od 700.000 rubalja. i više, tj. Dajmo medijanu. Mod i medijan su tipične karakteristike u slučajevima kada su populacije homogene i velike po broju.

Pronalaženje moda i medijana u diskretnom nizu varijacija

Pronalaženje moda i medijana u nizu varijacija, gdje su vrijednosti neke karakteristike date određenim brojevima, nije teško. Pogledajmo tabelu 1 sa distribucijom porodica po broju djece.

Tabela 1. Distribucija porodica prema broju djece

Očigledno je da će u ovom primjeru u modi biti porodica sa dvoje djece, budući da vrijednost ove opcije odgovara najvećem broju porodica. Mogu postojati distribucije u kojima se sve opcije javljaju podjednako često, u tom slučaju nema moda, ili, drugim riječima, možemo reći da su sve opcije jednako modalne. U drugim slučajevima, ne jedna, već dvije opcije mogu biti najviše frekvencije. Tada će postojati dva načina, distribucija će biti bimodalna. Bimodalne distribucije mogu ukazivati ​​na kvalitativnu heterogenost populacije prema osobini koja se proučava.

Da biste pronašli medijan u diskretnom nizu varijacija, trebate podijeliti zbir frekvencija na pola i dobivenom rezultatu dodati ½. Dakle, u raspodjeli 185 porodica po broju djece, medijana će biti: 185/2 + ½ = 93, tj. 93. opcija, koja naručeni red dijeli na pola. Šta znači 93. opcija? Da biste to saznali, morate akumulirati frekvencije, počevši od najmanjih opcija. Zbir frekvencija 1. i 2. opcije je 40. Jasno je da ovdje nema 93 opcije. Ako frekvenciji 3. opcije dodamo 40, dobijamo zbir jednak 40 + 75 = 115. Prema tome, 93. opcija odgovara trećoj vrijednosti varijabilne karakteristike, a medijana će biti porodica sa dvoje djece.

Mod i medijan u ovom primjeru su se poklopili. Ako bismo imali paran zbir frekvencija (na primjer, 184), onda bismo, koristeći gornju formulu, dobili broj medijane opcije, 184/2 + ½ =92,5. Budući da nema frakcijskih opcija, rezultat pokazuje da je medijan na sredini između 92 i 93 opcije.

3. Proračun moda i medijana u intervalnim varijacionim serijama

Deskriptivna priroda modusa i medijana je zbog činjenice da oni ne nadoknađuju pojedinačna odstupanja. Oni uvijek odgovaraju određenoj opciji. Stoga, mod i medijan ne zahtijevaju kalkulacije da bi se utvrdilo da li su poznate sve vrijednosti atributa. Međutim, u nizu varijacija intervala, proračuni se koriste za pronalaženje približne vrijednosti moda i medijana unutar određenog intervala.

Da biste izračunali određenu vrijednost modalne vrijednosti karakteristike sadržane u intervalu, koristite formulu:

M o = X Mo + i Mo *(f Mo – f Mo-1)/((f Mo – f Mo-1) + (f Mo – f Mo+1)),

Gdje je XMo minimalna granica modalnog intervala;

i Mo – vrijednost modalnog intervala;

f Mo – frekvencija modalnog intervala;

f Mo-1 – frekvencija intervala koji prethodi modalnom;

f Mo+1 – frekvencija intervala nakon modalnog.

Pokažimo proračun režima koristeći primjer dat u tabeli 2.

Tabela 2. Distribucija radnika preduzeća prema ispunjenosti standarda proizvodnje

Da bismo pronašli mod, prvo odredimo modalni interval ove serije. Primjer pokazuje da najviša frekvencija odgovara intervalu gdje se varijante nalaze u rasponu od 100 do 105. Ovo je modalni interval. Vrijednost modalnog intervala je 5.

Zamjenom numeričkih vrijednosti iz tabele 2 u gornju formulu, dobijamo:

M o = 100 + 5 * (104 -12)/((104 – 12) + (104 – 98)) = 108,8

Značenje ove formule je sljedeće: vrijednost onog dijela modalnog intervala koji treba dodati njegovoj minimalnoj granici određuje se ovisno o veličini frekvencija prethodnog i narednog intervala. U ovom slučaju dodajemo 8,8 na 100, tj. više od pola intervala jer je frekvencija prethodnog intervala manja od frekvencije sljedećeg intervala.

Izračunajmo sada medijanu. Da bismo pronašli medijanu u nizu varijacije intervala, prvo odredimo interval u kojem se nalazi (medijan interval). Takav interval će biti onaj čija je kumulativna frekvencija jednaka ili veća od polovine zbira frekvencija. Kumulativne frekvencije se formiraju postepenim zbrajanjem frekvencija, počevši od intervala od najniža vrijednost sign. Polovina zbira frekvencija je 250 (500:2). Prema tome, prema tabeli 3, srednji interval će biti interval sa vrednošću plate od 350.000 rubalja. do 400.000 rubalja.

Tabela 3. Izračunavanje medijane u nizu varijacije intervala

Prije ovog intervala, zbir akumuliranih frekvencija bio je 160. Dakle, da bi se dobila medijana vrijednost, potrebno je dodati još 90 jedinica (250 – 160).

Prilikom određivanja srednje vrijednosti, pretpostavlja se da je vrijednost jedinica unutar intervala raspoređena ravnomjerno. Stoga, ako je 115 jedinica koje se nalaze u ovom intervalu ravnomjerno raspoređene u intervalu jednakom 50, tada će sljedeća vrijednost odgovarati 90 jedinica:

Moda u statistici

medijana (statistika)

medijana (statistika), u matematičkoj statistici, broj koji karakteriše uzorak (na primjer, skup brojeva). Ako su svi elementi uzorka različiti, tada je medijan broj uzorka tako da je točno polovina elemenata uzorka veća od njega, a druga polovica manja od njega.

U više opšti slučaj Medijan se može naći tako da se elementi uzorka porede u rastućem ili opadajućem redosledu i uzme srednji element. Na primjer, uzorak (11, 9, 3, 5, 5) nakon poretka pretvara se u (3, 5, 5, 9, 11) i njegova medijana je broj 5. Ako uzorak ima paran broj elemenata, medijan ne može biti jednoznačno određen: za numeričke podatke najčešće se koristi poluzbroj dviju susjednih vrijednosti (odnosno, medijan skupa (1, 3, 5, 7) uzima se jednakim 4).

Drugim riječima, medijan u statistici je vrijednost koja dijeli niz na pola na način da na obje njegove strane (dolje ili gore) postoji isti broj jedinica u datoj populaciji. Zbog ovog svojstva, ovaj indikator ima nekoliko drugih naziva: 50. percentil ili 0,5 kvantil.

Medijan se koristi umjesto aritmetičke sredine kada se ekstremne opcije rangiranog niza (najmanji i najveći) u usporedbi s ostalima pokažu pretjerano velikim ili pretjerano malim.

Funkcija MEDIAN mjeri centralnu tendenciju, koja je centar skupa brojeva u statistička distribucija. Postoje tri najčešća načina za određivanje centralne tendencije:

  • Prosječna vrijednost- aritmetička sredina, koja se izračunava dodavanjem skupa brojeva, a zatim dijeljenjem rezultirajućeg zbroja njihovim brojem.
    Na primjer, prosjek brojeva 2, 3, 3, 5, 7 i 10 je 5, što je rezultat dijeljenja njihovog zbira 30 sa zbirom 6.
  • Medijan- broj koji je sredina skupa brojeva: polovina brojeva ima vrijednosti veće od medijane, a polovina brojeva ima manje vrijednosti.
    Na primjer, medijan za brojeve 2, 3, 3, 5, 7 i 10 je 4.
  • Moda- broj koji se najčešće nalazi u datom skupu brojeva.

    Na primjer, režim za brojeve 2, 3, 3, 5, 7 i 10 je 3.

Aritmetička sredina (u daljem tekstu prosek) je možda najpopularniji statistički parametar. Ovaj koncept se koristi svuda – počevši od izreke “ prosječna temperatura u bolnici“ i završava se ozbiljnim naučnim radovima. Međutim, koliko je čudno, prosjek je lukav koncept koji često dovodi u zabludu umjesto da izoštrava prezentaciju i unosi jasnoću.

Ako govorimo o naučni rad, onda se statistička analiza podataka koristi u gotovo svim primijenjenim naukama, pa i u humanističkim (na primjer, psihologija). Prosječna vrijednost se izračunava za karakteristike mjerene na takozvanim kontinuiranim skalama. Takvi znakovi su, na primjer, koncentracije tvari u krvnom serumu, visina, težina, starost. Aritmetička sredina se može lako izračunati i uči se u srednjoj školi. Međutim (u skladu sa odredbama matematičke statistike), prosječna vrijednost je adekvatna mjera centralne tendencije u uzorku samo u slučaju normalne (Gausove) raspodjele karakteristike (slika 1). Rice. 1. Normalna (Gausova) raspodjela karakteristike u uzorku. Srednja vrijednost (M) i medijana (Me) su isti

Ako distribucija odstupa od normalnog zakona, pogrešno je koristiti prosječnu vrijednost, jer je preosjetljiv parametar na takozvane „izbacivanje“ – nekarakteristično za uzorak koji se proučava, vrijednost koja je prevelika ili premala (Sl. 2). U ovom slučaju, drugi parametar, medijan, treba koristiti za karakterizaciju centralne tendencije u uzorku. Medijan je vrijednost karakteristike desno i lijevo od kojih se nalazi jednak broj opažanja (po 50%). Ovaj parametar (za razliku od prosječne vrijednosti) je otporan na odstupanja. Imajte na umu da se medijana također može koristiti u slučaju normalna distribucija- u ovom slučaju medijana se poklapa sa srednjom vrijednošću.

Rice. 2. Distribucija karakteristike u uzorku je drugačija od normalne. Srednja vrijednost (m) i medijana (ME) nisu isti

Da bi se utvrdilo da li je distribucija neke karakteristike u uzorku normalna (Gausova) ili ne, odnosno da bi se saznalo koji parametar treba koristiti (srednja vrednost ili medijan), postoje posebni statistički testovi.

Dajemo primjer. Stopa sedimentacije eritrocita u grupi pacijenata sa nedavnom upalom pluća je 3, 5, 5, 7, 11, 12, 16, 16, 21, 42, 58. Srednja vrijednost za ovaj uzorak je 17,8, medijana 12. Distribucija (prema Shapiro-Wilkovom testu) nije normalno (slika 3), pa se mora koristiti medijana. Rice. 3. Primjer

Čudno je da u nekim oblastima ekonomije spoljni posmatrač ne može da primeti nikakav trag ispravne primene matematičke statistike. Dakle, stalno nam govore o prosječnoj plati (na primjer, u istraživačkim institutima), a ovi brojevi obično iznenađuju ne samo obične zaposlenike, već i šefove odjela (koji se sada nazivaju „srednji menadžeri“). Iznenađeni smo što je prosječna plata u Moskvi 40 hiljada rubalja, ali, naravno, razumijemo da smo „prosječeni“ sa oligarsima. Evo primjera iz života naučnika: plate zaposlenih u laboratoriji (hiljadu rubalja) - 3, 5, 5, 7, 11, 12, 16, 16, 21, 42, 58. Prosječna vrijednost je 17,8, medijana je 12. Složite se da su to različiti brojevi!

Naravno, ne može se isključiti da je prećutkivanje o svojstvima prosjeka neiskreno, jer je menadžmentu uvijek isplativije prikazati situaciju sa platama zaposlenih boljom nego što je zapravo.

Nije li vrijeme da naučna zajednica pozove naše lidere da prestanu da pogrešno koriste matematičku statistiku?

Olga Rebrova,
doc. med. nauke, potpredsjednik
MOO "Društvo specijalista medicine zasnovane na dokazima"

Za izračunavanje medijane u MS EXCEL-u postoji posebna funkcija MEDIAN(). U ovom članku ćemo definirati medijan i naučiti kako ga izračunati za uzorak i za dati zakon raspodjele slučajna varijabla.

Počnimo sa medijane Za uzorci(tj. za fiksni skup vrijednosti).

Medijan uzorka

Medijan(medijana) je broj koji je sredina skupa brojeva: polovina brojeva u skupu je veća od medijana, a polovina brojeva je manja od medijana.

Da izračunam medijane prvo neophodno (vrijednosti u uzorak). na primjer, medijana za uzorak (2; 3; 3; 4 ; 5; 7; 10) biće 4. Jer upravo ušao uzorak 7 vrijednosti, tri od njih su manje od 4 (tj. 2; 3; 3), a tri su veće (tj. 5; 7; 10).

Ako skup sadrži paran broj brojeva, onda se izračunava za dva broja u sredini skupa. na primjer, medijana za uzorak (2; 3; 3 ; 6 ; 7; 10) biće 4,5, jer (3+6)/2=4,5.

Odrediti medijane u MS EXCEL-u postoji funkcija istog imena MEDIAN(), engleska verzija MEDIAN().

Medijan ne poklapa se nužno sa . Podudaranje se događa samo ako su vrijednosti u uzorku raspoređene simetrično u odnosu na prosjek. Na primjer, za uzorci (1; 2; 3 ; 4 ; 5; 6) medijana I prosjek jednako 3,5.

Ako je poznato Funkcija distribucije F(x) ili funkcija gustoće vjerovatnoće str(X), To medijana može se naći iz jednačine:

Na primjer, analitički riješivši ovu jednačinu za Lognormalnu distribuciju lnN(μ; σ 2), dobijamo da medijana izračunato pomoću formule =EXP(μ). Kada je μ=0, medijan je 1.

Obratite pažnju na stvar Funkcije distribucije, za koje F(x)=0,5(vidi sliku iznad) . Apscisa ove tačke je jednaka 1. Ovo je vrijednost medijane, koja se prirodno poklapa s prethodno izračunatom vrijednošću pomoću em formule.

U MS EXCEL-u medijana Za lognormalna distribucija LnN(0;1) se može izračunati pomoću formule =LOGNORM.REV(0.5,0,1).

Napomena: Podsjetimo da je integral od u cijelom domenu specificiranja slučajne varijable jednak je jedan.

Stoga, srednja linija (x=Medijan) dijeli područje ispod grafika funkcija gustoće vjerovatnoće na dva jednaka dela.





greška: Sadržaj zaštićen!!