Ce înseamnă mediană. Mod și formula mediană în statistică

Median Eu ei numesc o astfel de valoare a caracteristicii care se încadrează la mijlocul seriei clasate și o împarte în două părți egale ca număr de unități. Astfel, în seria de distribuție clasată, o jumătate a seriei are valori caracteristice care depășesc mediana, în timp ce cealaltă jumătate are valori mai mici decât mediana.

Mediana este folosită în locul mediei aritmetice atunci când variantele extreme ale seriei clasate (cel mai mic și cel mai mare) în comparație cu restul se dovedesc a fi excesiv de mari sau excesiv de mici.

ÎN discretîntr-o serie variațională care conține un număr impar de unități, mediana este egală cu varianta caracteristică cu numărul:
,
unde N este numărul de unități de populație.
Într-o serie discretă constând dintr-un număr par de unități de populație, mediana este definită ca media opțiunilor cu numere și:
.
În distribuția lucrătorilor după vechimea în muncă, mediana este egală cu media opțiunilor care au numerele 10: 2 = 5 și 10: 2 + 1 = 6 în seria clasată. Opțiunile pentru a cincea și a șasea caracteristică sunt 4 ani, deci
al anului
Când se calculează mediana în interval primul rând găsi intervalul median, (adică care conține mediana), pentru care sunt utilizate frecvențele sau frecvențele acumulate. Mediana este intervalul a cărui frecvență cumulată este egală sau mai mare decât jumătate din populația totală. Valoarea mediană este apoi calculată folosind formula:
,
unde este limita inferioară a intervalului median;
este lățimea intervalului median;
este frecvența cumulativă a intervalului care precede mediana;
este frecvența intervalului median.
Să calculăm mediana seriei de distribuție a lucrătorilor în funcție de salariu (vezi prelegerea „Rezumatul și gruparea datelor statistice”).
Mediana este intervalul salariile 800-900 UAH, deoarece frecvența sa cumulativă este 17, ceea ce reprezintă mai mult de jumătate din suma tuturor frecvențelor (). Apoi
Eu=800+100 UAH.
Valoarea obținută indică faptul că jumătate dintre lucrători au salarii sub 875 UAH, dar aceasta este mai mare decât dimensiunea medie.
Pentru a determina mediana, puteți utiliza frecvențe cumulate în loc de frecvențe cumulate.
Mediana, ca și modul, nu depinde de valorile extreme ale variantei, prin urmare este folosită și pentru a caracteriza centrul în serii de distribuție cu limite nedefinite.
proprietate mediană : suma valorilor absolute ale abaterilor variantei de la mediană este mai mică decât de la orice altă valoare (inclusiv media aritmetică):

Această proprietate a medianei este utilizată în transport la proiectarea amplasării stațiilor de tramvai și troleibuz, benzinării, punctelor de adunare etc.
Exemplu. Există 10 garaje pe o autostradă de 100 km lungime. Pentru proiectarea construcției unei benzinării, s-au colectat date privind numărul de călătorii așteptate la benzinărie pentru fiecare garaj.
Tabelul 2 - Date privind numărul de călătorii la benzinării pentru fiecare garaj.

Este necesar să puneți o benzinărie, astfel încât kilometrajul total al mașinilor pentru realimentare să fie cel mai mic.
Opțiunea 1. Dacă benzinăria este plasată în mijlocul autostrăzii, adică la kilometrul 50 (centrul intervalului de schimbare a semnului), atunci cursele, ținând cont de numărul de călăreți, vor fi:
a) într-o singură direcție:
;
b) în sens invers:
;
c) kilometraj total pe ambele sensuri: .

Opțiunea 2. Dacă benzinăria este plasată pe secțiunea medie a autostrăzii, determinată de formula mediei aritmetice, ținând cont de numărul de călăreți:

Mediana poate fi determinată grafic, prin cumul (vezi prelegerea „Rezumatul și gruparea datelor statistice”). Pentru a face acest lucru, ultima ordonată, egală cu suma tuturor frecvențelor sau frecvențelor, este împărțită la jumătate. Din punctul obținut, perpendiculara este restabilită la intersecția cu cumulul. Abscisa punctului de intersecție dă valoarea medianei.

Alături de valorile medii, mediile structurale sunt calculate ca caracteristici statistice ale seriei de distribuție variațională - ModăȘi median.
Modă(Mo) reprezintă valoarea trăsăturii studiate, repetată cu cea mai mare frecvență, i.e. modul este valoarea caracteristicii care apare cel mai des.
Median(Me) este valoarea caracteristicii care se încadrează în mijlocul populației clasate (ordonate), adică mediană - valoarea centrală a seriei de variații.
Proprietatea principală a mediei este că suma abaterilor absolute ale valorilor atributelor de la mediană este mai mică decât de la orice altă valoare ∑|x i - Me|=min.

Determinarea modului și a mediei din datele negrupate

Considera determinarea modului și a mediei din datele negrupate. Să presupunem că echipajele de muncă, formate din 9 persoane, au următoarele categorii salariale: 4 3 4 5 3 3 6 2 6 . Deoarece această echipă are cei mai mulți lucrători din categoria a 3-a, această categorie tarifară va fi modală. Mo = 3.
Pentru a determina mediana, este necesar să se claseze: 2 3 3 3 4 4 5 6 6 . Central în această serie este lucrătorul din categoria a 4-a, prin urmare, această categorie va fi mediana. Dacă seria clasată include un număr par de unități, atunci mediana este definită ca media celor două valori centrale.
Dacă modul reflectă cea mai comună variantă a valorii atributului, atunci mediana îndeplinește practic funcțiile unei medii pentru o populație eterogenă care nu respectă legea normală de distribuție. Să ilustrăm semnificația sa cognitivă cu următorul exemplu.
Să presupunem că trebuie să caracterizăm venitul mediu al unui grup de oameni numărând 100 de persoane, dintre care 99 au venituri în intervalul de la 100 la 200 USD pe lună, iar venitul lunar al acestora din urmă este de 50.000 USD (Tabelul 1).
Tabelul 1 - Veniturile lunare ale grupului de persoane studiat. Dacă folosim media aritmetică, obținem un venit mediu de aproximativ 600 - 700 de dolari, care are puține în comun cu venitul părții principale a grupului. Mediana, în acest caz egală cu Me = 163 de dolari, ne va permite să oferim o descriere obiectivă a nivelului veniturilor a 99% din acest grup de persoane.
Luați în considerare definiția modului și a mediei prin date grupate (serie de distribuție).
Să presupunem că distribuția lucrătorilor întregii întreprinderi în ansamblu conform categoriei tarifare are următoarea formă (Tabelul 2).
Tabelul 2 - Repartizarea lucrătorilor întreprinderii în funcție de categoria tarifară

Calculul modului și al medianei pentru o serie discretă

Calculul modului și al mediei pentru o serie de intervale

Calculul modului și al mediei pentru o serie de variații

Determinarea modului dintr-o serie de variații discrete

Se utilizează seria de valori ale caracteristicilor construite mai devreme, sortate după valoare. Dacă dimensiunea eșantionului este impară, luați valoarea centrală; dacă dimensiunea eșantionului este pară, luăm media aritmetică a celor două valori centrale.
Determinarea modului dintr-o serie de variații discrete: categoria a 5-a tarifară are cea mai mare frecvență (60 persoane), prin urmare, este modală. Mo = 5.
Pentru a determina valoarea mediană a atributului, numărul unității mediane a seriei (N Me) se găsește folosind următoarea formulă: , unde n este volumul populației.
În cazul nostru: .
Valoarea fracțională rezultată, care apare întotdeauna cu un număr par de unități de populație, indică faptul că mijlocul exact este între 95 și 96 de lucrători. Este necesar să se determine din ce grup aparțin lucrătorii cu aceste numere de serie. Acest lucru se poate face calculând frecvențele acumulate. Nu există lucrători cu aceste cifre în prima grupă, unde sunt doar 12 persoane, și nu sunt în a doua grupă (12+48=60). Lucrătorii al 95-lea și al 96-lea se află în grupa a treia (12+48+56=116), prin urmare, a 4-a categorie salarială este mediana.

Calculul modului și al mediei într-o serie de intervale

Spre deosebire de seriile variaționale discrete, determinarea modului și a mediei din seria de interval necesită anumite calcule bazate pe următoarele formule:
, (5.6)
Unde x0- limita inferioară a intervalului modal (intervalul cu cea mai mare frecvență se numește modal);
i este valoarea intervalului modal;
fMo este frecvența intervalului modal;
f Mo-1 este frecvența intervalului care precedă modalul;
f Mo +1 este frecvența intervalului care urmează modalului.
(5.7)
Unde x0– limita inferioară a intervalului median (mediana este primul interval, a cărui frecvență acumulată depășește jumătate din suma totală de frecvențe);
i este valoarea intervalului median;
S Me-1- intervalul acumulat precedând mediana;
f Eu este frecvența intervalului median.
Ilustram aplicarea acestor formule folosind datele din tabel. 3.
Intervalul cu limitele 60 - 80 în această distribuție va fi modal, deoarece are cea mai mare frecvență. Folosind formula (5.6), determinăm modul:

Pentru a stabili intervalul median, este necesar să se determine frecvența acumulată a fiecărui interval ulterior până când aceasta depășește jumătate din suma frecvențelor acumulate (în cazul nostru, 50%) (Tabelul 5.11).
S-a constatat că mediana este intervalul cu limitele de 100 - 120 de mii de ruble. Acum definim mediana:

Tabelul 3 - Distribuția populației Federației Ruse după nivelul venitului nominal mediu pe cap de locuitor în martie 1994
Grupuri după nivelul venitului mediu lunar pe cap de locuitor, mii de rublePonderea populației, %
până la 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Peste 3007,7
Total100,0

Tabelul 4 - Definiția intervalului median
Astfel, media aritmetică, modul și mediana pot fi utilizate ca o caracteristică generalizată a valorilor unui anumit atribut pentru unitățile unei populații clasate.
Principala caracteristică a centrului de distribuție este media aritmetică, care se caracterizează prin faptul că toate abaterile de la acesta (pozitive și negative) se adună la zero. Este tipic pentru mediană ca suma abaterilor de la aceasta în modul este minimă, iar modul este valoarea caracteristicii care apare cel mai des.
Raportul dintre mod, mediană și medie aritmetică indică natura distribuției trăsăturii în agregat, ne permite să evaluăm asimetria acesteia. În distribuțiile simetrice, toate cele trei caracteristici sunt aceleași. Cu cât discrepanța dintre mod și media aritmetică este mai mare, cu atât seria este mai asimetrică. Pentru seriile moderat deformate, diferența dintre mod și media aritmetică este de aproximativ trei ori diferența dintre mediană și medie, adică:
|Mo–`x| = 3 |Me –`x|.

Determinarea modului și a mediei printr-o metodă grafică

Modul și mediana într-o serie de intervale pot fi determinate grafic. Modul este determinat din histograma distribuției. Pentru a face acest lucru, este selectat cel mai înalt dreptunghi, care în acest caz este modal. Apoi conectăm vârful drept al dreptunghiului modal cu colțul din dreapta sus al dreptunghiului anterior. Iar vârful din stânga dreptunghiului modal este cu colțul din stânga sus al dreptunghiului următor. Din punctul de intersecție a acestora, coborâm perpendiculara pe axa absciselor. Abscisa punctului de intersecție al acestor drepte va fi modul de distribuție (Fig. 5.3).


Orez. 5.3. Definiție grafică a modei prin histogramă.


Orez. 5.4. Determinarea grafică a mediei prin cumulat
Pentru a determina mediana dintr-un punct de pe scara frecvențelor acumulate (frecvențe) corespunzătoare la 50%, se trasează o linie dreaptă paralelă cu axa absciselor până la intersecția cu cumulul. Apoi, din punctul de intersecție, o perpendiculară este coborâtă pe axa absciselor. Abscisa punctului de intersecție este mediana.

Quartile, Decile, Percentile

În mod similar, găsind mediana în seria variațională de distribuție, puteți găsi valoarea unei caracteristici pentru orice unitate a seriei clasate în ordine. Deci, de exemplu, puteți găsi valoarea unei caracteristici în unități care împart seria în patru părți egale, în 10 sau 100 de părți. Aceste valori sunt numite „cuartile”, „decile”, „percentile”.
Quartilele sunt valoarea unei caracteristici care împarte populația în 4 părți egale.
Există o cuartilă inferioară (Q 1), care separă ¼ din populația cu cele mai mici valori ale atributului și o cuartilă superioară (Q 3), tăind ¼ din populație cu cele mai mari valori semn. Aceasta înseamnă că 25% din unitățile populației vor fi mai mici de Q 1 ; 25% unități vor fi cuprinse între Q 1 și Q 2 ; 25% - între Q 2 și Q 3, iar restul de 25% sunt superioare Q 3. Quartila mijlocie a lui Q 2 este mediana.
Pentru a calcula quartilele după seria de variație a intervalului, se folosesc următoarele formule:
, ,
Unde x Q 1– limita inferioară a intervalului care conține quartila inferioară (intervalul este determinat de frecvența acumulată, prima depășind 25%);
x Q 3– limita inferioară a intervalului care conține quartila superioară (intervalul este determinat de frecvența acumulată, prima depășind 75%);
i– valoarea intervalului;
S Q 1-1 este frecvența cumulativă a intervalului care precede intervalul care conține quartila inferioară;
S Q 3-1 este frecvența cumulativă a intervalului care precede intervalul care conține quartila superioară;
f Q 1 este frecvența intervalului care conține quartila inferioară;
f Q 3 este frecvența intervalului care conține quartila superioară.
Luați în considerare calculul quartilelor inferioare și superioare conform tabelului. 5.10. Quartila inferioară se află în intervalul 60 - 80, a cărei frecvență cumulată este de 33,5%. Quartila superioară se află în intervalul 160 - 180 cu o frecvență acumulată de 75,8%. Având în vedere acest lucru, obținem:
,
.
În plus față de quartile, decilele pot fi determinate în rangurile de distribuție variațională - opțiuni care împart seria variațională clasificată în zece părți egale. Prima decilă (d 1) împarte populația 1/10 la 9/10, a doua decilă (d 1) 2/10 la 8/10 și așa mai departe.
Acestea sunt calculate după formulele:
, .
Valorile caracteristicilor care împart seria în o sută de părți se numesc percentile. Rapoartele medianei, quartilelor, decilelor și percentilelor sunt prezentate în Fig. 5.5.

Medii structurale (poziționale).- acestea sunt valori medii care ocupă un anumit loc (poziție) într-o serie variațională clasificată.

Modă(lu) este valoarea caracteristicii cel mai frecvent găsite în populația studiată.

Pentru serie de variații discrete modul va fi valoarea opțiunilor cu cea mai mare frecvență

Exemplu. Determinați modul din datele disponibile (Tabelul 7.5).

Tabel 7.5 - Distribuția pantofilor de damă vânduți într-un magazin de încălțăminte N, Februarie 2013

Conform Tabelului. 5 arată că cea mai mare frecvență fmax= 28, corespunde valorii caracteristicii X= 37 dimensiune. Prin urmare, lu= 37 mărime de pantofi, adică această mărime de pantofi a fost cea mai solicitată, cel mai des cumpărau pantofi de mărimea a 37-a.

ÎN mai întâi determinat spațierea modală, adică care conține modul - intervalul cu cea mai mare frecvență (în cazul distribuție pe intervale Cu la intervale egale, în cazul intervalelor inegale - prin cea mai mare densitate).

Modul este considerat aproximativ mijlocul intervalului modal. Valoarea modului specific pentru seria de intervale este determinată de formula:

Unde x Mo este limita inferioară a intervalului modal;

i Mo este valoarea intervalului modal;

fMo este frecvența intervalului modal;

f Mo-1 este frecvența intervalului care precedă modalul;

f Mo +1 este frecvența intervalului care urmează modalului.

Exemplu. Determinați modul din datele disponibile (Tabelul 7.6).

Tabel 7.6 - Distribuția salariaților pe vechime

Conform Tabelului. 6 arată că cea mai mare frecvență fmax= 35, corespunde intervalului: 6-8 ani (interval modal). Definim moda prin formula:

ani.

Prin urmare, lu= 6,8 ani, adică Majoritatea angajaților au 6,8 ani de experiență.

Denumirea medianei este luată din geometrie, unde se referă la un segment care leagă unul dintre vârfurile triunghiului cu punctul de mijloc al laturii opuse și împarte astfel latura triunghiului în două părți egale.

Median(Pe mine) este valoarea trăsăturii care se încadrează în mijlocul populației de la distanță. În caz contrar, mediana este o valoare care împarte numărul unei serii variaționale ordonate în două părți egale - o parte are valorile atributului variabil mai mici decât varianta medie, iar cealaltă are valori mari.

Pentru serii clasate(adică ordonat - construit în ordine crescătoare sau descrescătoare a valorilor atributelor individuale) cu un număr impar de membri ( n= impar) mediana este varianta situată în centrul rândului. Numărul ordinal al mediei ( N Eu) este definită după cum urmează:

N Me =(n+1)/ 2.

Exemplu.Într-o serie de 51 de membri, numărul median este (51+1)/2 = 26, i.e. mediana este a 26-a opțiune din serie.

Pentru o serie clasată cu un număr par de membri ( n= par) - mediana va fi media aritmetică a celor două valori ale atributului situat în mijlocul rândului. Numerele de serie ale celor două variante centrale sunt determinate după cum urmează:

N Me 1 =n/ 2; N Me 2 =(n/ 2)+ 1.

Exemplu. Când n=50; N Me1 = 50/2 = 25; N Me2= (50/2)+1 = 26, adică mediana este media opțiunilor din rândurile 25 și 26 în ordine.

ÎN serie de variații discrete mediana se găsește după frecvența acumulată corespunzătoare numărului ordinal al medianei sau depășirea acesteia pentru prima dată. În caz contrar, în funcție de frecvența acumulată egală sau depășind pentru prima dată jumătate din suma tuturor frecvențelor seriei.

Exemplu. Determinați mediana din datele disponibile (Tabelul 7.7).

Tabel 7.7 - Distribuția pantofilor de damă vânduți într-un magazin de încălțăminte N, Februarie 2013

Conform Tabelului. 7 definiți numărul ordinal al mediei: N Eu =( 67+1)/2=34.

Modă. Median. Cum să le calculezi (pag. 1 din 2)

Frecvența cumulată care depășește această valoare pentru prima dată S= 41, corespunde valorii caracteristicii X= 37 dimensiune. Prin urmare, Pe mine= 37 mărime de pantofi, adică jumătate dintre perechi sunt cumpărate mai mici decât mărimea 37, iar cealaltă jumătate sunt cumpărate mai mari.

În acest exemplu, modul și mediana sunt aceleași, dar pot fi sau nu aceleași.

ÎN serie de variații de interval se determină frecvențele cumulate, în funcție de frecvențele cumulate se găsesc date intervalul median– intervalul în care frecvența acumulată este jumătate sau pentru prima dată depășește jumătate din suma totală a frecvențelor. Formula pentru determinarea medianei în seria de intervale a distribuției este următoarea:

.

Unde x Eu este limita inferioară a intervalului median;

eu mie este valoarea intervalului median;

fi este suma frecvențelor seriei;

S Me-1 este suma frecvențelor acumulate ale intervalului care precede mediana;

f Eu este frecvența intervalului median.

Exemplu. Determinați mediana din datele disponibile (Tabelul 7.8).

Tabel 7.8 - Distribuția salariaților pe vechime

Conform Tabelului. 8 definiți numărul ordinal al mediei: NMe=100/2=50. Frecvența cumulată care depășește această valoare pentru prima dată S= 82, corespunde unui interval de 6-8 ani (interval median). În acest exemplu, intervalele modale și mediane sunt aceleași, dar pot fi sau nu aceleași. Să determinăm mediana prin formula:

ani

Prin urmare, Pe mine= 6,2 ani, adică jumătate dintre angajați au mai puțin de 6,2 ani de experiență, iar cealaltă jumătate au mai mult.

Găsirea modului și a mediei aplicare largăîn diferite domenii ale economiei. Astfel, se calculează productivitatea modală a muncii, costul modal etc. permite economistului să judece cele predominante acest moment nivelul lor. Această caracteristică ar trebui folosită pentru a dezvălui rezervele economiei noastre. Moda contează pentru rezolvarea problemelor practice. Deci, atunci când planificați producția în masă de îmbrăcăminte și încălțăminte, este stabilită dimensiunea produsului, care este cea mai solicitată (dimensiunea modală). Modul poate fi folosit ca o caracteristică aproximativă a nivelului trăsăturii studiate în locul mediei aritmetice dacă distribuțiile de frecvență sunt aproape simetrice și au un vârf neplat.

Mediana trebuie utilizată ca medie în cazurile în care nu există suficientă încredere în omogenitatea populației studiate. Mediana este afectată nu atât de valorile în sine, cât de numărul de cazuri la un nivel sau altul. De asemenea, trebuie menționat că mediana este întotdeauna specifică (pentru un număr mare de observații sau în cazul unui număr impar de membri ai populației), deoarece sub Pe mine este implicat un element real real al populației, în timp ce media aritmetică capătă adesea o valoare pe care niciuna dintre unitățile populației nu o poate lua.

Proprietatea principală Pe mine prin aceea că suma abaterilor absolute ale valorilor trăsăturii de la mediană este mai mică decât de la orice altă valoare: . Această proprietate Pe mine poate fi folosit, de exemplu, la determinarea șantierului de construcție a clădirilor publice, deoarece Pe mine determină punctul care oferă cea mai mică distanță, să zicem, grădinițe de la locul de reședință al părinților, rezidenților localitate de la cinema, la proiectarea stațiilor de tramvai și troleibuz etc.

În sistemul indicatorilor structurali, opțiunile care ocupă un anumit loc în seria de variații clasificate (fiecare a patra, a cincea, a zecea, a douăzeci și cincia etc.) acționează ca indicatori ai caracteristicilor formei de distribuție. În mod similar, găsind mediana în seria variațională, puteți găsi valoarea caracteristicii pentru orice unitate a seriei clasate în ordine.

Quartiles– valorile atributelor care împart populația în patru părți egale. Distingeți quartila inferioară ( Î1), in medie ( Q2) și superior ( Î 3). Quartila inferioară separă 1/4 din populația cu cele mai mici valori ale caracteristicii, quartila superioară separă 1/4 din populația cu cele mai mari valori ale caracteristicii. Aceasta înseamnă că 25% din unitățile populației vor avea o valoare mai mică Î1; 25% unitati vor fi incheiate intre Î1Și Q2; 25% - între Q2Și Î 3; restul de 25% depășesc Î 3. Quartila mijlocie ( Q2) este mediana .

Pentru a calcula quartilele pentru seria de intervale, se folosesc următoarele formule:

;

.

Unde xQ1– limita inferioară a intervalului care conține quartila inferioară (intervalul este determinat de frecvența acumulată, prima depășind 25%);

x Q3– limita inferioară a intervalului care conține quartila superioară (intervalul este determinat de frecvența acumulată, prima depășind 75%);

S Q 1-1 este frecvența cumulativă a intervalului care precede intervalul care conține quartila inferioară;

S Q 3-1 este frecvența cumulativă a intervalului care precede intervalul care conține quartila superioară;

fQ1 este frecvența intervalului care conține quartila inferioară;

fQ3 este frecvența intervalului care conține quartila superioară.

Decile sunt valori variante care împart seria clasată în zece părți egale: prima decilă ( d1) împarte populația 1/10 la 9/10, a 2-a decilă ( d2) - în raport de 2/10 la 8/10 etc. Decilele sunt calculate în același mod ca mediana și quartilele:

;

.

Utilizarea caracteristicilor de mai sus în analiza seriilor de distribuție variațională permite caracterizarea profundă și detaliată a populației studiate.

VEZI MAI MULT:

Medii structurale

Alături de mediile legii puterii, mediile structurale sunt utilizate pe scară largă.

Structura agregatelor statistice este diferită. În același timp, cu cât distribuția unităților populației este mai simetrică, cu atât mai calitativ compoziția acesteia în funcție de trăsătura studiată, cu atât mai bine, mai fiabil valoarea medie a trăsăturii caracterizează fenomenul studiat. Dar pentru cazurile de asimetrie (asimetrie) accentuată a seriei de distribuție, media aritmetică nu mai este atât de tipică. De exemplu, mărimea medie a unui depozit la băncile de economii nu prezintă un interes deosebit, deoarece cea mai mare parte a depozitelor este sub acest nivel, iar media este influențată semnificativ de depozitele mari, care sunt puține și care nu sunt tipice pentru masa de depozite.

Moda (statistici)

În astfel de cazuri, statistica folosește un alt sistem - sistemul de medii structurale auxiliare. Acestea includ modul, mediana, precum și quartels, quintels, decels, percentel.

Moda (lună)- cea mai comună valoare a trăsăturii, iar într-o serie variațională discretă - aceasta este varianta cu cea mai mare frecvență.

În practica statistică, moda este folosită în studiul veniturilor populației, cererii consumatorilor, înregistrarea prețurilor și în analiza unor indicatori tehnici și economici ai întreprinderilor.

În unele cazuri, modul este cel care interesează, și nu media aritmetică. Uneori este folosit în locul mediei aritmetice, de exemplu, pentru a caracteriza structura seriei de distribuție.

Ordinea în care este determinat modul depinde de tipul seriei de distribuție. Dacă atributul variabil este prezentat ca o serie discretă, atunci nu sunt necesare calcule pentru a determina modul. Într-o astfel de serie, modul va fi valoarea caracteristicii care are cea mai mare frecvență.

Dacă valoarea atributului este prezentată ca o serie de variații de interval cu intervale egale, atunci modul este determinat prin calcul folosind formula:

Unde X lu este limita inferioară a intervalului modal,

i lu este valoarea intervalului modal,

f lu , f Lu-1 , f Lu+1 sunt frecvențele intervalelor modal, premodal (anterior) și, respectiv, postmodal (în urma modalului).

Mediană (eu)- aceasta este valoarea atributului, care se află la mijlocul seriei de variații variate, unde valorile individuale ale atributului (opțiuni) sunt aranjate în ordine crescătoare sau descrescătoare (după rang).

Mediana trebuie utilizată ca medie în cazurile în care nu există suficientă încredere în omogenitatea populației studiate. Mediana își găsește aplicație în activitățile de marketing. De exemplu, amplasarea lifturilor, cramelor primare, fabricilor de conserve, suma distanțelor până la care de la furnizorii de materii prime ar trebui să fie cea mai mică.

Mediana, ca și modul, este definită în moduri diferite. Depinde de structura seriei de distribuție.
Pentru a determina mediana în serii variaționale discrete:

1) găsiți numărul de serie după formula

N Me =
2) construiți o serie de frecvențe acumulate

3) găsiți frecvența acumulată, care este egală cu sau depășește numărul de serie al mediei

4) a variantei corespunzătoare frecvenței acumulate date este mediana.

Dacă numărul de membri ai unei serii discrete este impar, atunci mediana se află la mijlocul seriei și împarte această serie în două părți egale în funcție de numărul de membri ai seriei. Numărul ordinal al mediei în acest caz este calculat prin formula:

NMe =(f + 1)2,

Unde f numărul de membri ai seriei.

În seria de intervale, intervalul median este mai întâi determinat. Pentru aceasta, la fel ca în rânduri discrete, calculați numărul ordinal al mediei . Frecvența acumulată, care este egală cu numărul medianei sau prima o depășește, corespunde intervalului median din seria de variație a intervalului. Să notăm această frecvență acumulată ca S Me . Mediana se calculează direct folosind formula:

,
unde este limita inferioară a intervalului median

- valoarea intervalului median

este frecvența cumulativă a intervalului care precede mediana

— frecvența intervalului median

Definiția grafică a modului și a mediei
Modul și mediana într-o serie de intervale pot fi determinate grafic.

Modul este determinat din histograma distribuției. Pentru a face acest lucru, este selectat cel mai înalt dreptunghi, care în acest caz este modal. Apoi conectăm vârful drept al dreptunghiului modal cu colțul din dreapta sus al dreptunghiului anterior. Iar vârful din stânga dreptunghiului modal este cu colțul din stânga sus al dreptunghiului următor. În plus, din punctul de intersecție, o perpendiculară este coborâtă pe axa absciselor. Abscisa punctului de intersecție al acestor drepte va fi modul de distribuție (Fig. 1). Mediana se calculează din cumulat (Fig. 2). Pentru determinarea acestuia, dintr-un punct de pe scara frecvențelor (frecvențe) acumulate corespunzător la 50%, se trasează o dreaptă paralelă cu axa absciselor până se intersectează cu cumulul. Apoi, din punctul de intersecție al dreptei specificate cu cumulul, o perpendiculară este coborâtă pe axa absciselor. Abscisa punctului de intersecție este mediana.

Indicatori de variație în statistici.

În procesul de analiză statistică, poate apărea o situație când valorile valorilor medii coincid, iar populațiile pe baza cărora sunt calculate constau din unități ale căror valori caracteristice diferă destul de mult una de cealaltă. În acest caz, se calculează indicatorii de variație.

Catalog: descărcări -> Sotrudniki
descărcări -> N. L. Ivanova M. F. Lukanina
descărcări -> Prelegere pentru preșcolari și părinți „Prevenirea comportamentului agresiv la preșcolari”
descărcări -> Adaptarea psihologică profesională a personalității
descărcări -> Departamentul de Educație și Știință al Regiunii Kemerovo Centrul Psihologic și Valeologic Regional Kemerovo
descărcări -> serviciu federal Administrația de control al drogurilor din Federația Rusă pentru regiunea Kemerovo
Sotrudniki -> Arca Republicii Ciuvaș
descărcări -> Caracteristici de sprijin psihologic și pedagogic pentru dezvoltarea copiilor preșcolari
descărcări -> Mishina M. M. Dezvoltarea gândirii în funcție de implicarea în relațiile de familie și clan
Sotrudniki -> Formarea calităților semnificative din punct de vedere profesional la elevii cu dizabilități intelectuale de profesie

TEST

Pe subiect: "Mod. Median. Metode de calcul al acestora"

Introducere

Valorile medii și indicatorii aferenti de variație joacă un rol foarte important în statistică, care se datorează subiectului studiului acesteia. Prin urmare, acest subiect este unul dintre cele centrale ale cursului.

Media este un indicator de generalizare foarte comun în statistici. Acest lucru se explică prin faptul că numai cu ajutorul mediei este posibilă caracterizarea populației după un atribut variabil cantitativ. O valoare medie în statistică este o caracteristică generalizantă a unui set de fenomene de același tip în funcție de un atribut care variază cantitativ. Media arată nivelul acestui atribut, raportat la unitatea populației.

Studiind fenomenele sociale și căutând să identifice trăsăturile lor caracteristice, tipice în condiții specifice de loc și timp, statisticienii folosesc pe scară largă valorile medii. Cu ajutorul mediilor, diferite populații pot fi comparate între ele în funcție de caracteristici diferite.

Mediile utilizate în statistici aparțin clasei mediilor de putere. Dintre mediile puterii, se folosește cel mai des media aritmetică, mai rar media armonică; media armonică este utilizată numai la calcularea ratelor medii ale dinamicii, iar pătratul mediu - numai la calcularea indicatorilor de variație.

Media aritmetică este câtul de împărțire a sumei opțiunilor la numărul lor. Este utilizat în cazurile în care volumul unui atribut variabil pentru întreaga populație este format ca suma valorilor atributelor pentru unitățile sale individuale. Media aritmetică este cel mai comun tip de medie, deoarece corespunde naturii fenomenelor sociale, unde volumul semnelor variabile în agregat este cel mai adesea format exact ca suma valorilor atributului în unități individuale de populatia.

Conform proprietății sale definitorii, media armonică ar trebui utilizată atunci când volumul total al atributului este format ca suma valorilor reciproce ale variantei. Se folosește atunci când, în funcție de materialul disponibil, greutățile nu trebuie înmulțite, ci împărțite în opțiuni sau, ceea ce este la fel, înmulțite cu valoarea lor inversă. Media armonică în aceste cazuri este reciproca mediei aritmetice a valorilor reciproce ale atributului.

Media armonică ar trebui utilizată în acele cazuri în care ponderile nu sunt unitățile populației - purtătorii caracteristicii, ci produsele acestor unități și valoarea caracteristicii.

1. Definiția modului și a mediei în statistici

Mijloacele aritmetice și armonice sunt caracteristicile generalizatoare ale populației în funcție de unul sau altul atribut variabil. Caracteristicile descriptive auxiliare ale distribuției unui atribut variabil sunt modul și mediana.

În statistică, moda este valoarea unei caracteristici (variante) care se găsește cel mai adesea într-o anumită populație. În seria de variații, aceasta va fi varianta cu cea mai mare frecvență.

Mediana în statistică se numește variantă, care se află la mijlocul seriei de variații. Mediana împarte seria în jumătate, de ambele părți ale acesteia (în sus și în jos) există același număr de unități de populație.

Modul și mediana, spre deosebire de mediile exponențiale, sunt caracteristici specifice, valoarea lor este orice variantă particulară din seria de variații.

Modul este utilizat în cazurile în care este necesar să se caracterizeze valoarea cea mai frecventă a unei caracteristici.

5.5 Mod și mediană. Calculul lor în serii variaționale discrete și interval

Dacă aveți nevoie, de exemplu, să aflați cea mai comună rată a salariului din întreprindere, prețul de piață la care a fost vândut cel mai mare număr mărfuri, mărimea încălțămintei cea mai solicitată de consumatori etc., în aceste cazuri recurg la modă.

Mediana este interesantă prin faptul că arată limita cantitativă a valorii caracteristicii variabile, care a fost atinsă de jumătate dintre membrii populației. Să fie salariul mediu al angajaților băncii să se ridice la 650.000 de ruble. pe luna. Această caracteristică poate fi completată dacă spunem că jumătate dintre muncitori au primit un salariu de 700.000 de ruble. și mai sus, adică să luăm mediana. Modul și mediana sunt caracteristici tipice în cazurile în care populațiile sunt omogene și mari ca număr.

Găsirea modului și a mediei într-o serie de variații discrete

Găsirea modului și a medianei într-o serie variațională, unde valorile atributelor sunt date de anumite numere, nu este foarte dificilă. Luați în considerare tabelul 1. cu distribuția familiilor după numărul de copii.

Tabelul 1. Distribuția familiilor după numărul de copii

Evident, în acest exemplu, moda va fi o familie cu doi copii, deoarece această valoare a opțiunilor corespunde celui mai mare număr de familii. Pot exista distribuții în care toate variantele sunt la fel de frecvente, caz în care nu există modă, sau, cu alte cuvinte, se poate spune că toate variantele sunt la fel de modale. În alte cazuri, nu una, ci două opțiuni pot fi cea mai mare frecvență. Apoi vor fi două moduri, distribuția va fi bimodală. Distribuțiile bimodale pot indica eterogenitatea calitativă a populației în funcție de trăsătura studiată.

Pentru a găsi mediana într-o serie de variații discrete, trebuie să împărțiți suma frecvențelor la jumătate și să adăugați ½ la rezultat. Deci, în repartizarea a 185 de familii după numărul de copii, mediana va fi: 185/2 + ½ = 93, i.e. A 93-a opțiune, care împarte rândul ordonat în jumătate. Care este sensul celei de-a 93-a opțiuni? Pentru a afla, trebuie să acumulați frecvențe, pornind de la cele mai mici opțiuni. Suma frecvențelor primei și celei de-a doua opțiuni este 40. Este clar că aici nu există 93 de opțiuni. Dacă adăugăm frecvența celei de-a 3-a opțiuni la 40, atunci obținem suma egală cu 40 + 75 = 115. Prin urmare, a 93-a opțiune corespunde celei de-a treia valori a atributului variabil, iar mediana va fi o familie cu doi copii. .

În acest exemplu, modul și mediana au coincis. Dacă am avut o sumă pară de frecvențe (de exemplu, 184), atunci aplicând formula de mai sus, obținem numărul de opțiuni mediane, 184/2 + ½ = 92,5. Deoarece nu există opțiuni fracționale, rezultatul indică faptul că mediana se află la mijloc între 92 și 93 de opțiuni.

3. Calculul modului și medianei în seria de variații de interval

Natura descriptivă a modului și a mediei se datorează faptului că nu compensează abaterile individuale. Întotdeauna corespund unei anumite variante. Prin urmare, modul și mediana nu necesită calcule pentru a le găsi dacă toate valorile atributului sunt cunoscute. Cu toate acestea, în seria de variații de interval, calculele sunt utilizate pentru a găsi valoarea aproximativă a modului și mediana într-un anumit interval.

Pentru a calcula o anumită valoare a valorii modale a unui semn închis într-un interval, se utilizează următoarea formulă:

M o \u003d X Mo + i Mo * (f Mo - f Mo-1) / ((f Mo - f Mo-1) + (f Mo - f Mo + 1)),

Unde X Mo este limita minimă a intervalului modal;

i Mo este valoarea intervalului modal;

fMo este frecvența intervalului modal;

f Mo-1 - frecvența intervalului premergător modalului;

f Mo+1 este frecvența intervalului care urmează modalului.

Vom arăta calculul modului folosind exemplul dat în tabelul 2.

Tabelul 2. Distribuția lucrătorilor întreprinderii în funcție de implementarea standardelor de producție

Pentru a găsi modul, determinăm mai întâi intervalul modal al seriei date. Din exemplu se poate observa că cea mai mare frecvență corespunde intervalului în care varianta se află în intervalul de la 100 la 105. Acesta este intervalul modal. Valoarea intervalului modal este 5.

Înlocuind valorile numerice din tabelul 2. în formula de mai sus, obținem:

L o \u003d 100 + 5 * (104 -12) / ((104 - 12) + (104 - 98)) \u003d 108,8

Sensul acestei formule este următorul: valoarea acelei părți a intervalului modal, care trebuie adăugată la limita minimă a acesteia, este determinată în funcție de mărimea frecvențelor intervalelor anterioare și următoare. În acest caz, adăugăm 8,8 la 100, adică mai mult de jumătate din interval, deoarece frecvența intervalului anterior este mai mică decât frecvența intervalului următor.

Să calculăm mediana acum. Pentru a găsi mediana în seria de variații de interval, determinăm mai întâi intervalul în care se află (intervalul median). Un astfel de interval va fi unul a cărui frecvență cumulată este egală sau mai mare decât jumătate din suma frecvențelor. Frecvențele cumulate se formează prin însumarea treptată a frecvențelor, începând de la intervalul de la cea mai mică valoare semn. Jumătate din suma frecvențelor pe care le avem este 250 (500:2). Prin urmare, conform tabelului 3. intervalul median va fi intervalul cu valoarea salariilor de la 350.000 de ruble. până la 400.000 de ruble.

Tabelul 3. Calculul medianei în seria de variații de interval

Înainte de acest interval, suma frecvențelor acumulate era 160. Prin urmare, pentru a obține valoarea medianei, este necesar să se adauge încă 90 de unități (250 - 160).

La determinarea valorii medianei, se presupune că valoarea unităților din limitele intervalului este distribuită uniform. Prin urmare, dacă 115 de unități din acest interval sunt distribuite uniform într-un interval egal cu 50, atunci 90 de unități vor corespunde următoarei valori:

Moda în statistică

Mediană (statistică)

Mediană (statistică), în statistica matematică, un număr care caracterizează un eșantion (de exemplu, un set de numere). Dacă toate elementele din eșantion sunt diferite, atunci mediana este numărul eșantionului, astfel încât exact jumătate dintre elementele din eșantion sunt mai mari decât acesta, iar cealaltă jumătate sunt mai mici decât acesta.

În mai mult caz general Mediana poate fi găsită prin aranjarea elementelor probei în ordine crescătoare sau descrescătoare și luând elementul din mijloc. De exemplu, eșantionul (11, 9, 3, 5, 5) după ordonare se transformă în (3, 5, 5, 9, 11) iar mediana sa este numărul 5. Dacă eșantionul are un număr par de elemente, mediana poate să nu fie determinată în mod unic: pentru datele numerice, se utilizează cel mai des jumătatea sumei a două valori adiacente (adică mediana setului (1, 3, 5, 7) este luată egală cu 4).

Cu alte cuvinte, mediana în statistică este valoarea care împarte seria la jumătate în așa fel încât de ambele părți ale acesteia (în sus sau în jos) să fie situat același număr de unități ale populației date. Din cauza acestei proprietăți, acest indicator are câteva alte denumiri: percentila 50 sau cuantila 0,5.

Mediana este folosită în locul mediei aritmetice atunci când variantele extreme ale seriei clasate (cel mai mic și cel mai mare) în comparație cu restul se dovedesc a fi excesiv de mari sau excesiv de mici.

Funcția MEDIAN măsoară tendința centrală, care este centrul unui set de numere în distributie statistica. Există trei modalități cele mai comune de a determina tendința centrală:

  • Valoarea medie- media aritmetică, care se calculează prin adăugarea unui set de numere, urmată de împărțirea sumei rezultate la numărul acestora.
    De exemplu, media numerelor 2, 3, 3, 5, 7 și 10 este 5, care este rezultatul împărțirii sumei lor, care este 30, la numărul lor, care este 6.
  • Median- un număr care este mijlocul unui set de numere: jumătate dintre numere au valori mai mari decât mediana, iar jumătate dintre numere sunt mai mici.
    De exemplu, mediana numerelor 2, 3, 3, 5, 7 și 10 este 4.
  • Modă este numărul care apare cel mai frecvent în setul dat de numere.

    De exemplu, modul pentru numerele 2, 3, 3, 5, 7 și 10 este 3.

Media aritmetică (denumită în continuare medie) este probabil cel mai popular parametru statistic. Acest concept este folosit peste tot - pornind de la zicala " temperatura medieîn spital „și terminând cu lucrări științifice serioase. Cu toate acestea, în mod ciudat, media este un concept complicat, adesea înșelător, în loc să ofere claritate și claritate.

Dacă vorbesc despre munca stiintifica, atunci analiza datelor statistice este folosită în aproape toate științele aplicate, chiar și în științe umaniste (de exemplu, psihologie). Valoarea medie este calculată pentru caracteristicile măsurate pe așa-numitele scale continue. Astfel de semne sunt, de exemplu, concentrația de substanțe în serul sanguin, înălțimea, greutatea, vârsta. Media aritmetică poate fi calculată cu ușurință și se predă în liceu. Totuși (în conformitate cu prevederile statisticii matematice), valoarea medie este o măsură adecvată a tendinței centrale în eșantion numai în cazul unei distribuții normale (gauss) a atributului (Fig. 1). Orez. 1. Distribuția normală (gaussiană) a unei caracteristici din eșantion. Media (M) și mediana (Me) sunt aceleași

În cazul unei abateri a distribuției de la legea normală, este incorect să se folosească valoarea medie, deoarece este prea sensibilă la așa-numitele „outliers” - necaracteristic pentru eșantionul studiat, prea mare sau prea mic ( Fig. 2). În acest caz, un alt parametru, mediana, ar trebui utilizat pentru a caracteriza tendința centrală în eșantion. Mediana este valoarea caracteristicii, la dreapta și la stânga căreia există un număr egal de observații (50% fiecare). Acest parametru (spre deosebire de valoarea medie) este rezistent la „outliers”. Rețineți, de asemenea, că mediana poate fi folosită și în caz distributie normalaÎn acest caz, mediana este aceeași cu media.

Orez. 2. Distribuția caracteristicii în eșantion este diferită de cea normală. Media (m) și mediana (ME) nu se potrivesc

Pentru a afla dacă distribuția unei caracteristici în eșantion este normală (gaussiană) sau nu, adică pentru a afla care dintre parametri ar trebui să fie utilizați (medie sau mediană), există teste statistice speciale.

Să luăm un exemplu. Rata de sedimentare a eritrocitelor la lotul de pacienți cu pneumonie recentă este de 3, 5, 5, 7, 11, 12, 16, 16, 21, 42, 58. Valoarea medie pentru această probă este 17,8, mediana este 12. Distribuție ( conform testului Shapiro-Wilk) nu este normal (Fig. 3), deci trebuie folosită mediana. Orez. 3. Exemplu

Destul de ciudat, dar în unele domenii ale economiei, un observator extern nu poate observa măcar o urmă de aplicare corectă a statisticii matematice. Așadar, ni se vorbește în mod constant despre salariul mediu (de exemplu, în institutele de cercetare), iar aceste cifre surprind de obicei nu numai angajații obișnuiți, ci și șefii de departamente (numiți acum „manageri de mijloc”). Suntem surprinși că salariul mediu la Moscova este de 40 de mii de ruble, dar, desigur, înțelegem că am fost „mediați” cu oligarhii. Iată un exemplu din viața oamenilor de știință: salariile angajaților de laborator (mii de ruble) sunt 3, 5, 5, 7, 11, 12, 16, 16, 21, 42, 58. Valoarea medie este de 17,8, mediana este 12. De acord că acestea sunt numere diferite!

Desigur, nu se poate exclude faptul că tăcerea proprietăților mediei este viclenie, deoarece este întotdeauna mai profitabil pentru conducere să prezinte situația cu salariul angajaților mai bine decât este în realitate.

Nu este timpul ca comunitatea științifică să ceară liderilor noștri să oprească folosirea abuzivă a statisticilor matematice?

Olga Rebrova,
doc. Miere. Științe, vicepreședinte
IPO „Societatea Specialiștilor în Medicină Bazată pe Dovezi”

Pentru a calcula mediana în MS EXCEL există o funcție specială MEDIAN() . În acest articol, vom defini mediana și vom învăța cum să o calculăm pentru un eșantion și pentru o anumită lege de distribuție variabilă aleatorie.

Sa incepem cu mediane Pentru mostre(adică pentru un set fix de valori).

Mediana eșantionului

Median(mediana) este numărul care este mijlocul setului de numere: jumătate dintre numerele din mulțime sunt mai mari decât median, iar jumătate dintre numere sunt mai mici decât median.

A calcula mediane necesar mai întâi (valori în prelevarea de probe). De exemplu, median pentru probă (2; 3; 3; 4 ; 5; 7; 10) va fi 4. Din moment ce. doar in prelevarea de probe 7 valori, trei dintre ele mai mici decât 4 (adică 2; 3; 3) și trei valori mai mari decât (adică 5; 7; 10).

Dacă setul conține un număr par de numere, atunci acesta este calculat pentru două numere din mijlocul setului. De exemplu, median pentru probă (2; 3; 3 ; 6 ; 7; 10) va fi 4,5, deoarece (3+6)/2=4,5.

Pentru determinare medianeîn MS EXCEL există o funcție MEDIAN() cu același nume, versiune în limba engleză MEDIAN().

Median nu se potrivește neapărat. O potrivire are loc numai dacă valorile din eșantion sunt distribuite simetric mijloc. De exemplu, pentru mostre (1; 2; 3 ; 4 ; 5; 6) medianȘi in medie sunt egale cu 3,5.

Daca este cunoscut functie de distributie F(x) sau funcția de densitate de probabilitate p(X), Acea median poate fi găsită din ecuația:

De exemplu, rezolvând această ecuație analitic pentru distribuția Lognormală lnN(μ; σ 2), obținem că median se calculează prin formula =EXP(μ). Pentru μ=0, mediana este 1.

Acordați atenție punctului Funcții de distribuție, pentru care F(x)=0,5(vezi poza de mai sus) . Abscisa acestui punct este 1. Aceasta este valoarea mediei, care coincide în mod natural cu valoarea calculată anterior folosind formula em.

în MS EXCEL median Pentru distribuție lognormală LnN(0;1) poate fi calculat folosind formula =LOGNORM.INV(0,5,0,1).

Notă: Amintiți-vă că integrala lui pe întreaga zonă de setare a unei variabile aleatoare este egală cu unu.

Prin urmare, linia mediană (x=mediană) împarte aria de sub grafic funcții de densitate de probabilitateîn două părți egale.



eroare: Conținutul este protejat!!