Cum diferă mediana de medie. Medie sau totuși mediană

Să presupunem că doriți să determinați nivelul mediu într-o distribuție a notelor elevilor sau într-un eșantion de date de control al calității. Pentru a face acest lucru, trebuie să calculați mediana unui set de numere folosind funcția MEDIAN.

Această funcție este o modalitate de a măsura tendința centrală, adică locația centrului unui set de numere în distributie statistica. Există trei modalități cele mai comune de a determina tendința centrală.

    Valoarea medie- aceasta este o valoare care este media aritmetică, adică se calculează prin adăugarea unui set de numere, urmată de împărțirea sumei rezultate la numărul acestora. De exemplu, media numerelor 2, 3, 3, 5, 7 și 10 este 5 (rezultatul împărțirii sumei acestor numere, care este 30, la numărul lor, care este 6).

    Median- un număr care este mijlocul unui set de numere: jumătate dintre numere au valori mai mari decât mediana, iar jumătate dintre numere au valori mai mici. De exemplu, mediana numerelor 2, 3, 3, 5, 7 și 10 este 4.

    Modă- numărul care apare cel mai frecvent într-un anumit set de numere. De exemplu, modul pentru numerele 2, 3, 3, 5, 7 și 10 ar fi 3.

Cu o distribuție simetrică a unui set de numere, toate cele trei valori ale tendinței centrale vor coincide. Cu o distribuție părtinitoare a unui set de numere, valorile pot fi diferite.

Capturile de ecran din acest articol au fost făcute în Excel 2016. Dacă utilizați o versiune diferită, interfața poate arăta ușor diferită, dar funcționalitatea este aceeași.

Exemplu

Pentru a face acest exemplu mai ușor de înțeles, copiați-l pe o foaie goală.

Sfat: Pentru a comuta între vizualizarea rezultatelor și vizualizarea formulelor care returnează acele rezultate, apăsați CTRL+` (apostrof) sau pe filă Formuleîntr-un grup Dependențe de formule apasa butonul Afișați formule.

Median- aceasta este o valoare caracteristică care împarte seria de distribuție clasată în două părți egale - cu valori ale caracteristicilor mai mici decât mediana și cu valori ale caracteristicilor mai mari decât mediana. Pentru a găsi mediana, trebuie să găsiți valoarea caracteristicii care se află la mijlocul seriei ordonate.

Vizualizați soluția la problema găsirii modului și a mediei Poti

În serii clasificate, date negrupate pentru găsirea medianei sunt reduse la găsirea numărului ordinal al medianei. Mediana poate fi calculată folosind următoarea formulă:

unde Xm este limita inferioară a intervalului median;
im - interval median;
Sme este suma observațiilor care a fost acumulată înainte de începutul intervalului median;
fme este numărul de observații din intervalul median.

proprietăți medii

  1. Mediana nu depinde de acele valori ale atributului care sunt situate pe ambele părți ale acestuia.
  2. Operațiile analitice cu mediana sunt destul de limitate, deci atunci când se combină două distribuții cu mediane cunoscute este imposibil să se prezică în avans mediana noii distribuții.
  3. Mediana are proprietatea minima. Esența sa constă în faptul că suma abaterilor absolute ale valorilor x de la mediană este valoarea minimă în comparație cu abaterea lui X de la orice altă valoare.

Definiția grafică a mediei

Pentru determinare mediane metoda grafica utilizați frecvențele acumulate, pe care se construiește curba cumulativă. Vârfurile ordonatelor corespunzătoare frecvențelor acumulate sunt legate prin segmente de linie dreaptă. Împărțind în jumătate ultima ordonată, care corespunde sumei totale a frecvențelor, și trasând perpendiculara intersecției cu curba cumulativă la aceasta, găsiți ordonata valorii dorite a medianei.

Definiția modei în statistică

Moda - valoare caracteristică, care are cea mai mare frecvență în serii statistice distributie.

Definiţia modei este produsă în moduri diferite, iar acest lucru depinde dacă caracteristica variabilă este prezentată ca o formă discretă sau serie de intervale.

Găsirea modei iar mediana se realizează prin simpla privire prin coloana de frecvență. În această coloană, găsiți cel mai mare număr care caracterizează cea mai mare frecvență. Ea corespunde unei anumite valori a atributului, care este modul. În seria de variații de interval, varianta centrală a intervalului cu cea mai mare frecvență este considerată aproximativ modul. În această serie de distribuție modul este calculat prin formula:

unde XMo este limita inferioară a intervalului modal;
imo - spațiere modală;
fm0, fm0-1, fm0+1 sunt frecvențele din intervalele modale, precedente și următoare.

Intervalul modal este determinat de cea mai mare frecvență.

Moda este utilizată pe scară largă în practica statistică în analiza cererii consumatorilor, înregistrarea prețurilor etc.

Relații dintre media aritmetică, mediană și mod

Pentru o serie de distribuție simetrică unimodală, mediana și modul sunt aceleași. Pentru distribuțiile asimetrice, acestea nu coincid.

K. Pearson, pe baza alinierii diferitelor tipuri de curbe, a determinat că pentru distribuțiile moderat asimetrice sunt valabile următoarele relații aproximative între media aritmetică, mediană și mod:

4. Moda. Median. Mediu general și eșantion

Modul este pe ecran, mediana este în triunghi, iar mediile sunt temperatura din spital și din secție. Ne continuăm curs practic statistici distractive (Lectia 1) studiul caracteristicilor centrale populaţia statistică, ale căror nume le vedeți în antet. Și vom începe de la capătul ei, pentru că valori medii discursul a venit aproape de la primele paragrafe ale subiectului. Pentru cititorii avansați Cuprins:

  • Mediu general și eșantion– calcul după date primare și pentru discretul generat serie de variații;
  • Modă– definire și constatare pentru un caz discret;
  • Median– o definiție generală a modului de a găsi mediana;
  • Media, modul și mediana seriei de variații de interval– calcul din date primare și din seria finită. Formule de mod și medie,
  • Quartile, decile, percentile - pe scurt despre principalul lucru.

Ei bine, este mai bine ca „manichinii” să se familiarizeze cu materialul în ordine:

Deci haideți să explorăm câteva populatia volumul, și anume caracteristica sa numerică, nu contează discret sau continuu (Lecțiile 2, 3).

Secundar general numit in medie toate valorile acestui set:

Dacă numerele sunt aceleași (ceea ce este tipic pentru serie discretă) , atunci formula poate fi scrisă într-o formă mai compactă:
, Unde
opțiune ori repetate;
opțiune - ori;
opțiune - ori;

opțiune - ori.

Exemplu de calcul live secundar generalîntâlnit în exemplu 2, dar pentru a nu fi plictisitor, nici nu-i voi aminti conținutul.

Mai departe. După cum ne amintim, prelucrarea tuturor populatia adesea dificil sau imposibil și, prin urmare, se organizează reprezentant prelevarea de probe volum, iar pe baza studiului acestui eșantion se face o concluzie despre întreaga populație.

Eșantion mediu numit in medie toate valorile eșantionului:

și în prezența acelorași opțiuni, formula va fi scrisă mai compact:
- ca suma produselor variantei pe corespunzătoare frecvente .

Media eșantionului ne permite să estimăm cu exactitate valoarea adevărată a lui , ceea ce este suficient pentru multe studii. Cu cât eșantionul este mai mare, cu atât această estimare va fi mai precisă.

Să începem practica, sau mai degrabă să continuăm cu serie de variații discreteși starea familiară:

Exemplul 8

Pe baza rezultatelor unui studiu selectiv al muncitorilor din atelier s-au stabilit categoriile de calificare ale acestora: 4, 5, 6, 4, 4, 2, 3, 5, 4, 4, 5, 2, 3, 3, 4, 5 , 5, 2, 3, 6, 5, 4, 6, 4, 3.

La fel de rezolva sarcină? Dacă ni se dă date primare(valori brute originale), atunci acestea pot fi însumate prost și împărțite la dimensiunea eșantionului:
- categoria medie de calificare a lucrătorilor magazinului.

Dar în multe probleme este necesară alcătuirea unei serii variaționale (cm. Exemplul 4) :

- sau acest serial a fost propus inițial (ceea ce se întâmplă mai des). Și apoi, desigur, folosim formula „civilizată”:

Modă . Modul unei serii variaționale discrete este opțiune cu frecventa maxima. În acest caz . Moda este ușor de găsit pe masă și chiar mai ușor gama de frecvente este abscisa punctului cel mai înalt:


Uneori există mai multe astfel de valori (cu aceeași frecvență maximă), iar apoi fiecare dintre ele este considerată o modă.

Dacă toate sau aproape toate Opțiuni diferit (ceea ce este tipic pentru serie de intervale), atunci valoarea modală este determinată într-un mod ușor diferit, care este discutat în partea a 2-a a lecției.

Median . Mediana seriei de variații * - aceasta este valoarea care o împarte în două părți egale (în funcție de numărul de opțiuni).

Dar acum trebuie să găsim media, modul și mediana.

Decizie: a găsi mijloc conform datelor primare, cel mai bine este să însumați toate opțiunile și să împărțiți rezultatul la volumul populației:
den. unitati

Aceste calcule, apropo, nu vor dura mult timp chiar și atunci când utilizați un calculator offline. Dar dacă există Excel, atunci, desigur, scor în orice celulă liberă =SUMA(, selectați toate numerele cu mouse-ul, închideți paranteza ) , pune un semn de împărțire / , introduceți numărul 30 și apăsați introduce. Gata.

În ceea ce privește moda, evaluarea acesteia pe baza datelor inițiale devine inutilizabilă. Deși vedem aceleași numere printre ele, dar printre ele pot fi ușor cinci sau șase sau șapte opțiuni cu aceeași frecvență maximă, de exemplu, frecvența 2. În plus, prețurile pot fi rotunjite. Prin urmare, valoarea modală este calculată în funcție de seria de intervale generate (mai multe despre asta mai târziu).

Ce poți spune despre mediană: conectarea la Excel =MEDIAN(, selectați toate numerele cu mouse-ul, închideți paranteza ) și faceți clic introduce: . Mai mult, aici nici nu trebuie să sortați nimic.

Dar în Exemplul 6 sortate în ordine crescătoare (rețineți și sortați - linkul de mai sus), și aceasta este o ocazie bună de a repeta algoritmul formal pentru găsirea medianei. Împărțim proba în jumătate:

Și deoarece constă dintr-un număr par de opțiuni, mediana este egală cu media aritmetică a opțiunii a 15-a și a 16-a ordonat(!) serie de variații:

den. unitati

Situatia a doua. Când se oferă o serie de intervale gata făcute (o sarcină tipică de învățare).

Continuăm să analizăm același exemplu cu cizme, unde, conform datelor inițiale a fost compilat de IVR. A calcula mijloc sunt necesare punctele medii ale intervalelor:

– pentru a utiliza formula familiară a cazului discret:

- rezultat excelent! Discrepanța cu valoarea mai precisă () calculată din datele primare este de numai 0,04.

De fapt, aici am aproximat seria de intervale cu una discretă, iar această aproximare s-a dovedit a fi foarte eficientă. Cu toate acestea, nu există niciun beneficiu special aici, deoarece. sub modern software nu este dificil să se calculeze valoarea exactă chiar și pentru o gamă foarte mare de date primare. Dar asta cu condiția să ne fie cunoscute :)

Cu alți indicatori centrali, totul este mai interesant.

Pentru a găsi moda, trebuie să găsești spațierea modală (cu frecventa maxima)- în această problemă, acesta este un interval cu o frecvență de 11 și utilizați următoarea formulă urâtă:
, Unde:

este limita inferioară a intervalului modal;
este lungimea intervalului modal;
este frecvența intervalului modal;
– frecvența intervalului anterior;
– frecvența intervalului următor.

În acest fel:
den. unitati - după cum puteți vedea, prețul „la modă” pentru pantofi este vizibil diferit de media aritmetică.

Fără a intra în geometria formulei, voi da pur și simplu histograma frecvențelor relative si noteaza:


de unde se vede clar că modul este deplasat faţă de centrul intervalului modal spre intervalul din stânga cu o frecvenţă mai mare. Logic.

Pentru referință, voi analiza cazuri rare:

– dacă intervalul modal este extrem, atunci fie ;

- dacă se găsesc 2 intervale modale care sunt în apropiere, de exemplu, și , atunci considerăm intervalul modal , în timp ce intervalele apropiate (stânga și dreapta), dacă este posibil, sunt și ele mărite de 2 ori.

- dacă există o distanță între intervalele modale, atunci aplicăm formula fiecărui interval, obținând astfel 2 sau mai multe moduri.

Iată un astfel de mod de expediere :)

Și mediana. Dacă se oferă o serie de intervale gata făcută, atunci mediana este calculată folosind o formulă puțin mai puțin îngrozitoare, dar la început este plictisitor (o greșeală de tip freudiană :)) să găsiți intervalul median - acesta este un interval care conține o variantă (sau 2 variante), care împarte seria de variații în două părți egale.

Mai sus, am descris cum să determinăm mediana, concentrându-mă pe frecvențe relative cumulate, aici este mai convenabil să se calculeze frecvențele acumulate „obișnuite”. Algoritmul de calcul este exact același - prima valoare este demolată în stânga (sageata rosie), iar fiecare următor se obține ca sumă a precedentului cu frecvența curentă din coloana din stânga (marcajele verzi de exemplu):

Toată lumea înțelege semnificația numerelor din coloana din dreapta? - acesta este numarul de optiuni care au reusit sa se "acumuleze" pe toate intervalele "trecute", inclusiv pe cel curent.

Deoarece avem un număr par de opțiuni (30 de bucăți), mediana va fi intervalul care conține 30/2 = a 15-a și a 16-a opțiune. Și concentrându-ne pe frecvențele acumulate, este ușor să ajungem la concluzia că aceste opțiuni sunt cuprinse în intervalul .

Formula mediană:
, Unde:
- volumul populaţiei statistice;
este limita inferioară a intervalului median;
este lungimea intervalului median;
frecvență intervalul median;
frecventa cumulativa anterior interval.

În acest fel:
den. unitati - observa asta valoarea mediană, dimpotrivă, s-a dovedit a fi deplasat la dreapta, deoarece pe mana dreapta există un număr semnificativ de opțiuni:


Și pentru referință cazuri speciale.

TEST

Pe subiect: "Mod. Median. Metode de calcul al acestora"


Introducere

Valorile medii și indicatorii aferenti de variație joacă un rol foarte important în statistică, care se datorează subiectului studiului acesteia. Prin urmare, acest subiect este unul dintre cele centrale ale cursului.

Media este un indicator de generalizare foarte comun în statistici. Acest lucru se explică prin faptul că numai cu ajutorul mediei este posibilă caracterizarea populației după un atribut variabil cantitativ. O valoare medie în statistică este o caracteristică generalizantă a unui set de fenomene de același tip în funcție de un atribut care variază cantitativ. Media arată nivelul acestui atribut, raportat la unitatea populației.

Studiind fenomenele sociale și căutând să identifice trăsăturile lor caracteristice, tipice în condiții specifice de loc și timp, statisticienii folosesc pe scară largă valorile medii. Cu ajutorul mediilor, diferite populații pot fi comparate între ele în funcție de caracteristici diferite.

Mediile utilizate în statistici aparțin clasei mediilor de putere. Dintre mediile puterii, se folosește cel mai des media aritmetică, mai rar media armonică; media armonică este utilizată numai la calcularea ratelor medii ale dinamicii, iar pătratul mediu - numai la calcularea indicatorilor de variație.

Media aritmetică este câtul de împărțire a sumei opțiunilor la numărul lor. Este utilizat în cazurile în care volumul unui atribut variabil pentru întreaga populație este format ca suma valorilor atributelor pentru unitățile sale individuale. Media aritmetică este cel mai comun tip de medie, deoarece corespunde naturii fenomenelor sociale, unde volumul semnelor variabile în agregat este cel mai adesea format exact ca suma valorilor atributului în unități individuale de populatia.

Conform proprietății sale definitorii, media armonică ar trebui utilizată atunci când volumul total al atributului este format ca suma valorilor reciproce ale variantei. Se folosește atunci când, în funcție de materialul disponibil, greutățile nu trebuie înmulțite, ci împărțite în opțiuni sau, ceea ce este la fel, înmulțite cu valoarea lor inversă. Media armonică în aceste cazuri este reciproca mediei aritmetice a valorilor reciproce ale atributului.

Media armonică ar trebui utilizată în acele cazuri în care ponderile nu sunt unitățile populației - purtătorii caracteristicii, ci produsele acestor unități și valoarea caracteristicii.


1. Definiția modului și a mediei în statistici

Mijloacele aritmetice și armonice sunt caracteristicile generalizatoare ale populației în funcție de unul sau altul atribut variabil. Caracteristicile descriptive auxiliare ale distribuției unui atribut variabil sunt modul și mediana.

În statistică, moda este valoarea unei caracteristici (variante) care se găsește cel mai adesea într-o anumită populație. În seria de variații, aceasta va fi varianta cu cea mai mare frecvență.

Mediana în statistică se numește variantă, care se află la mijlocul seriei de variații. Mediana împarte seria în jumătate, de ambele părți ale acesteia (în sus și în jos) există același număr de unități de populație.

Modul și mediana, spre deosebire de mediile exponențiale, sunt caracteristici specifice, valoarea lor este orice variantă particulară din seria de variații.

Modul este utilizat în cazurile în care este necesar să se caracterizeze valoarea cea mai frecventă a unei caracteristici. Dacă aveți nevoie, de exemplu, să aflați cea mai comună dimensiune salariile la întreprindere, prețul pieței la care a fost vândut cel mai mare număr mărfuri, mărimea încălțămintei cea mai solicitată de consumatori etc., în aceste cazuri recurg la modă.

Mediana este interesantă prin faptul că arată limita cantitativă a valorii caracteristicii variabile, care a fost atinsă de jumătate dintre membrii populației. Să fie salariul mediu al angajaților băncii să se ridice la 650.000 de ruble. pe luna. Această caracteristică poate fi completată dacă spunem că jumătate dintre muncitori au primit un salariu de 700.000 de ruble. și mai sus, adică să luăm mediana. Modul și mediana sunt caracteristici tipice în cazurile în care populațiile sunt omogene și mari ca număr.


2. Găsirea modului și a mediei într-o serie de variații discrete

Găsirea modului și a medianei într-o serie variațională, unde valorile atributelor sunt date de anumite numere, nu este foarte dificilă. Luați în considerare tabelul 1. cu distribuția familiilor după numărul de copii.

Tabelul 1. Distribuția familiilor după numărul de copii

Evident, în acest exemplu, moda va fi o familie cu doi copii, deoarece această valoare a opțiunilor corespunde celui mai mare număr de familii. Pot exista distribuții în care toate variantele sunt la fel de frecvente, caz în care nu există modă, sau, cu alte cuvinte, se poate spune că toate variantele sunt la fel de modale. În alte cazuri, nu una, ci două opțiuni pot fi cea mai mare frecvență. Apoi vor fi două moduri, distribuția va fi bimodală. Distribuțiile bimodale pot indica eterogenitatea calitativă a populației în funcție de trăsătura studiată.

Pentru a găsi mediana într-o serie de variații discrete, trebuie să împărțiți suma frecvențelor la jumătate și să adăugați ½ la rezultat. Deci, în repartizarea a 185 de familii după numărul de copii, mediana va fi: 185/2 + ½ = 93, i.e. A 93-a opțiune, care împarte rândul ordonat în jumătate. Care este sensul celei de-a 93-a opțiuni? Pentru a afla, trebuie să acumulați frecvențe, pornind de la cele mai mici opțiuni. Suma frecvențelor primei și celei de-a doua opțiuni este 40. Este clar că aici nu există 93 de opțiuni. Dacă adăugăm frecvența celei de-a 3-a opțiuni la 40, atunci obținem suma egală cu 40 + 75 = 115. Prin urmare, a 93-a opțiune corespunde celei de-a treia valori a atributului variabil, iar mediana va fi o familie cu doi copii. .

În acest exemplu, modul și mediana au coincis. Dacă am avut o sumă pară de frecvențe (de exemplu, 184), atunci aplicând formula de mai sus, obținem numărul de opțiuni mediane, 184/2 + ½ = 92,5. Deoarece nu există opțiuni fracționale, rezultatul indică faptul că mediana se află la mijloc între 92 și 93 de opțiuni.

3. Calculul modului și medianei în seria de variații de interval

Natura descriptivă a modului și a mediei se datorează faptului că nu compensează abaterile individuale. Întotdeauna corespund unei anumite variante. Prin urmare, modul și mediana nu necesită calcule pentru a le găsi dacă toate valorile atributului sunt cunoscute. Cu toate acestea, în seria de variații de interval, calculele sunt utilizate pentru a găsi valoarea aproximativă a modului și mediana într-un anumit interval.

Pentru a calcula o anumită valoare a valorii modale a unui semn închis într-un interval, se utilizează următoarea formulă:

M o \u003d X Mo + i Mo * (f Mo - f Mo-1) / ((f Mo - f Mo-1) + (f Mo - f Mo + 1)),

Unde X Mo este limita minimă a intervalului modal;

i Mo este valoarea intervalului modal;

fMo este frecvența intervalului modal;

f Mo-1 - frecvența intervalului premergător modalului;

f Mo+1 este frecvența intervalului care urmează modalului.

Vom arăta calculul modului folosind exemplul dat în tabelul 2.


Tabelul 2. Distribuția lucrătorilor întreprinderii în funcție de implementarea standardelor de producție

Pentru a găsi modul, determinăm mai întâi intervalul modal al seriei date. Din exemplu se poate observa că cea mai mare frecvență corespunde intervalului în care varianta se află în intervalul de la 100 la 105. Acesta este intervalul modal. Valoarea intervalului modal este 5.

Înlocuind valorile numerice din tabelul 2. în formula de mai sus, obținem:

L o \u003d 100 + 5 * (104 -12) / ((104 - 12) + (104 - 98)) \u003d 108,8

Sensul acestei formule este următorul: valoarea acelei părți a intervalului modal, care trebuie adăugată la limita minimă a acesteia, este determinată în funcție de mărimea frecvențelor intervalelor anterioare și următoare. În acest caz, adăugăm 8,8 la 100, adică mai mult de jumătate din interval, deoarece frecvența intervalului anterior este mai mică decât frecvența intervalului următor.

Să calculăm mediana acum. Pentru a găsi mediana în seria de variații de interval, determinăm mai întâi intervalul în care se află (intervalul median). Un astfel de interval va fi unul a cărui frecvență cumulată este egală sau mai mare decât jumătate din suma frecvențelor. Frecvențele cumulate se formează prin însumarea treptată a frecvențelor, începând de la intervalul de la cea mai mică valoare semn. Jumătate din suma frecvențelor pe care le avem este 250 (500:2). Prin urmare, conform tabelului 3. intervalul median va fi intervalul cu valoarea salariilor de la 350.000 de ruble. până la 400.000 de ruble.

Tabelul 3. Calculul medianei în seria de variații de interval

Înainte de acest interval, suma frecvențelor acumulate era 160. Prin urmare, pentru a obține valoarea medianei, este necesar să se adauge încă 90 de unități (250 - 160).

Salariile în diverse sectoare ale economiei, temperatura și precipitațiile în aceeași zonă pentru perioade de timp comparabile, recoltele recoltelor în diferite regiuni geografice etc. Cu toate acestea, media nu este în niciun caz singurul indicator de generalizare - în unele cazuri pentru o mai precisă evaluarea unei valori precum mediana este adecvată. În statistică, este utilizat pe scară largă ca o caracteristică descriptivă auxiliară a distribuției unei caracteristici într-o singură populație. Să vedem cum diferă de medie și, de asemenea, ce a cauzat nevoia de a-l folosi.

Mediana în statistică: definiție și proprietăți

Imaginează-ți următoarea situație: 10 persoane lucrează împreună cu directorul într-o companie. Angajații obișnuiți primesc câte 1.000 de grivne fiecare, iar managerul lor, care, de altfel, este proprietar, primește 10.000 de grivne. Dacă calculăm media aritmetică, se dovedește că salariul mediu la această întreprindere este de 1900 UAH. Va fi adevărată această afirmație? Sau ca să luăm acest exemplu, în aceeași cameră de spital sunt nouă persoane cu temperatura de 36,6°C și o persoană cu temperatura de 41°C. Media aritmetică în acest caz este: (36,6 * 9 + 41) / 10 \u003d 37,04 ° C. Dar asta nu înseamnă că toți cei prezenți sunt bolnavi. Toate acestea sugerează că media singură nu este adesea suficientă și, de aceea, mediana este utilizată în plus față de aceasta. În statistică, acest indicator se numește o variantă care se află exact în mijlocul unei serii de variații ordonate. Dacă îl calculezi pentru exemplele noastre, primești, respectiv, 1000 UAH. și 36,6 °С. Cu alte cuvinte, mediana în statistică este valoarea care împarte seria la jumătate în așa fel încât de ambele părți ale acesteia (în sus sau în jos) să fie situat același număr de unități ale populației date. Din cauza acestei proprietăți, acest indicator are câteva alte denumiri: percentila 50 sau cuantila 0,5.

Cum să găsiți mediana în statistici

Metoda de calcul a acestei valori depinde în mare măsură de ce tip de serie variațională avem: discretă sau interval. În primul caz, mediana din statistici este destul de simplă. Tot ce trebuie să faceți este să găsiți suma frecvențelor, să împărțiți la 2 și apoi să adăugați ½ la rezultat. Cel mai bine ar fi să explicați principiul de calcul cu următorul exemplu. Să presupunem că am grupat datele de fertilitate și dorim să aflăm care este mediana.

Numărul grupului de familie după numărul de copii

Numărul de familii

După efectuarea unor calcule simple, obținem că indicatorul dorit este egal cu: 195/2 + ½ = opțiune. Pentru a afla ce înseamnă acest lucru, ar trebui să acumulați secvențial frecvențele, începând cu cele mai mici opțiuni. Deci, suma primelor două linii ne dă 30. În mod clar, nu există 98 de opțiuni aici. Dar dacă adăugăm la rezultat frecvența celei de-a treia opțiuni (70), obținem o sumă egală cu 100. Conține doar a 98-a opțiune, ceea ce înseamnă că mediana va fi o familie care are doi copii.

În ceea ce privește seria de intervale, următoarea formulă este de obicei utilizată aici:

M e \u003d X Me + i Me * (∑f / 2 - S Me-1) / f Me, în care:

  • X Me - prima valoare a intervalului median;
  • ∑f este numărul seriei (suma frecvențelor acesteia);
  • i Me - valoarea intervalului median;
  • f Me - frecvența intervalului median;
  • S Me-1 - suma frecvențelor cumulate din intervalele care preced mediana.

Din nou, este greu să-ți dai seama fără un exemplu. Să presupunem că există date despre valoare

Salariu, mii de ruble

Frecvențe acumulate

Pentru a folosi formula de mai sus, trebuie mai întâi să determinăm intervalul median. Ca atare interval, se alege unul, a cărui frecvență acumulată depășește sau este egală cu jumătate din suma totală de frecvențe. Deci, împărțind 510 la 2, obținem că acest criteriu corespunde unui interval cu o valoare salarială de 250.000 de ruble. până la 300.000 de ruble Acum puteți înlocui toate datele din formula:

M e \u003d X Me + i Me * (∑f / 2 - S Me-1) / f Me \u003d 250 + 50 * (510/2 - 170) / 115 \u003d 286,96 mii ruble.

Sperăm că articolul nostru a fost util, iar acum aveți o idee clară despre care este mediana în statistici și cum ar trebui calculată.



eroare: Conținutul este protejat!!