Metoda de corelare a rangului lui Spearman online. Analiza corelației conform metodei Spearman (rangurile Spearman)

27.09.2019 | Internet

Coeficient corelație de rang Spearman este o metodă neparametrică cu care se obișnuiește studiu statistic legături între fenomene. În acest caz, se determină gradul real de paralelism între cele două serii cantitative ale trăsăturilor studiate și se estimează strângerea relației stabilite folosind un coeficient exprimat cantitativ.

1. Istoricul dezvoltării coeficientului de corelație de rang

Acest criteriu a fost dezvoltat și propus pentru analiza corelației în 1904 Charles Edward Spearman, psiholog englez, profesor la universitățile din Londra și Chesterfield.

2. Pentru ce este folosit raportul Spearman?

Coeficientul de corelație a rangului lui Spearman este utilizat pentru a identifica și evalua strânsoarea relației dintre două serii de comparații. indicatori cantitativi. În cazul în care rândurile indicatorilor, sortați după gradul de creștere sau scădere, în cele mai multe cazuri coincid (o valoare mai mare a unui indicator corespunde unei valori mai mari a altui indicator - de exemplu, când se compară înălțimea pacientului și greutatea corporală a acestuia), se concluzionează că acolo Drept corelație. Dacă rândurile indicatorilor au direcția opusă (o valoare mai mare a unui indicator corespunde unei valori mai mici a altuia - de exemplu, când se compară vârsta și ritmul cardiac), apoi vorbesc despre verso legături între indicatori.

Coeficientul de corelație Spearman are următoarele proprietăți:

Coeficientul de corelație poate lua valori de la minus unu la unu, iar la rs=1 există o relație strict directă, iar la rs= -1 - strict Părere.
Dacă coeficientul de corelație este negativ, atunci există o relație inversă; dacă este pozitiv, atunci există o relație directă.
Dacă coeficientul de corelație este egal cu zero, atunci relația dintre cantități este practic absentă.
Cu cât modulul coeficientului de corelație este mai aproape de unitate, cu atât relația dintre valorile măsurate este mai puternică.

3. În ce cazuri poate fi utilizat coeficientul Spearman?

Datorită faptului că coeficientul este o metodă analiza neparametrică, nu este necesară verificarea distribuției normale.

Indicatorii comparabili pot fi măsurați ca în scară continuă(de exemplu, numărul de eritrocite în 1 µl de sânge) și în ordinal(de exemplu, scoruri de evaluare de la 1 la 5).

Eficacitatea și calitatea estimării lui Spearman este redusă dacă diferența dintre diferitele valori ale oricăreia dintre cantitățile măsurate este suficient de mare. Nu se recomandă utilizarea coeficientului Spearman dacă există o distribuție neuniformă a valorilor măsurate.

4. Cum se calculează raportul lui Spearman?

Calculul coeficientului de corelare a rangului Spearman include următorii pași:

5. Cum se interpretează valoarea coeficientului Spearman?

Atunci când se utilizează coeficientul de corelare a rangului, apropierea conexiunii dintre semne este estimată condiționat, luând în considerare valorile coeficientului egale cu 0,3 sau mai puțin - indicatori de apropiere slabă a conexiunii; valorile mai mari de 0,4 dar mai mici de 0,7 sunt indicatori de apropiere moderată a conexiunii, iar valorile de 0,7 și mai mult sunt indicatori de apropiere ridicată a comunicării.

Semnificația statistică a coeficientului obținut este evaluată cu ajutorul testului t Student. Dacă valoarea calculată a criteriului t este mai mică decât valoarea tabelară pentru un număr dat de grade de libertate, semnificația statistică a relației observate este absentă. Dacă mai mult, atunci corelația este considerată semnificativă statistic.

37. Coeficientul de corelare a rangului lui Spearman.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Coeficientul de corelare a rangului lui Spearman este utilizat atunci când:
- variabilele au scala de clasare măsurători;
- distribuția datelor este prea diferită de normal sau necunoscută deloc
- probele sunt mici (N< 30).

Interpretarea coeficientului de corelare a rangului lui Spearman nu diferă de coeficientul lui Pearson, dar semnificația lui este oarecum diferită. Pentru a înțelege diferența dintre aceste metode și pentru a fundamenta logic domeniile de aplicare a acestora, să le comparăm formulele.

Coeficientul de corelație Pearson:

Coeficientul de corelație al lui Spearman:

După cum puteți vedea, formulele diferă semnificativ. Comparați formule

Formula de corelație Pearson utilizează media aritmetică și abaterea standard a seriei corelate, în timp ce formula Spearman nu. Astfel, pentru a obține un rezultat adecvat conform formulei Pearson, este necesar ca seria corelată să fie apropiată de distribuția normală (media și abaterea standard sunt parametrii distributie normala ). Pentru formula Spearman, acest lucru nu este relevant.

Un element al formulei lui Pearson este standardizarea fiecărei serii în scorul z.

După cum puteți vedea, conversia variabilelor la scara Z este prezentă în formula coeficientului de corelație Pearson. În consecință, pentru coeficientul Pearson, scara datelor este absolut irelevantă: de exemplu, putem corela două variabile, dintre care una are un min. = 0 și max. = 1, iar al doilea min. = 100 și max. = 1000. Indiferent de cât diferă intervalul de valori, toate vor fi convertite în scoruri z standard identice ca scară.

Nu există o astfel de normalizare în coeficientul Spearman, deci

O CONDIȚIE OBLIGATORIE PENTRU UTILIZAREA COEFICIENTULUI SPEERMAN ESTE EGALITATEA GAMULUI DE DOUĂ VARIABILE.

Înainte de a utiliza coeficientul Spearman pentru serii de date cu intervale diferite, este necesar să rang. Clasamentul duce la faptul că valorile acestor serii capătă același minim = 1 (rang minim) și un maxim egal cu numărul de valori (maxim, ultimul rang = N, adică numărul maxim de cazuri din probă).

În ce cazuri este posibil să faci fără clasare

Acestea sunt cazurile în care datele sunt inițiale scala de clasare. De exemplu, testul orientărilor valorii Rokeach.

De asemenea, acestea sunt cazuri în care numărul de opțiuni de valoare este mic și există un minim și un maxim fix în eșantion. De exemplu, în diferenţialul semantic, minim = 1, maxim = 7.

Un exemplu de calcul al coeficientului de corelație a rangului Spearman

Testul orientărilor valorii Rokeach a fost efectuat pe două eșantioane X și Y. Sarcina a fost de a afla cât de apropiate sunt ierarhiile de valori ale acestor eșantioane (literalmente, cât de asemănătoare sunt acestea).

Valoarea rezultată r=0,747 este verificată tabelul cu valori critice. Conform tabelului, la N=18, valoarea obţinută este de încredere la nivelul p<=0,005

Clasificarea coeficienților de corelație conform lui Spearman și Kendal

Pentru variabilele aparținând scării ordinale sau pentru variabilele care nu urmează o distribuție normală, precum și pentru variabilele aparținând scării intervalului, în locul coeficientului Pearson se calculează corelația rangului lui Spearman. Pentru a face acest lucru, valorilor individuale ale variabilelor li se atribuie locuri de clasare, care sunt ulterior procesate folosind formulele adecvate. Pentru a dezvălui corelația de rang, debifați caseta de selectare implicită a corelației Pearson din caseta de dialog Corelații bivariate.... În schimb, activați calculul corelației Spearman. Acest calcul va da următoarele rezultate. Coeficienții de corelație de rang sunt foarte aproape de valorile corespunzătoare ale coeficienților Pearson (variabilele originale au o distribuție normală).

titkova-matmetody.pdf p. 45

Metoda de corelare a rangului lui Spearman vă permite să determinați etanșeitatea (rezistența) și direcția

corelaţie între două semne sau două profiluri (ierarhii) semne.

Pentru a calcula corelația de rang, este necesar să existe două serii de valori,

care poate fi clasat. Aceste intervale de valori pot fi:

1) două semne măsurată în acelaşi grup subiecții de testare;

2) două ierarhii de caracteristici individuale, identificate la doua subiecte pentru acelasi

un set de caracteristici;

3) doi ierarhii de grup de caracteristici,

4) individuale si de grup ierarhia caracteristicilor.

În primul rând, indicatorii sunt clasați separat pentru fiecare dintre caracteristici.

De regulă, unei valori mai mici a unei caracteristici i se atribuie un rang inferior.

În primul caz (două caracteristici), valorile individuale sunt clasate în funcție de primul

trăsătură obținută de diferiți subiecți, iar apoi valori individuale pentru al doilea

semn.

Dacă două semne sunt legate pozitiv, atunci subiecții cu rang scăzut se află în

unul dintre ei va avea rang scăzut în celălalt, iar subiecții cu rang înalt în

una dintre trăsături va avea, de asemenea, ranguri înalte pe cealaltă trăsătură. Pentru a număra rs

este necesar să se determine diferențele (d)între rangurile obţinute de aceşti subiecţi la ambele

semne. Apoi acești indicatori d sunt transformați într-un anumit mod și scăzuți din 1. Decat

cu cât diferența dintre ranguri este mai mică, cu atât rs va fi mai mare, cu atât va fi mai aproape de +1.

Dacă nu există o corelație, atunci toate rangurile vor fi amestecate și nu va exista

nu se potrivesc. Formula este concepută astfel încât în acest caz rs să fie aproape de 0.

În caz de corelare negativă ranguri scăzute de subiecte pe o singură bază

va corespunde unor ranguri înalte pe un alt atribut și invers. Cu cât mai multe nepotriviri

între rândurile subiecților din două variabile, cu cât rs este mai aproape de -1.

În al doilea caz (două profiluri individuale), individual

valorile obținute de fiecare dintre cei 2 subiecți conform unui anumit (la fel pentru ei

ambele) un set de caracteristici. Primul rang va primi trăsătura cu cea mai mică valoare; rangul doi -

un semn cu o valoare mai mare etc. Evident, toate caracteristicile trebuie măsurate în

aceleași unități, altfel clasarea este imposibilă. De exemplu, este imposibil

clasați indicatorii conform Chestionarului de personalitate Cattell (16PF), dacă aceștia sunt exprimați în

scoruri „brute”, deoarece intervalele de valori sunt diferite pentru diferiți factori: de la 0 la 13, de la 0 la

20 și de la 0 la 26. Nu putem spune care dintre factori va ocupa primul loc în ceea ce privește

severitate, până când aducem toate valorile la o singură scară (cel mai adesea aceasta este scara pereților).

Dacă ierarhiile individuale ale două subiecți sunt legate pozitiv, atunci semnele

având ranguri mici într-una dintre ele va avea ranguri scăzute în cealaltă și invers.

De exemplu, dacă pentru un subiect factorul E (dominanța) are cel mai mic rang, atunci pentru

alt subiect, ar trebui să aibă un rang scăzut dacă un subiect are factorul C

(stabilitatea emoțională) are cel mai înalt rang, atunci trebuie să aibă și celălalt subiect

acest factor are un rang înalt și așa mai departe.

În al treilea caz (două profiluri de grup), valorile medii ale grupului sunt clasate,

primit în 2 grupe de subiecți conform unui anumit set, identic pentru două grupe

semne. În cele ce urmează, linia de raționament este aceeași ca în cele două cazuri precedente.

În cazul celui de-al 4-lea (profiluri individuale și de grup), acestea sunt clasate separat

valori individuale ale subiectului și valori medii de grup pentru același set

semne care se obțin, de regulă, cu excluderea acestui subiect individual - el

nu participă la profilul mediu de grup, cu care individul său va fi comparat

profil. Corelarea rangului vă va permite să verificați cât de consistent individul și

profiluri de grup.

În toate cele patru cazuri, semnificația coeficientului de corelație obținut este determinată de

după numărul de valori clasate N.În primul caz, acest număr va coincide cu

dimensiunea eșantionului n. În al doilea caz, numărul de observații va fi numărul de caracteristici,

constituind o ierarhie. În al treilea și al patrulea caz, N este, de asemenea, numărul de potriviri

semne, nu numărul de subiecți din grupuri. Explicații detaliate sunt date în exemple. Dacă

valoarea absolută a lui rs atinge o valoare critică sau o depășește, corelația

de încredere.

Ipoteze.

Există două ipoteze posibile. Prima se referă la cazul 1, a doua la celelalte trei

Prima versiune a ipotezelor

H0: Corelația dintre variabilele A și B nu este diferită de zero.

H2: Corelația dintre variabilele A și B este semnificativ diferită de zero.

A doua versiune a ipotezelor

H0: Corelația dintre ierarhiile A și B nu este diferită de zero.

H2: Corelația dintre ierarhiile A și B este semnificativ diferită de zero.

Limitări ale coeficientului de corelare a rangului

1. Pentru fiecare variabilă trebuie depuse cel puțin 5 observații. Superior

limita de prelevare este determinată de tabelele de valori critice disponibile .

2. Coeficientul de corelație a rangului lui Spearman rs cu un număr mare de identice

rangurile pentru una sau ambele variabile potrivite oferă valori grosiere. Perfect

ambele serii corelate trebuie să fie două secvențe de nepotrivire

valorile. Dacă această condiție nu este îndeplinită, trebuie făcută o ajustare pentru

aceleași trepte.

Coeficientul de corelare a rangului lui Spearman este calculat prin formula:

Dacă în ambele serii de clasare comparate există grupuri de aceleași ranguri,

înainte de a calcula coeficientul de corelație de rang, este necesar să se corecteze pentru același

rangurile Ta și Tv:

Ta \u003d Σ (a3 - a) / 12,

TV \u003d Σ (v3 - c) / 12,

Unde A - volumul fiecărui grup de ranguri identice din seria de rang A, în – volumul fiecăruia

grupuri de ranguri egale din seria de rang B.

Pentru a calcula valoarea empirică a lui rs, utilizați formula:

38. Coeficient de corelație biserială punctată.

Pentru corelare în general, vezi întrebarea nr.36 Cu. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Fie măsurată variabila X pe o scară puternică, iar variabila Y pe una dihotomică. Coeficientul de corelație biserială punctual rpb se calculează prin formula:

Aici x 1 este valoarea medie pentru X obiecte cu valoarea „unu” pentru Y;

x 0 - valoarea medie pentru X obiecte cu o valoare de „zero” pentru Y;

s x - abaterea standard a tuturor valorilor pentru X;

n 1 - numărul de obiecte „unul” în Y, n 0 - numărul de obiecte „zero” în Y;

n = n 1 + n 0 este dimensiunea eșantionului.

Coeficientul de corelație biserială punctual poate fi calculat și folosind alte expresii echivalente:

Aici x este valoarea medie globală a variabilei X.

Coeficientul de corelație biserială punct rpb variază de la –1 la +1. Valoarea sa este egală cu zero în cazul în care variabilele cu o unitate pentru Y au o medie Y, egal cu media variabilelor cu zero peste Y.

Examinare ipoteze de semnificație coeficientul de corelație biserială punct este de verificat ipoteza nulăh 0 despre egalitatea coeficientului de corelație generală la zero: ρ = 0, care se realizează folosind criteriul Student. Valoare empirică

comparativ cu valorile critice t A (df) pentru numărul de grade de libertate df = n– 2

Dacă condiția | t| ≤ ta(df), ipoteza nulă ρ = 0 nu este respinsă. Coeficientul de corelație biserială punctuală diferă semnificativ de zero dacă valoarea empirică | t| se încadrează în regiunea critică, adică dacă condiția | t| > ta(n– 2). Fiabilitatea relației calculată folosind coeficientul de corelație biserială punctual rpb, poate fi determinată și cu ajutorul criteriului χ 2 pentru numărul de grade de libertate df= 2.

Corelația punct-biseriala

Modificarea ulterioară a coeficientului de corelație al produsului momentelor s-a reflectat în biserial punctat r. Această statistică. arată relația dintre două variabile, dintre care una se presupune că este continuă și normal distribuită, în timp ce cealaltă este discretă în sensul exact al cuvântului. Coeficientul de corelație punct-biserial este notat cu r pbis Pentru că în r pbis dihotomia reflectă adevărata natură a variabilei discrete, și nefiind artificială, ca în cazul r bis, semnul său este determinat arbitrar. Prin urmare, pentru toate practicile obiective r pbis considerată în intervalul de la 0,00 la +1,00.

Există, de asemenea, un astfel de caz când două variabile sunt considerate a fi continue și normal distribuite, dar ambele sunt dihotomizate artificial, ca în cazul corelației biseriale. Pentru a evalua relația dintre astfel de variabile, se utilizează coeficientul de corelație tetrachoric r tet, care a fost crescut și de Pearson. Principal formule (exacte) și proceduri de calcul r tet sunt destul de complexe. Prin urmare, cu practică. această metodă utilizează aproximările r tet obţinute pe baza unor proceduri şi tabele scurtate.

/online/dictionary/dictionary.php?term=511

COEFICIENT DE CORELARE BISERIAL PUNTAT este coeficientul de corelație dintre două variabile, dintre care una este măsurată pe o scară dihotomică și cealaltă pe o scară de interval. Este folosit în testologia clasică și modernă ca indicator al calității. sarcina de testare– fiabilitate-coerență cu scorul total la test.

Pentru a corela variabilele măsurate în scară dihotomică și interval utilizare coeficientul de corelație punct-biserial.
Coeficientul de corelație punct-biserială este o metodă de analiză a corelației raportului de variabile, dintre care una este măsurată în scala de nume și ia doar 2 valori (de exemplu, bărbați / femei, răspunsul este corect / răspunsul este incorectă, există un semn / nu există semn), iar al doilea în rapoartele de scară sau scara intervalului. Formula de calcul al coeficientului de corelație punct-biserială:

Unde:
m1 și m0 sunt valorile medii ale lui X cu o valoare de 1 sau 0 în Y.
σx este abaterea standard a tuturor valorilor pentru X
n1 ,n0 – numărul de valori X de la 1 sau 0 la Y.
n este numărul total de perechi de valori

Cel mai adesea, acest tip de coeficient de corelație este utilizat pentru a calcula relația itemilor de testare cu o scală rezumativă. Acesta este un tip de verificare de validare.

39. Coeficient de corelație rang-biseriala.

Pentru corelare în general, vezi întrebarea nr.36 Cu. 56 (64) 063.JPG

harchenko-korranaliz.pdf p. 28

Coeficientul de corelație rang-biserial utilizat atunci când una dintre variabile ( X) este prezentat într-o scară ordinală, iar celălalt ( Y) - în dihotomic, calculat prin formula

Aici este rangul mediu al obiectelor care au unitate Y; este rangul mediu al obiectelor cu zero in Y, n este dimensiunea eșantionului.

Examinare ipoteze de semnificație coeficientul de corelație rang-biserială se realizează în mod similar cu coeficientul de corelație biserială punctuală folosind testul t Student cu înlocuire în formule rpb pe rrb.

Când o variabilă este măsurată pe o scară dihotomică (variabilă X), iar celălalt în scala de rang (variabila Y), folosind coeficientul de corelație rang-biseriala. Ne amintim că variabila X, măsurat pe o scară dihotomică, ia doar două valori (coduri) 0 și 1. Să subliniem în special că, în ciuda faptului că acest coeficient variază în intervalul de la –1 la +1, semnul său nu contează pentru interpretarea rezultate. Aceasta este o altă excepție de la regula generală.

Calculul acestui coeficient se face dupa formula:

unde ` X 1– rang mediu asupra acelor elemente ale variabilei Y, care corespunde codului (funcției) 1 din variabilă X;

`X 0 – rang mediu pentru acele elemente ale variabilei Y, care corespunde codului (funcției) 0 din variabilă X\

N- numărul total de elemente din variabilă X.

Pentru aplicarea coeficientului de corelație rang-biserială trebuie îndeplinite următoarele condiții:

1. Variabilele care se compară trebuie măsurate pe diferite scale: unu X-într-o scară dihotomică; un alt Y–în scala de clasare.

2. Numărul de caracteristici diferite în variabilele comparate Xși Y ar trebui să fie la fel.

3. Pentru a evalua nivelul de fiabilitate al coeficientului de corelație rang-biserială, trebuie să folosiți formula (11.9) și tabelul de valori critice pentru testul Student atunci când k = n - 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Cazurile în care una dintre variabile este prezentă scară dihotomică, iar celălalt în rang (ordinal), necesită utilizarea coeficient de corelație rang-biseriala:

rpb=2 / n * (m1 - m0)

Unde:
n este numărul de obiecte măsurate
m1 și m0 - rangul mediu al obiectelor cu 1 sau 0 în a doua variabilă.
Acest coeficient este utilizat și la verificarea validității testelor.

40. Coeficient de corelație liniară.

Despre corelație în general (și despre corelația liniară în special), vezi întrebarea nr. 36 Cu. 56 (64) 063.JPG

COEFICIENTUL DE CORELATIE AL D-lui PEARSON

r-Pearson (Pearson r) este folosit pentru a studia relația dintre două metricialte variabile măsurate pe același eșantion. Există multe situații în care este oportun să-l folosești. Inteligența afectează performanța în anii de studii superioare? Mărimea salariului unui angajat este legată de bunăvoința acestuia față de colegi? Afectează starea de spirit a unui elev succesul rezolvării unei probleme complexe de aritmetică? Pentru a răspunde la astfel de întrebări, cercetătorul trebuie să măsoare doi indicatori de interes pentru fiecare membru al eșantionului. Datele pentru a studia relația sunt apoi tabulate, ca în exemplul de mai jos.

EXEMPLU 6.1

Tabelul prezintă un exemplu de date de măsurare inițială pentru doi indicatori de inteligență (verbal și non-verbal) la 20 de elevi din clasa a VIII-a.

Relația dintre aceste variabile poate fi descrisă folosind o diagramă de împrăștiere (vezi Figura 6.3). Diagrama arată că există o anumită relație între indicatorii măsurați: cu cât valoarea inteligenței verbale este mai mare, cu atât (în principal) este mai mare valoarea inteligenței non-verbale.

Înainte de a da formula pentru coeficientul de corelație, să încercăm să urmărim logica apariției acestuia, folosind datele din Exemplul 6.1. Poziția fiecărui punct / (subiect cu numărul /) pe diagrama de împrăștiere în raport cu celelalte puncte (Fig. 6.3) poate fi dată de mărimile și semnele abaterilor valorilor corespunzătoare ale variabilelor de la acestea. valori medii: (xj - MJ și (minte la ). Dacă semnele acestor abateri coincid, atunci aceasta indică în favoarea unei relații pozitive (valori mari pentru X corespund unor valori mari la sau valori mai mici pentru X corespund unor valori mai mici y).

Pentru subiectul nr.1, abaterea de la medie Xși prin la pozitiv, iar pentru subiectul nr. 3 ambele abateri sunt negative. În consecință, datele ambelor indică o relație pozitivă între trăsăturile studiate. Dimpotrivă, dacă semnele abaterilor de la medie Xși prin la diferă, aceasta va indica o relație negativă între semne. Astfel, pentru subiectul nr.4, abaterea de la medie X este negativ, conform y - pozitiv, iar pentru subiectul nr. 9 - invers.

Astfel, dacă produsul abaterilor (x, - M X ) X (minte la ) pozitiv, atunci datele subiectului / indică o relație directă (pozitivă), iar dacă este negativă, atunci o relație inversă (negativă). În consecință, dacă Xwy sunt în mare parte direct proporționale, atunci majoritatea produselor abaterilor vor fi pozitive, iar dacă sunt legate invers, atunci majoritatea produselor vor fi negative. Prin urmare, suma tuturor produselor abaterilor pentru un eșantion dat poate servi ca un indicator general pentru puterea și direcția relației:

Cu o relație direct proporțională între variabile, această valoare este mare și pozitivă - pentru majoritatea subiecților, abaterile coincid în semn (valorile mari ale unei variabile corespund valorilor mari ale celeilalte variabile și invers). Dacă Xși la au feedback, atunci pentru majoritatea subiecților, valorile mari ale unei variabile vor corespunde cu valori mai mici ale altei variabile, adică semnele produselor vor fi negative, iar suma produselor în ansamblu va fi, de asemenea, mare. în valoare absolută, dar negativ în semn. Dacă nu există o relație sistematică între variabile, atunci termenii pozitivi (produșii abaterilor) vor fi echilibrați de termeni negativi, iar suma tuturor produselor abaterilor va fi aproape de zero.

Pentru ca suma produselor să nu depindă de dimensiunea eșantionului, este suficient să o medieți. Dar ne interesează măsura relației nu ca un parametru general, ci ca o estimare calculată a acesteia - statistici. Prin urmare, în ceea ce privește formula de dispersie, în acest caz vom face același lucru, împărțim suma produselor abaterilor nu la N, iar la televizor - 1. Se dovedește o măsură a comunicării, utilizată pe scară largă în fizică și științe tehnice, care se numește covarianta (Covahance):

psihologie, spre deosebire de fizică, majoritatea variabilelor sunt măsurate pe scale arbitrare, deoarece psihologii nu sunt interesați de valoarea absolută a atributului, ci aranjament reciproc subiecții de testare din grup. În plus, covarianța este foarte sensibilă la scara (dispersia) în care sunt măsurate caracteristicile. Pentru a face măsura comunicării independentă de unitățile de măsură ale fiecărui atribut, este suficient să împărțiți covarianța în abaterile standard corespunzătoare. Astfel, s-a obținut pentru-Coeficientul de corelație al lui K. Pearson:

sau, după înlocuirea expresiilor pentru o x și

Dacă valorile ambelor variabile au fost convertite în valori r folosind formula

atunci formula coeficientului de corelație r-Pearson pare mai simplă (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

CORELAȚIE LINEARĂ- relație liniară statistică non-cauzoală între două variabile cantitative Xși la. Măsurat folosind „factorul K.L.” Pearson, care este rezultatul împărțirii covarianței la abaterile standard ale ambelor variabile:

Unde s X y- covarianta intre variabile Xși la;

s X , s y- abateri standard pentru variabile Xși la;

X i , y i- valori variabile Xși la pentru numărul obiectului i;

X, y- medii aritmetice pentru variabile Xși la.

Raportul lui Pearson r poate lua valori din intervalul [-1; +1]. Sens r = 0înseamnă că nu există o relație liniară între variabile Xși la(dar nu exclude o relație statistică neliniară). Valori pozitive ale coeficientului ( r> 0) indică o relație liniară directă; cu cât valoarea sa este mai aproape de +1, cu atât este mai puternică relația statistică directă. Valori negative ale coeficientului ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 înseamnă prezența unei conexiuni liniare complete, directă sau inversă. În cazul unei conexiuni complete, toate punctele cu coordonate ( X i , y i) se întinde pe o linie dreaptă y = A + bx.

"Coeficientul K.L." Pearson este, de asemenea, folosit pentru a măsura strângerea relației în modelul de regresie liniară pereche.

41. Matricea de corelație și graficul de corelație.

Pentru corelare în general, vezi întrebarea nr.36 Cu. 56 (64) 063.JPG

matricea de corelare. Adesea, analiza corelației include studiul relației nu a două, ci a multor variabile măsurate pe o scară cantitativă pe un singur eșantion. În acest caz, corelațiile sunt calculate pentru fiecare pereche a acestui set de variabile. Calculele sunt de obicei efectuate pe un computer, iar rezultatul este o matrice de corelare.

Matricea de corelație(corelație matrice) este rezultatul calculării corelațiilor de același tip pentru fiecare pereche din mulțime R variabile măsurate la o scară cantitativă pe un eșantion.

EXEMPLU

Să presupunem că studiem relațiile dintre 5 variabile (vl, v2,..., v5; P= 5), măsurată pe o probă de N=30 uman. Mai jos este un tabel cu datele inițiale și o matrice de corelație.

Și
date aferente:

Matricea de corelație:

Este ușor de observat că matricea de corelație este pătrată, simetrică față de diagonala principală (takkakg, y = /) y), cu unități pe diagonala principală (deoarece G și = Gu = 1).

Matricea de corelație este pătrat: numărul de rânduri și coloane este egal cu numărul de variabile. Ea simetric relativ la diagonala principală, din moment ce corelația X Cu la este egală cu corelația la Cu X. Unitățile sunt situate pe diagonala sa principală, deoarece corelația unei caracteristici cu ea însăși este egală cu una. În consecință, nu toate elementele matricei de corelație sunt supuse analizei, ci cele care se află deasupra sau sub diagonala principală.

Numărul de coeficienți de corelație, Caracteristicile P care trebuie analizate în studiul relațiilor sunt determinate de formula: P(P- 1)/2. În exemplul de mai sus, numărul acestor coeficienți de corelație este 5(5 - 1)/2 = 10.

Sarcina principală a analizei matricei de corelație este dezvăluind structura interrelaţiilor unui set de trăsături. Acest lucru permite analiza vizuală pleiade de corelare- imagine grafică structuri din punct de vedere statisticconexiuni semnificative dacă nu sunt foarte multe astfel de conexiuni (până la 10-15). O altă modalitate este utilizarea metodelor multivariate: regresie multiplă, analiză factorială sau cluster (vezi secțiunea „Metode multivariate...”). Folosind analiza factorială sau cluster, este posibil să se identifice grupări de variabile care sunt mai strâns legate între ele decât cu alte variabile. O combinație a acestor metode este, de asemenea, foarte eficientă, de exemplu, dacă există multe semne și nu sunt omogene.

Comparația corelațiilor - o sarcină suplimentară de analiză a matricei de corelație, care are două opțiuni. Dacă este necesară compararea corelațiilor într-unul din rândurile matricei de corelație (pentru una dintre variabile), se aplică metoda de comparare pentru eșantioanele dependente (pp. 148-149). La compararea corelațiilor cu același nume calculate pentru probe diferite, se folosește metoda de comparare pentru eșantioane independente (pp. 147-148).

Metode de comparare corelații în diagonale matrice de corelație (pentru aprecierea staționarității unui proces aleatoriu) și comparare mai multe matricele de corelație obținute pentru diferite eșantioane (pentru omogenitatea lor) necesită timp și depășesc scopul acestei cărți. Puteți face cunoștință cu aceste metode din cartea lui GV Sukhodolsky 1 .

Problemă semnificație statistică corelații. Problema este că procedura verificare statistică sugerează ipoteza unu-multiplu test efectuat pe o probă. Dacă se aplică aceeași metodă multe ori, chiar dacă în raport cu diferite variabile, atunci probabilitatea obținerii unui rezultat pur întâmplător crește. LA caz general dacă repetăm aceeași metodă de testare a ipotezelor la vremuriîn raport cu diferite variabile sau eșantioane, apoi cu valoarea stabilită a lui a, suntem garantați că vom primi confirmarea ipotezei în ahk numarul de cazuri.

Să presupunem că se analizează matricea de corelație pentru 15 variabile, adică se calculează 15(15-1)/2 = 105 coeficienți de corelație. Pentru a testa ipotezele, se stabilește nivelul a = 0,05. Testând ipoteza de 105 ori, vom obține confirmarea acesteia de cinci ori (!), indiferent dacă conexiunea există într-adevăr. Știind acest lucru și primind, să zicem, 15 coeficienți de corelație „semnificativi statistic”, putem spune care dintre ei sunt obținuți întâmplător și care reflectă o relație reală?

Strict vorbind, a accepta solutie statistica este necesar să se reducă nivelul a de câte ori sunt testate ipotezele. Dar acest lucru nu este recomandabil, deoarece probabilitatea de a ignora o conexiune cu adevărat existentă (a face o eroare de tip II) crește într-un mod imprevizibil.

Numai matricea de corelație nu este o bază suficientăpentru concluzii statistice privind coeficienții individuali incluși în acestacorelatii!

Există o singură modalitate cu adevărat convingătoare de a rezolva această problemă: împărțiți eșantionul în mod aleatoriu în două părți și luați în considerare doar acele corelații care sunt semnificative statistic în ambele părți ale eșantionului. O alternativă poate fi utilizarea metodelor multivariate (analiza factorială, cluster sau regresie multiplă) - pentru selectarea și interpretarea ulterioară a grupurilor de variabile înrudite semnificativ statistic.

Problema valorilor lipsă. Dacă în date lipsesc valori, atunci sunt posibile două opțiuni pentru calcularea matricei de corelație: a) ștergerea linie cu linie a valorilor (excludecazurilistwise); b) ștergerea perechi a valorilor (excludecazuriperechi). La ștergere rând cu linie observații cu goluri, se șterge întreaga linie pentru obiectul (subiectul) care are cel puțin o valoare lipsă pentru una dintre variabile. Această metodă conduce la o matrice de corelație „corectă” în sensul că toți coeficienții sunt calculați din același set de obiecte. Cu toate acestea, dacă valorile lipsă sunt distribuite aleatoriu în variabile, atunci această metodă poate duce la faptul că în setul de date considerat nu va mai rămâne un singur obiect (fiecare linie va conține cel puțin o valoare lipsă). Pentru a evita această situație, utilizați o altă metodă numită îndepărtarea în perechi. Această metodă ia în considerare doar golurile din fiecare pereche selectată de coloane variabile și ignoră golurile din alte variabile. Corelația pentru o pereche de variabile este calculată pentru acele obiecte în care nu există goluri. În multe situații, mai ales când numărul de goluri este relativ mic, să zicem 10%, iar decalajele sunt distribuite destul de aleatoriu, această metodă nu duce la erori grave. Cu toate acestea, uneori, acesta nu este cazul. De exemplu, în părtinirea (deplasarea) sistematică a estimării, locația sistematică a golurilor poate fi „ascunsă”, ceea ce este motivul diferenței dintre coeficienții de corelație construiți pe diferite subseturi (de exemplu, pentru diferite subgrupuri de obiecte). ). O altă problemă asociată cu matricea de corelație calculată cu in perechi eliminarea decalajului are loc atunci când se utilizează această matrice în alte tipuri de analiză (de exemplu, în regresia multiplă sau analiza factorilor). Ei presupun că o matrice de corelație „corectă” este utilizată cu un anumit nivel de consistență și „corespondență” a diferiților coeficienți. Utilizarea unei matrice cu estimări „proaste” (părtinitoare) duce la faptul că programul fie nu poate analiza o astfel de matrice, fie rezultatele vor fi eronate. Prin urmare, dacă se utilizează o metodă perechi de eliminare a datelor lipsă, este necesar să se verifice dacă există sau nu modele sistematice în distribuția golurilor.

Dacă eliminarea în perechi a datelor lipsă nu duce la nicio schimbare sistematică a mediilor și a variațiilor (abateri standard), atunci aceste statistici vor fi similare cu cele calculate cu metoda linie cu linie de eliminare a golurilor. Dacă există o diferență semnificativă, atunci există motive să presupunem că există o schimbare în estimări. De exemplu, dacă media (sau abaterea standard) a valorilor variabilei ȘI, care a fost folosit la calcularea corelaţiei sale cu variabila LA, mult mai mică decât media (sau abaterea standard) a acelorași valori ale variabilei ȘI, care au fost utilizate în calcularea corelației sale cu variabila C, atunci există toate motivele să ne așteptăm ca aceste două corelații (A-Bne) bazate pe diferite subseturi de date. Va exista o schimbare a corelațiilor cauzată de localizarea non-aleatorie a golurilor în valorile variabilelor.

Analiza pleiadelor de corelație. După rezolvarea problemei semnificației statistice a elementelor matricei de corelație, corelațiile semnificative statistic pot fi reprezentate grafic sub forma unei pleiade sau pleiade de corelație. Galaxia de corelație - este o figură formată din vârfuri și linii care le unesc. Vârfurile corespund caracteristicilor și sunt de obicei notate cu numere - numerele variabilelor. Liniile corespund unor relații semnificative statistic și exprimă grafic semnul și, uneori, nivelul de semnificație /j al relației.

Galaxia de corelație poate reflecta Toata lumea relații semnificative statistic ale matricei de corelație (uneori numite graficul de corelare ) sau numai partea lor selectată în mod semnificativ (de exemplu, corespunzătoare unui factor conform rezultatelor analizei factorilor).

EXEMPLU DE CONSTRUIRE A UNEI CORELATII PLEIADI

Pregătirea pentru certificarea de stat (finală) a absolvenților: formarea bazei de date USE (lista generală a participanților USE de toate categoriile, cu indicarea subiectelor) - luarea în considerare a zilelor de rezervă în caz de coincidență a disciplinelor;

Plan de lucru (27)

Decizie

2. Activitățile instituției de învățământ pentru a îmbunătăți conținutul și a evalua calitatea disciplinelor de educație naturală și matematică MOU școala secundară nr. 4, Litvinovskaya, Chapaevskaya,

Metoda de corelare a rangului lui Spearman vă permite să determinați strângerea (rezistența) și direcția corelației dintre două caracteristici sau două profiluri (ierarhii) de caracteristici.

Pentru a calcula corelația de rang, este necesar să existe două serii de valori,

care poate fi clasat. Aceste intervale de valori pot fi:

1) două semne măsurate în același grup de subiecți;

2) două ierarhii individuale de trăsături identificate la doi subiecți pentru același set de trăsături;

3) două ierarhii de grup de caracteristici,

4) ierarhii individuale și de grup de caracteristici.

În primul rând, indicatorii sunt clasați separat pentru fiecare dintre caracteristici.

De regulă, unei valori mai mici a unei caracteristici i se atribuie un rang inferior.

În primul caz (două caracteristici), sunt clasate valorile individuale pentru prima caracteristică, obținute de diferiți subiecți, iar apoi valorile individuale pentru a doua caracteristică.

Dacă două atribute sunt legate pozitiv, atunci subiecții cu ranguri scăzute într-una dintre ele vor avea ranguri scăzute în celălalt, iar subiecții cu ranguri ridicate în

una dintre trăsături va avea, de asemenea, ranguri înalte pe cealaltă trăsătură. Pentru a calcula rs, este necesar să se determine diferența (d) dintre rangurile obținute de subiectul dat din ambele motive. Apoi acești indicatori d sunt transformați într-un anumit mod și scăzuți din 1. Decat

cu cât diferența dintre ranguri este mai mică, cu atât rs va fi mai mare, cu atât va fi mai aproape de +1.

Dacă nu există o corelație, atunci toate rangurile vor fi amestecate și nu va exista

nu se potrivesc. Formula este concepută astfel încât în acest caz rs să fie aproape de 0.

În cazul unei corelații negative, rangurile scăzute ale subiecților pe un singur atribut

va corespunde unor ranguri înalte pe un alt atribut și invers. Cu cât discrepanța dintre rangurile subiecților pe două variabile este mai mare, cu atât rs este mai aproape de -1.

În al doilea caz (două profiluri individuale), individual

valorile obținute de fiecare dintre cei 2 subiecți conform unui anumit set de caracteristici (același pentru ambii). Primul rang va primi trăsătura cu cea mai mică valoare; al doilea rang este o caracteristică cu o valoare mai mare și așa mai departe. Evident, toate caracteristicile trebuie măsurate în aceleași unități, altfel clasarea este imposibilă. De exemplu, este imposibil să se clasifice indicatorii conform Chestionarului de personalitate Cattell (16PF), dacă aceștia sunt exprimați în scoruri „brute”, deoarece intervalele de valori pentru diferiți factori sunt diferite: de la 0 la 13, de la 0 la

20 și de la 0 la 26. Nu putem spune care dintre factori va ocupa primul loc în ceea ce privește severitatea până când nu aducem toate valorile la o singură scară (cel mai adesea aceasta este scara de perete).

Dacă ierarhiile individuale ale două subiecți sunt legate pozitiv, atunci trăsăturile care au ranguri scăzute pentru unul dintre ei vor avea ranguri scăzute pentru celălalt și invers. De exemplu, dacă pentru un subiect factorul E (dominanța) are cel mai scăzut rang, atunci pentru un alt subiect ar trebui să aibă un rang scăzut, dacă un subiect are factorul C

(stabilitatea emoțională) are cel mai înalt rang, atunci trebuie să aibă și celălalt subiect

acest factor are un rang înalt și așa mai departe.

În al treilea caz (două profiluri de grup), valorile medii ale grupului obținute în 2 grupuri de subiecți sunt clasificate în funcție de un anumit set de caracteristici care este același pentru două grupuri. În cele ce urmează, linia de raționament este aceeași ca în cele două cazuri precedente.

În cazul celui de-al patrulea (profiluri individuale și de grup), valorile individuale ale subiectului și valorile medii ale grupului sunt clasate separat în funcție de același set de caracteristici care se obțin, de regulă, prin excluderea acestui individ. subiect - nu participă la profilul mediu de grup, cu care va fi comparat.profil individual. Corelarea rangului vă va permite să verificați cât de consistente sunt profilurile individuale și de grup.

În toate cele patru cazuri, semnificația coeficientului de corelație obținut este determinată de numărul de valori clasate N. În primul caz, acest număr va coincide cu dimensiunea eșantionului n. În al doilea caz, numărul de observații va fi numărul de caracteristici care alcătuiesc ierarhia. În al treilea și al patrulea caz, N este, de asemenea, numărul de caracteristici comparate, și nu numărul de subiecți din grupuri. Explicații detaliate sunt date în exemple. Dacă valoarea absolută a lui rs atinge sau depășește o valoare critică, corelația este semnificativă.

Ipoteze.

Există două ipoteze posibile. Primul se referă la cazul 1, al doilea la celelalte trei cazuri.

Prima versiune a ipotezelor

H0: Corelația dintre variabilele A și B nu este diferită de zero.

H1: Corelația dintre variabilele A și B este semnificativ diferită de zero.

A doua versiune a ipotezelor

H0: Corelația dintre ierarhiile A și B nu este diferită de zero.

H1: Corelația dintre ierarhiile A și B este semnificativ diferită de zero.

Limitări ale coeficientului de corelare a rangului

1. Pentru fiecare variabilă trebuie depuse cel puțin 5 observații. Limita superioară a probei este determinată de tabelele disponibile de valori critice.

2. Coeficientul de corelare a rangului lui Spearman rs cu un număr mare de ranguri identice pentru una sau ambele variabile comparate dă valori grosiere. În mod ideal, ambele serii corelate ar trebui să fie două secvențe de valori nepotrivite. Dacă această condiție nu este îndeplinită, este necesar să se facă o ajustare pentru aceleași ranguri.

Coeficientul de corelare a rangului lui Spearman este calculat prin formula:

Dacă în ambele serii de ranguri comparate există grupuri de aceleași ranguri, înainte de a calcula coeficientul de corelare a rangului, este necesar să se facă corecții pentru aceleași ranguri Ta și Tv:

Ta \u003d Σ (a3 - a) / 12,

TV \u003d Σ (v3 - c) / 12,

unde a este volumul fiecărui grup de ranguri identice din seria de ranguri A, c este volumul fiecăruia

grupuri de ranguri egale din seria de rang B.

Pentru a calcula valoarea empirică a lui rs, utilizați formula:

Calculul coeficientului de corelație a rangului lui Spearman rs

1. Stabiliți la care două caracteristici sau două ierarhii de caracteristici vor participa

comparație ca variabile A și B.

2. Clasificați valorile variabilei A, atribuind rangul 1 celei mai mici valori, în conformitate cu regulile de clasare (vezi A.2.3). Introduceți rangurile în prima coloană a tabelului în ordinea numerelor subiectelor sau semnelor.

3. Ordonați valorile variabilei B, în conformitate cu aceleași reguli. Introduceți rangurile în a doua coloană a tabelului în ordinea numerelor subiectelor sau semnelor.

5. Patratează fiecare diferență: d2. Introduceți aceste valori în a patra coloană a tabelului.

Ta \u003d Σ (a3 - a) / 12,

TV \u003d Σ (v3 - c) / 12,

unde a este volumul fiecărui grup de ranguri identice din rândul de rang A; c - volumul fiecărei grupe

aceleași locuri în clasamentul seria B.

a) în lipsa unor ranguri identice

rs  1 − 6 ⋅

b) în prezenţa aceloraşi trepte

Σd 2  T  T

r  1 − 6 ⋅ a în,

unde Σd2 este suma diferențelor pătrate dintre rânduri; Ta și TV sunt corecții pentru același lucru

N este numărul de subiecte sau caracteristici care au participat la clasament.

9. Determinați din Tabel (vezi Anexa 4.3) valorile critice ale rs pentru un N dat. Dacă rs este mai mare sau cel puțin egal cu valoarea critică, corelația este semnificativ diferită de 0.

Exemplul 4.1 La determinarea gradului de dependență a reacției consumului de alcool de reacția oculomotorie în lotul testat, s-au obținut date înainte de consumul de alcool și după băut. Reacția subiectului depinde de starea de ebrietate?

Rezultatele experimentului:

Înainte: 16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. După: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Să formulăm ipoteze:

H0: corelația dintre gradul de dependență al reacției înainte de consumul de alcool și după consum nu diferă de zero.

H1: corelația dintre gradul de dependență al reacției înainte de consumul de alcool și după consum este semnificativ diferită de zero.

Tabelul 4.1. Calculul lui d2 pentru coeficientul de corelație a rangului Spearman rs atunci când se compară parametrii reacției oculomotorii înainte și după experiment (N=17)


	valorile		valorile

Deoarece avem ranguri duplicat, în acest caz vom aplica formula ajustată pentru aceleași ranguri:

Ta= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

Tb =((23-2)+(23-2)+(33-3))/12=3

Găsiți valoarea empirică a coeficientului Spearman:

rs = 1- 6*((767,75+6+3)/(17*(172-1)))=0,05

Conform tabelului (Anexa 4.3) găsim valorile critice ale coeficientului de corelație

0,48 (p ≤ 0,05)

0,62 (p ≤ 0,01)

Primim

rs=0,05∠rcr(0,05)=0,48

Concluzie: ipoteza H1 este respinsă și H0 este acceptată. Acestea. corelație între grad

dependența reacției înainte de consumul de alcool și după nu diferă de zero.

Disciplina" matematică superioară„provoacă o oarecare respingere, deoarece cu adevărat nu toată lumea o poate înțelege. Dar cei care au norocul să studieze acest subiect și să rezolve probleme folosind diverse ecuații și coeficienți se pot lăuda cu cunoașterea aproape completă a acestuia. stiinta psihologica nu există doar o orientare umanitară, ci și anumite formule și metode de verificare matematică a ipotezei propuse în cursul cercetării. Pentru aceasta, se aplică diverși coeficienți.

Coeficientul de corelație al lui Spearman

Aceasta este o măsurătoare obișnuită pentru a determina proximitatea relației dintre oricare două caracteristici. Coeficientul se mai numește și metoda neparametrică. Afișează statistici de conexiune. Adică știm, de exemplu, că la un copil, agresivitatea și iritabilitatea sunt legate, iar coeficientul de corelare a rangului Spearman arată relația statistică matematică a acestor două trăsături.

Cum se calculează coeficientul de clasare?

Desigur, toate definițiile sau mărimile matematice au propriile formule prin care sunt calculate. Are și coeficientul de corelație Spearman. Formula sa este următoarea:

La prima vedere, formula nu este complet clară, dar dacă te uiți, totul este foarte ușor de calculat:

n este numărul de caracteristici sau indicatori care sunt clasați.
d este diferența dintre anumite două ranguri corespunzătoare celor două variabile specifice fiecărui subiect.
∑d 2 este suma tuturor diferențelor pătrate ale rangurilor caracteristicilor, ale căror pătrate sunt calculate separat pentru fiecare rang.

Domeniul de aplicare al măsurii matematice a conexiunii

Pentru aplicarea coeficientului de rang este necesar ca datele cantitative ale trăsăturii să fie ierarhizate, adică li s-a atribuit un anumit număr în funcție de locul unde se află trăsătura și de valoarea acesteia. Se dovedește că două rânduri de semne, exprimate în formă numerică, sunt oarecum paralele între ele. Coeficientul de corelare a rangului lui Spearman determină gradul acestui paralelism, strângerea relației de trăsături.

Pentru o operație matematică pentru a calcula și determina relația dintre caracteristici folosind coeficientul specificat, trebuie să efectuați câteva acțiuni:

Fiecărei valori a oricărui subiect sau fenomen i se atribuie un număr în ordine - un rang. Poate corespunde valorii fenomenului în ordine crescătoare și descrescătoare.
În continuare, rangurile valorilor semnelor a două serii cantitative sunt comparate pentru a determina diferența dintre ele.
Într-o coloană separată a tabelului, pentru fiecare diferență obținută se scrie pătratul acesteia, iar rezultatele sunt rezumate mai jos.
După acești pași, se aplică o formulă prin care se calculează coeficientul de corelație Spearman.

Proprietățile coeficientului de corelație

Principalele proprietăți ale coeficientului Spearman includ următoarele:

Măsurarea valorilor între -1 și 1.
Semnul coeficientului de interpretare are nr.
Apropierea conexiunii este determinată de principiul: cu cât valoarea este mai mare, cu atât este mai strânsă legătura.

Cum se verifică valoarea primită?

Pentru a verifica relația dintre semne, trebuie să efectuați anumite acțiuni:

Se propune ipoteza nulă (H0), care este și cea principală, apoi se formulează o alta, alternativă primei (H 1). Prima ipoteză ar fi că coeficientul de corelație Spearman este 0, ceea ce înseamnă că nu va exista nicio legătură. Al doilea, dimpotrivă, spune că coeficientul nu este egal cu 0, atunci există o legătură.
Următorul pas este găsirea valorii observate a criteriului. Se găsește prin formula de bază a coeficientului Spearman.
În continuare, se găsesc valorile critice ale criteriului dat. Acest lucru se poate face numai cu ajutorul unui tabel special, care afișează diferite valori pentru indicatorii dați: nivelul de semnificație (l) și numărul care determină (n).
Acum trebuie să comparăm cele două valori primite: observabila stabilită, precum și cea critică. Pentru a face acest lucru, trebuie să construiți o regiune critică. Este necesar să trasați o linie dreaptă, marcați pe ea punctele valorii critice a coeficientului cu semnul „-” și cu semnul „+”. În stânga și în dreapta valorilor critice, regiunile critice sunt trasate în semicercuri de la puncte. În mijloc, combinând două valori, este marcat cu un semicerc al OPG.
După aceea, se face o concluzie despre strânsoarea relației dintre cele două trăsături.

Unde este cel mai bun loc pentru a folosi această valoare?

Prima știință în care acest coeficient a fost utilizat în mod activ a fost psihologia. La urma urmei, aceasta este o știință care nu se bazează pe numere, totuși, pentru a demonstra orice ipoteză importantă privind dezvoltarea relațiilor, trăsăturile de caracter ale oamenilor, cunoștințele elevilor, este necesară confirmarea statistică a concluziilor. Este folosit și în economie, în special, în tranzacțiile valutare. Aici sunt evaluate caracteristicile fără statistici. Coeficientul de corelare a rangului lui Spearman este foarte convenabil în acest domeniu de aplicare, deoarece evaluarea se face independent de distribuția variabilelor, deoarece acestea sunt înlocuite cu un număr de rang. Coeficientul Spearman este utilizat în mod activ în bancar. Sociologia, știința politică, demografia și alte științe îl folosesc și ele în cercetările lor. Rezultatele se obțin rapid și cât mai precis posibil.

Folosit convenabil și rapid coeficientul de corelație al lui Spearman în Excel. Există funcții speciale aici care vă ajută să obțineți rapid valorile necesare.

Ce alți coeficienți de corelație există?

Pe lângă ceea ce am aflat despre coeficientul de corelație Spearman, există și diverse coeficienți de corelare, permițând măsurarea, evaluarea trăsăturilor calitative, a relației dintre trăsăturile cantitative, a proximității relației dintre ele, prezentate într-o scală de rang. Aceștia sunt astfel de coeficienți precum bis-serial, rank-bis-serial, conținut, asocieri și așa mai departe. Coeficientul Spearman arată etanșeitatea conexiunii foarte precis, spre deosebire de toate celelalte metode de determinare matematică a acesteia.

Corelația rangului lui Spearman(corelație de rang). Corelația de rang a lui Spearman este cea mai simplă modalitate de a determina gradul de asociere între factori. Denumirea metodei indică faptul că relația este determinată între ranguri, adică seria valorilor cantitative obținute, clasate în ordine descrescătoare sau crescătoare. Trebuie avut în vedere că, în primul rând, corelarea rangului nu este recomandată dacă legătura de perechi este mai mică de patru și mai mare de douăzeci; în al doilea rând, corelarea rangului vă permite să determinați relația într-un alt caz, dacă valorile sunt semi-cantitative, adică nu au o expresie numerică, reflectă o succesiune clară a acestor valori; în al treilea rând, este recomandabil să se folosească corelația de rang în cazurile în care este suficientă obținerea de date aproximative. Un exemplu de calcul al coeficientului de corelație de rang pentru a determina întrebarea: chestionarul măsoară X și Y calități personale similare ale subiecților. Cu ajutorul a două chestionare (X și Y), care necesită răspunsuri alternative „da” sau „nu”, s-au obținut rezultatele primare – răspunsurile a 15 subiecți (N = 10). Rezultatele au fost prezentate ca sumă a răspunsurilor afirmative separat pentru Chestionarul X și Chestionarul B. Aceste rezultate sunt rezumate în Tabelul 1. 5.19.

Tabelul 5.19. Tabelarea rezultatelor primare pentru a calcula coeficientul de corelare a rangului Spearman (p) *

Analiza matricei de corelație sumară. Metoda de corelare a pleiadelor.

Exemplu. În tabel. 6.18 arată interpretarea a unsprezece variabile care sunt testate conform metodei Wechsler. Datele au fost obținute pe un eșantion omogen de vârste cuprinse între 18 și 25 de ani (n = 800).

Înainte de stratificare, este recomandabil să se ierarhească matricea de corelație. Pentru a face acest lucru, în matricea originală, se calculează valorile medii ale coeficienților de corelație ai fiecărei variabile cu toate celelalte.

Apoi conform tabelului. 5.20 se determină nivelurile admisibile de stratificare a matricei de corelație pentru date nivel de încredere 0,95 și n - cantități

Tabelul 6.20. Matricea de corelație ascendentă

Variabile	1	2	3	4	ar	0	7	8	0	10	11	M (rij)	Rang
1	1	0,637	0,488	0,623	0,282	0,647	0,371	0,485	0,371	0,365	0,336	0,454	1
2		1	0,810	0,557	0,291	0,508	0,173	0,486	0,371	0,273	0,273	0,363	4
3			1	0,346	0,291	0,406	0,360	0,818	0,346	0,291	0,282	0,336	7
4				1	0,273	0,572	0,318	0,442	0,310	0,318	0,291	0,414	3
5					1	0,354	0,254	0,216	0,236	0,207	0,149	0,264	11
6						1	0,365	0,405	0,336	0,345	0,282	0,430	2
7							1	0,310	0,388	0,264	0,266	0,310	9
8								1	0,897	0,363	0,388	0,363	5
9									1	0,388	0,430	0,846	6
10										1	0,336	0,310	8
11											1	0,300	10

Denumiri: 1 - conștientizare generală; 2 - conceptualitate; 3 - atentie; 4 - generalizare vdatnist K; b - memorare directă (în cifre) 6 - nivelul de dezvoltare limbă maternă; 7 - viteza de stăpânire a abilităților senzoriomotorii (codificare prin simboluri);8 - observație; 9 - abilități combinatorii (pentru analiză și sinteză) 10 - capacitatea de a organiza părți într-un întreg semnificativ; 11 - capacitatea de sinteză euristică; M (rij) - valoarea medie a coeficienților de corelație ai variabilei cu restul variabilelor de observație (în cazul nostru n = 800): r (0) - valoarea planului „de tăiere” zero - valoarea minimă semnificativă absolută valoarea coeficientului de corelare (n - 120, r (0) = 0,236, n = 40, r(0) = 0,407) | Δr | - treapta de separare admisibilă (n = 40, | Δr | = 0,558) c - numărul admisibil de niveluri de separare (n = 40, s = 1; n = 120, s = 2); r(1), r(2), ..., r(9) este valoarea absolută a planului de tăiere (n=40, r(1)=0,965).

Pentru n = 800, găsim valoarea lui rtip și limitele ri, după care Stratificarea a variat matricea de corelație, evidențiind pleiadele de corelație din interiorul straturilor, sau separă părțile matricei de corelație, trasând uniunile pleiadelor de corelație pentru straturile supraiacente (Fig. 5.5).

O analiză semnificativă a pleiadelor obținute depășește limitele statisticii matematice. Trebuie remarcați doi indicatori formali care ajută la interpretarea semnificativă a Pleiadelor. Un indicator semnificativ este gradul unui vârf, adică numărul de muchii adiacente vârfului. Variabil cu cel mai mare număr marginile este „nucleul” galaxiei și poate fi considerat ca un indicator al restului variabilelor acestei galaxii. Un alt indicator semnificativ este densitatea comunicării. O variabilă poate avea mai puține conexiuni într-o galaxie, dar mai apropiate, și mai multe conexiuni într-o altă galaxie, dar mai puțin apropiate.

Previziuni și estimări. Ecuația y \u003d b1x + b0 se numește ecuația generală a unei linii drepte. Indică faptul că perechile de puncte (x, y), care

Orez. 5.5. Pleiadele de corelație obținute prin divizarea matricei

se află pe o linie dreaptă, conectată în așa fel încât, pentru orice valoare a lui x, valoarea în pereche cu aceasta poate fi găsită prin înmulțirea x cu un număr b1 adăugând al doilea, numărul b0 la acest produs.

Coeficientul de regresie vă permite să determinați gradul de modificare a factorului de investigare atunci când factorul cauzal se modifică cu o unitate. Valorile absolute caracterizează relația dintre factorii variabili prin valorile lor absolute. Coeficientul de regresie se calculează cu formula:

Planificarea și analiza experimentelor. Proiectarea și analiza experimentelor este a treia ramură majoră a metodelor statistice dezvoltate pentru găsirea și testarea relațiilor cauzale dintre variabile.

Pentru a studia dependențele multifactoriale, metodele de planificare matematică a unui experiment au fost din ce în ce mai utilizate în ultimii ani.

Posibilitatea variaţiei simultane a tuturor factorilor permite: a) reducerea numărului de experimente;

b) reducerea la minimum a erorii experimentale;

c) simplifica prelucrarea datelor primite;

d) să ofere claritate și ușurință în compararea rezultatelor.

Fiecare factor poate dobândi o cantitate corespunzătoare sensuri diferite, care se numesc niveluri și denotă -1, 0 și 1. Un set fix de niveluri de factori determină condițiile unuia dintre experimentele posibile.

Totalitatea tuturor combinațiilor posibile se calculează prin formula:

Un experiment factorial complet este un experiment în care sunt implementate toate combinațiile posibile de niveluri de factori. Experimentele factoriale complete pot avea proprietatea de ortogonalitate. Cu planificarea ortogonală, factorii din experiment sunt necorelați, coeficienții de regresie care sunt calculați ca rezultat sunt determinați independent unul de celălalt.

Un avantaj important al metodei de planificare matematică a unui experiment este versatilitatea și adecvarea sa în multe domenii de cercetare.

Să luăm în considerare un exemplu de comparare a influenței anumitor factori asupra formării nivelului de stres mental la controlerele TV color.

Experimentul se bazează pe planul ortogonal 2 trei (trei factori se modifică la două niveluri).

Experimentul a fost efectuat cu o parte completă 2 +3 cu o repetare triplă.

Planificarea ortogonală se bazează pe construcția unei ecuații de regresie. Din trei factori, arată astfel:

Procesarea rezultatelor din acest exemplu include:

a) realizarea unui tabel plan ortogonal 2 +3 pentru calcul;

b) calculul coeficienților de regresie;

c) verificarea semnificaţiei acestora;

d) interpretarea datelor primite.

Pentru coeficienții de regresie ai ecuației menționate a fost necesar să se pună N = 2 3 = 8 opțiuni pentru a putea evalua semnificația coeficienților, unde numărul de repetări K a fost 3.

Compilat o matrice de planificare a experimentului arăta.

Metoda de corelare a rangului lui Spearman online. Analiza corelației conform metodei Spearman (rangurile Spearman)

1. Istoricul dezvoltării coeficientului de corelație de rang

2. Pentru ce este folosit raportul Spearman?

3. În ce cazuri poate fi utilizat coeficientul Spearman?

4. Cum se calculează raportul lui Spearman?

5. Cum se interpretează valoarea coeficientului Spearman?

37. Coeficientul de corelare a rangului lui Spearman.

Clasificarea coeficienților de corelație conform lui Spearman și Kendal

38. Coeficient de corelație biserială punctată.

39. Coeficient de corelație rang-biseriala.

40. Coeficient de corelație liniară.

41. Matricea de corelație și graficul de corelație.

Plan de lucru (27)

Coeficientul de corelație al lui Spearman

Cum se calculează coeficientul de clasare?

Domeniul de aplicare al măsurii matematice a conexiunii

Proprietățile coeficientului de corelație

Cum se verifică valoarea primită?

Unde este cel mai bun loc pentru a folosi această valoare?

Ce alți coeficienți de corelație există?

Antrenamentul obiceiurilor sănătoase

Obiceiuri bune și rele

De ce este mai ușor să înveți engleza decât limba rusă

Celebrul manifest este falsul secolului

Categorii