Cum se calculează coeficientul de corelație de pereche în Excel. Cum se calculează coeficientul de corelație liniară

Coeficientul de corelație (sau coeficientul de corelație liniară) este notat cu „r” (în cazuri rare, ca „ρ”) și caracterizează corelația liniară (adică relația dată de o anumită valoare și direcție) a două sau mai multe variabile . Valoarea coeficientului se află între -1 și +1, adică corelația poate fi atât pozitivă, cât și negativă. Dacă coeficientul de corelație este -1, există o corelație negativă perfectă; dacă coeficientul de corelație este +1, există o corelație pozitivă perfectă. În alte cazuri, există o corelație pozitivă, o corelație negativă sau nicio corelație între cele două variabile. Coeficientul de corelare poate fi calculat manual, cu calculatoare online gratuite sau cu un calculator grafic bun.

Pași

Calcularea manuală a coeficientului de corelație

    Adunați date.Înainte de a începe să calculați coeficientul de corelație, examinați perechea de numere dată. Este mai bine să le scrieți într-un tabel care poate fi aranjat vertical sau orizontal. Etichetați fiecare rând sau coloană drept „x” și „y”.

    • De exemplu, având în vedere patru perechi de valori (numere) ale variabilelor „x” și „y”. Puteți crea următorul tabel:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Calculați media aritmetică „x”. Pentru a face acest lucru, adunați toate valorile „x”, apoi împărțiți rezultatul la numărul de valori.

    • În exemplul nostru, ni se oferă patru valori pentru variabila „x”. Pentru a calcula media aritmetică „x”, adăugați aceste valori și apoi împărțiți suma la 4. Calculele se vor scrie după cum urmează:
    • μ x = (1 + 2 + 4 + 5) / 4 (\displaystyle \mu _(x)=(1+2+4+5)/4)
    • μ x = 12 / 4 (\displaystyle \mu _(x)=12/4)
    • μ x = 3 (\displaystyle \mu _(x)=3)
  2. Aflați media aritmetică „y”. Pentru a face acest lucru, urmați aceiași pași, adică adăugați toate valorile „y”, apoi împărțiți suma la numărul de valori.

    • În exemplul nostru, ni se oferă patru valori pentru variabila „y”. Adăugați aceste valori și apoi împărțiți suma la 4. Calculele vor fi scrise după cum urmează:
    • μ y = (1 + 3 + 5 + 7) / 4 (\displaystyle \mu _(y)=(1+3+5+7)/4)
    • μ y = 16 / 4 (\displaystyle \mu _(y)=16/4)
    • μ y = 4 (\displaystyle \mu _(y)=4)
  3. Calculați abaterea standard a lui „x”. După calcularea mediilor lui „x” și „y”, găsiți abateri standard aceste variabile. Abaterea standard se calculează folosind următoarea formulă:

    • σ x = 1 n - 1 Σ (x − μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(n-1))\Sigma (x-\mu _( x))^(2))))
    • σ x = 1 4 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2))))
    • σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
    • σ x = 1 3 ∗ (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10))))
    • σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
    • σ x = 1 , 83 (\displaystyle \sigma _(x)=1,83)
  4. Calculați abaterea standard „y”. Urmați pașii din pasul anterior. Utilizați aceeași formulă, dar înlocuiți valorile „y” în ea.

    • În exemplul nostru, calculele vor fi scrise după cum urmează:
    • σ y = 1 4 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2))))
    • σ y = 1 3 ∗ (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
    • σ y = 1 3 ∗ (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
    • σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
    • σ y = 2 , 58 (\displaystyle \sigma _(y)=2,58)
  5. Notați formula de bază pentru calcularea coeficientului de corelație. Această formulă include mediile, abaterile standard și numărul (n) de perechi de numere ale ambelor variabile. Coeficientul de corelație este notat cu „r” (în cazuri rare, ca „ρ”). Acest articol folosește formula pentru a calcula coeficientul de corelație Pearson.

    • Aici și în alte surse, cantitățile pot fi notate în moduri diferite. De exemplu, unele formule au „ρ” și „σ”, în timp ce altele au „r” și „s”. Unele manuale dau alte formule, dar sunt echivalentul matematic al formulei de mai sus.
  6. Ați calculat mediile și abaterile standard ale ambelor variabile, astfel încât să puteți utiliza formula pentru a calcula coeficientul de corelație. Amintiți-vă că „n” este numărul de perechi de valori ale ambelor variabile. Valoarea altor cantități a fost calculată anterior.

    • În exemplul nostru, calculele vor fi scrise după cum urmează:
    • ρ = (1 n - 1) Σ (x - μ x σ x) ∗ (y - μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\right) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y)))(\sigma _(y)))\dreapta))
    • ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\right)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)() 1.83))\right)*\left((\frac (1-4)(2.58))\right)+\left((\frac (2-3)(1.83))\right) *\left((\ frac (3-4)(2,58))\dreapta))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3) )(1.83))\dreapta)*\left((\frac (5-4)(2.58))\right)+\left((\frac (5-3)(1.83))\ dreapta)*\left( (\frac (7-4)(2,58))\dreapta))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6) +1+1+6)(4.721))\dreapta))
    • ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\right)*2.965)
    • ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2.965)(3))\right))
    • ρ = 0. 988 (\displaystyle \rho =0,988)
  7. Analizați rezultatul.În exemplul nostru, coeficientul de corelație este 0,988. Această valoare caracterizează într-un fel un anumit set de perechi de numere. Acordați atenție semnului și mărimii valorii.

    • Deoarece valoarea coeficientului de corelare este pozitivă, există o corelație pozitivă între variabilele „x” și „y”. Adică, atunci când valoarea lui „x” crește, crește și valoarea lui „y”.
    • Deoarece valoarea coeficientului de corelație este foarte apropiată de +1, valorile variabilelor x și y sunt foarte corelate. Dacă puneți puncte plan de coordonate, vor fi situate aproape de vreo linie dreaptă.

    Utilizarea calculatoarelor online pentru a calcula coeficientul de corelație

    1. Găsiți un calculator pe Internet pentru a calcula coeficientul de corelație. Acest coeficient este adesea calculat în statistici. Dacă există multe perechi de numere, este practic imposibil să se calculeze manual coeficientul de corelație. Prin urmare, există calculatoare online pentru calcularea coeficientului de corelație. În motorul de căutare, introduceți „calculator coeficient de corelație” (fără ghilimele).

    2. Introduceți datele. Citiți instrucțiunile de pe site pentru a introduce datele corect (perechi de numere). Este extrem de important să introduceți perechile adecvate de numere; altfel vei obține un rezultat greșit. Rețineți că site-urile web diferite au formate diferite de introducere a datelor.

      • De exemplu, pe site-ul http://ncalculators.com/statistics/correlation-coefficient-calculator.htm, valorile variabilelor „x” și „y” sunt introduse în două linii orizontale. Valorile sunt separate prin virgule. Adică, în exemplul nostru, valorile lui „x” sunt introduse astfel: 1,2,4,5, iar valorile lui „y” sunt astfel: 1,3,5,7.
      • Pe un alt site, http://www.alcula.com/calculators/statistics/correlation-coefficient/ , datele sunt introduse vertical; în acest caz, nu confundați perechile corespunzătoare de numere.
    3. Calculați coeficientul de corelație. După ce ați introdus datele, faceți clic pe butonul „Calculați”, „Calculați” sau pe butonul similar pentru a obține rezultatul.

      Utilizarea unui calculator grafic

      1. Introduceți datele. Luați un calculator grafic, comutați la modul de calcul statistic și selectați comanda Editare.

        • Pe calculatoare diferite, trebuie să apăsați taste diferite. Acest articol se concentrează pe calculatorul Texas Instruments TI-86.
        • Pentru a comuta la modul de calcul statistic, apăsați - Stat (deasupra tastei „+”). Apoi apăsați F2 - Editare (Editare).
      2. Ștergeți datele salvate anterioare. Majoritatea calculatoarelor păstrează statisticile introduse până când le ștergeți. Pentru a evita confundarea datelor vechi cu datele noi, ștergeți mai întâi orice informații stocate.

        • Utilizați tastele săgeți pentru a muta cursorul și evidențiați titlul „xStat”. Apoi apăsați Clear și Enter pentru a șterge toate valorile introduse în coloana xStat.
        • Utilizați tastele săgeți pentru a evidenția titlul „yStat”. Apoi apăsați Clear și Enter pentru a șterge toate valorile introduse în coloana yStat.
      3. Introduceți datele inițiale. Utilizați tastele săgeți pentru a muta cursorul la prima celulă de sub titlul „xStat”. Introduceți prima valoare și apăsați Enter. În partea de jos a ecranului, va fi afișat „xStat (1) = __”, cu valoarea introdusă în loc de spațiu. După ce apăsați Enter, valoarea introdusă va apărea în tabel, iar cursorul se va muta pe linia următoare; aceasta va afișa „xStat(2) = __” în partea de jos a ecranului.

        • Introduceți toate valorile variabilei „x”.
        • După ce ați introdus toate valorile pentru variabila x, utilizați tastele săgeți pentru a naviga la coloana yStat și introduceți valorile pentru variabila y.
        • După ce ați introdus toate perechile de numere, apăsați Ieșire pentru a șterge ecranul și a ieși din modul de agregare.
      4. Calculați coeficientul de corelație. Caracterizează cât de aproape sunt datele de o linie dreaptă. Calculatorul grafic poate determina rapid linia dreaptă corespunzătoare și poate calcula coeficientul de corelație.

        • Faceți clic pe Stat (Statistici) - Calc (Calcuri). Pe TI-86, apăsați - - .
        • Selectați funcția „Regresie liniară” ( Regresie liniara). Pe TI-86, apăsați , care este etichetat „LinR”. Linia „LinR _” va fi afișată pe ecran cu un cursor care clipește.
        • Acum introduceți numele a două variabile: xStat și yStat.
          • Pe TI-86, deschideți lista de nume; pentru a face acest lucru apăsați – – .
          • Variabilele disponibile sunt afișate pe linia de jos a ecranului. Selectați (cel mai probabil apăsând F1 sau F2), introduceți o virgulă și apoi selectați .
          • Apăsați Enter pentru a procesa datele introduse.
      5. Analizați rezultatele. Apăsând Enter, următoarele informații vor fi afișate pe ecran:

        • y = a + b x (\displaystyle y=a+bx): este o funcție care descrie o linie dreaptă. Rețineți că funcția nu este scrisă în formă standard (y = kx + b).
        • a = (\displaystyle a=). Aceasta este coordonata y a punctului în care linia se intersectează cu axa y.
        • b = (\displaystyle b=). Aceasta este panta dreptei.
        • corr = (\displaystyle (\text(corr))=). Acesta este coeficientul de corelație.
        • n = (\displaystyle n=). Acesta este numărul de perechi de numere care au fost utilizate în calcule.

O caracteristică cantitativă a relației poate fi obținută prin calcularea coeficientului de corelație.

Analiza corelației în Excel

Funcția în sine are forma generala CORREL(matrice1, matrice2). În câmpul „Matrice1”, introduceți coordonatele intervalului de celule ale uneia dintre valori, a cărei dependență ar trebui determinată. După cum puteți vedea, coeficientul de corelație sub formă de număr apare în celula pe care am selectat-o ​​anterior. Se deschide o fereastră cu parametrii de analiză a corelației. Spre deosebire de metoda anterioară, în câmpul „Interval de introducere”, introducem intervalul nu pentru fiecare coloană separat, ci pentru toate coloanele care participă la analiză. După cum puteți vedea, aplicația Excel oferă două metode de analiză a corelației simultan.

diagrama de corelatie in excel

6) Primul element al tabelului final va apărea în celula din stânga sus a zonei selectate. Prin urmare, ipoteza H0 este respinsă, adică parametrii de regresie și coeficientul de corelație nu sunt diferiți aleatoriu de zero, dar sunt semnificativi statistic. 7. Estimările obţinute ale ecuaţiei de regresie ne permit să o folosim pentru prognoză.

Cum se calculează coeficientul de corelație în Excel

Dacă coeficientul este 0, aceasta indică faptul că nu există nicio relație între valori. Pentru a găsi relația dintre variabile și y, utilizați funcția încorporată Microsoft Excel„CORREL”. De exemplu, pentru „Matrice1” selectați valorile y, iar pentru „Matrice2” selectați valorile x. Ca rezultat, veți obține coeficientul de corelație calculat de program. Apoi, trebuie să calculați diferența dintre fiecare x și xav și yav. În celulele selectate scrieți formulele x-x, y-. Nu uitați să fixați celulele cu valori medii. Rezultatul obţinut va fi coeficientul de corelaţie dorit.

Formula de mai sus pentru calcularea coeficientului Pearson arată cât de laborios este acest proces dacă se face manual. În al doilea rând, vă rugăm să recomandați ce fel de analiză de corelație poate fi utilizată pentru diferite eșantioane cu o împrăștiere mare a datelor? Cum pot demonstra statistic diferența dintre grupul de peste 60 de ani și toți ceilalți?

Fă-o singur: Calcularea corelațiilor valutare folosind Excel

Noi, de exemplu, folosim Microsoft Excel, dar orice alt program care poate folosi formula de corelare va face. 7. După aceea, selectați celulele cu date despre EUR/USD. 9.Apăsați Enter pentru a calcula coeficientul de corelație pentru EUR/USD și USD/JPY. Nu merită să actualizezi cifrele în fiecare zi (ei bine, dacă nu ești obsedat de corelațiile valutare).

Ați întâmpinat deja nevoia de a calcula gradul de relație dintre doi statistici si determina formula prin care se coreleaza? Pentru a face acest lucru, am folosit funcția CORREL (CORREL) - există câteva informații despre aceasta aici. Returnează gradul de corelare între două intervale de date. Teoretic, funcția de corelare poate fi rafinată prin conversia acesteia din liniară în exponențială sau logaritmică. Analiza datelor și graficele de corelație îi pot îmbunătăți fiabilitatea foarte semnificativ.

Să presupunem că celula B2 conține coeficientul de corelație în sine, celula B3 conține numărul de observații complete. Aveți un birou vorbitor de limbă rusă? Apropo, am găsit și o greșeală - semnificația nu este calculată pentru corelații negative. Dacă ambele variabile sunt metrice și au distributie normala, atunci alegerea este corectă. Și, este posibil să se caracterizeze criteriul de similitudine a curbelor folosind un singur QC? Nu aveți asemănarea „curbelor”, ci asemănarea a două serii, care, în principiu, pot fi descrise printr-o curbă.

Ați întâmpinat deja necesitatea de a calcula gradul de relație dintre două mărimi statistice și de a determina formula prin care acestea se corelează? O persoană normală se poate întreba de ce ar putea fi necesar acest lucru. Destul de ciudat, acest lucru este cu adevărat necesar. Cunoașterea corelațiilor de încredere vă poate ajuta să faceți avere dacă sunteți, să zicem, un comerciant de acțiuni. Problema este că, din anumite motive, nimeni nu dezvăluie aceste corelații (surprinzător, nu-i așa?).

Să le numărăm noi înșine! De exemplu, am decis să încerc să calculez corelația rublei față de dolar prin euro. Să vedem cum se face acest lucru în detaliu.

Acest articol este conceput pentru un nivel avansat de cunoștințe despre Microsoft Excel. Dacă nu aveți timp să citiți întregul articol, puteți descărca fișierul și vă puteți ocupa singur.

Dacă te simți adesea nevoită să faci așa ceva Vă recomand cu căldură să vă gândiți să cumpărați cartea. Calcule statistice în Excel.

Ce este important de știut despre corelații

Pentru a calcula o corelație fiabilă, este necesar să existe un eșantion de încredere, cu cât acesta este mai mare, cu atât rezultatul va fi mai fiabil. În scopul acestui exemplu, am luat un eșantion zilnic de cursuri de schimb pe o perioadă de 10 ani. Datele sunt disponibile gratuit, le-am luat de pe site-ul http://oanda.com.

Ce am făcut de fapt

(1) Când am avut datele originale, am început prin a verifica gradul de corelare dintre cele două seturi de date. Pentru a face acest lucru, am folosit funcția CORREL (CORREL) - există puține informații despre aceasta. Returnează gradul de corelare între două intervale de date. Rezultatul, sincer, nu a fost deosebit de impresionant (doar aproximativ 70%). În general, gradul de corelație dintre două valori este considerat a fi pătratul acestei valori, adică corelația s-a dovedit a fi fiabilă cu aproximativ 49%. Acesta este foarte puțin!

(2) Mi s-a părut foarte ciudat. Ce erori s-ar fi putut strecura în calculele mele? Așa că am decis să construiesc un grafic și să văd ce se poate întâmpla. Graficul a fost păstrat simplu intenționat, defalcat pe ani, astfel încât să puteți vedea vizual unde se întrerupe corelația. Graficul arată așa

(3) Din grafic, este evident că în intervalul de aproximativ 35 de ruble pe euro, corelația începe să se rupă în două părți. Din această cauză, ea s-a dovedit a fi nesigură. A fost necesar să se stabilească în legătură cu ce se întâmplă acest lucru.

(4) Culoarea arată că aceste date se referă la 2007, 2008, 2009. Cu siguranță! Perioadele de vârfuri economice și recesiuni nu sunt de obicei fiabile din punct de vedere statistic, ceea ce s-a întâmplat în acest caz. Prin urmare, am încercat să exclud aceste perioade din date (bine, pentru verificare, am verificat gradul de corelare a datelor în această perioadă). Gradul de corelare numai a acestor date este de 0,01%, adică este absent în principiu. Dar fără ele, datele se corelează cu aproximativ 81%. Aceasta este deja o corelație destul de sigură. Iată un grafic cu o funcție.

Pasii urmatori

Teoretic, funcția de corelare poate fi rafinată prin conversia acesteia din liniară în exponențială sau logaritmică. În acest caz, semnificația statistică a corelației crește cu aproximativ un procent, dar complexitatea aplicării formulei crește enorm. Prin urmare, pentru mine îmi pun întrebarea: este chiar necesar? Tu decizi - pentru fiecare caz specific.

Cu o corelație aceeași valoare a unui atribut corespunde unor valori diferite ale celuilalt. De exemplu: există o corelație între înălțime și greutate, între incidența neoplasmelor maligne și vârstă etc.

Există 2 metode de calcul al coeficientului de corelație: metoda pătratelor (Pearson), metoda rangurilor (Spearman).

Cea mai precisă este metoda pătratelor (Pearson), în care coeficientul de corelație este determinat de formula: , unde

r xy este coeficientul de corelație dintre seriile statistice X și Y.

d x este abaterea fiecăruia dintre numerele seriei statistice X de la media sa aritmetică.

d y este abaterea fiecăruia dintre numerele seriei statistice Y de la media sa aritmetică.

În funcție de puterea conexiunii și de direcția acesteia, coeficientul de corelație poate varia de la 0 la 1 (-1). Un coeficient de corelație de 0 indică o lipsă completă de conexiune. Cu cât nivelul coeficientului de corelație este mai aproape de 1 sau (-1), cu atât este mai mare, respectiv, cu atât direct sau feedback măsurat de acesta este mai aproape. Cu un coeficient de corelație egal cu 1 sau (-1), conexiunea este completă, funcțională.

Schema de estimare a puterii corelației prin coeficientul de corelație

Puterea conexiunii

Valoarea coeficientului de corelare, dacă este disponibil

conexiune directă (+)

părere (-)

Nici o conexiune

Comunicarea este mică (slabă)

de la 0 la +0,29

0 până la -0,29

Comunicare medie (moderată)

+0,3 până la +0,69

-0,3 până la -0,69

Comunicare mare (puternică)

+0,7 până la +0,99

-0,7 până la -0,99

Comunicarea este completă

(funcţional)

Pentru a calcula coeficientul de corelație folosind metoda pătratelor, se întocmește un tabel de 7 coloane. Să analizăm procesul de calcul folosind un exemplu:

DETERMINAȚI FORTA ȘI NATURA RELAȚIEI DINTRE

Este timpul-

ness

guşă

(V y )

d x= V XM X

d y= V yM y

d X d y

d X 2

d y 2

Σ -1345 ,0

Σ 13996 ,0

Σ 313 , 47

1. Determinați conținutul mediu de iod din apă (în mg/l).

mg/l

2. Determinați incidența medie a gușii în%.

3. Determinați abaterea fiecărui V x de la M x, adică. d x .

201–138=63; 178–138=40 etc.

4. În mod similar, determinăm abaterea fiecărui V y de la M y, adică. d

0,2–3,8=-3,6; 0,6–38=-3,2 etc.

5. Determinăm produsele abaterilor. Produsul rezultat este însumat și obținut.

6. Patratăm d x și rezumăm rezultatele, obținem.

7. În mod similar, pătratăm d y, rezumăm rezultatele, obținem

8. În cele din urmă, înlocuim toate sumele primite în formula:

Pentru a rezolva problema fiabilității coeficientului de corelație, se determină eroare medie dupa formula:

(Dacă numărul de observații este mai mic de 30, atunci numitorul este n-1).

În exemplul nostru

Valoarea coeficientului de corelație este considerată fiabilă dacă este de cel puțin 3 ori mai mare decât eroarea sa medie.

În exemplul nostru

Astfel, coeficientul de corelare nu este de încredere, ceea ce face necesară creșterea numărului de observații.

Coeficientul de corelație poate fi determinat într-un mod ceva mai puțin precis, dar mult mai ușor, metoda rangului (Spearman).

Metoda Spearman: P=1-(6∑d 2 /n-(n 2 -1))

faceți două rânduri de caracteristici comparate pereche, desemnând primul și, respectiv, al doilea rând, x și y. În același timp, prezentați primul rând al atributului în ordine descrescătoare sau crescătoare și plasați valorile numerice ale celui de-al doilea rând vizavi de valorile primului rând cărora le corespund

valoarea caracteristicii din fiecare dintre rândurile comparate ar trebui înlocuită cu un număr de serie (rang). Rangurile, sau numerele, indică locurile indicatorilor (valorilor) din primul și al doilea rând. În acest caz, rangurile ar trebui să fie atribuite valorilor numerice ale celui de-al doilea atribut în aceeași ordine în care a fost adoptată la distribuirea valorilor lor la valorile primului atribut. Cu aceleași valori ale atributului din serie, rangurile ar trebui determinate ca număr mediu din suma numerelor ordinale ale acestor valori

determinați diferența de ranguri între x și y (d): d = x - y

la pătrat diferența de rang rezultată (d 2)

obțineți suma pătratelor diferenței (Σ d 2) și înlocuiți valorile obținute în formula:

Exemplu: folosind metoda rangului pentru a stabili direcția și puterea relației dintre vechimea în muncă în ani și frecvența accidentărilor, dacă se obțin următoarele date:

Motivul alegerii metodei: pentru a rezolva problema se poate alege doar metoda corelație de rang, deoarece primul rând al atributului „experiență de muncă în ani” are opțiuni deschise (experiență de muncă de până la 1 an și 7 sau mai mulți ani), ceea ce nu permite utilizarea unei metode mai precise - metoda pătratelor - pentru a stabili o relație între caracteristici comparate.

Soluţie. Secvența calculelor este descrisă în text, rezultatele sunt prezentate în tabel. 2.

masa 2

Experienta in munca de ani de zile

Numărul de răni

Numere ordinale (ranguri)

Diferența de rang

diferența de rang la pătrat

d(x-y)

d 2

Fiecare dintre rândurile de semne pereche este notat cu „x” și cu „y” (coloanele 1-2).

Valoarea fiecărui semn este înlocuită cu un număr de rang (de serie). Ordinea de distribuție a rangurilor în seria „x” este următoarea: valorii minime a atributului (experiență de până la 1 an) i se atribuie numărul de serie „1”, variantele ulterioare ale aceleiași serii ale atributului, respectiv , în ordinea crescătoare a numerelor de serie 2, 3, 4 și 5 - ranguri (vezi coloana 3). O ordine similară se observă la distribuirea rangurilor la a doua caracteristică „y” (coloana 4). În acele cazuri în care există mai multe variante de aceeași dimensiune (de exemplu, în sarcina standard, acestea sunt 12 și 12 răni la 100 de lucrători cu o experiență de 3-4 ani și 5-6 ani), se indică numărul de serie cu numărul mediu din suma numerelor lor de serie Aceste date privind numărul de accidentări (12 accidentări) în clasament ar trebui să ocupe locurile 2 și 3, deci numărul mediu al acestora este (2 + 3) / 2 = 2,5. ) ar trebui să distribuie aceleași numere de clasare - „2,5” (coloana 4).

Determinați diferența de ranguri d = (x - y) - (coloana 5)

Punerea la pătrat a diferenței de ranguri (d 2) și obținerea sumei pătratelor diferenței de ranguri Σ d 2 (coloana 6).

Calculați coeficientul de corelare a rangului folosind formula:

unde n este numărul de perechi de opțiuni potrivite în rândul „x” și rândul „y”

„Corelație” în latină înseamnă „corelație”, „relație”. O caracteristică cantitativă a relației poate fi obținută prin calcularea coeficientului de corelație. Acest coeficient, popular în analiza statistică, arată dacă parametrii sunt legați unul de celălalt (de exemplu, înălțimea și greutatea; nivelul de inteligență și performanța academică; numărul de accidentări și orele de muncă).

Utilizarea corelației

Calculul corelației este utilizat în special în economie, cercetare sociologică, medicină și biometrie - oriunde puteți obține două seturi de date între care poate fi găsită o conexiune.

Puteți calcula manual corelația efectuând operații aritmetice simple. Cu toate acestea, procesul de calcul este foarte consumator de timp dacă setul de date este mare. Particularitatea metodei este că necesită colectare un numar mare date sursă pentru a afișa cel mai precis dacă există o relație între caracteristici. Prin urmare, utilizarea serioasă a analizei de corelație este imposibilă fără utilizarea tehnologiei computerizate. Unul dintre cele mai populare și mai accesibile programe pentru rezolvarea acestei probleme este.

Cum se realizează corelarea în Excel?

Pasul cel mai consumator de timp în determinarea corelației este setul de date. Datele care trebuie comparate sunt de obicei aranjate pe două coloane sau rânduri. Tabelul trebuie făcut fără goluri în celule. Versiunile moderne de Excel (din 2007 și mai mici) nu necesită setări suplimentare pentru calculele statistice; se pot face manipulări necesare:

  1. Selectați o celulă goală în care va fi afișat rezultatul calculului.
  2. Faceți clic pe elementul „Formule” din meniul principal Excel.
  3. Dintre butoanele grupate în „Biblioteca de funcții”, selectați „Alte funcții”.
  4. În listele derulante, selectați funcția de calcul a corelației (Statistic - CORREL).
  5. Excel deschide panoul Argumente ale funcției. „Matrice 1” și „Matrice 2” sunt intervalele de date comparate. Pentru a completa automat aceste câmpuri, puteți selecta pur și simplu celulele dorite din tabel.
  6. Faceți clic pe OK pentru a închide fereastra cu argumente ale funcției. Coeficientul de corelație calculat va apărea în celulă.

Corelația poate fi directă (dacă coeficientul este mai mare decât zero) și inversă (de la -1 la 0).

Primul înseamnă că pe măsură ce un parametru crește, și celălalt crește. O corelație inversă (negativă) reflectă faptul că pe măsură ce o variabilă crește, cealaltă scade.

Corelația poate fi aproape de zero. Acest lucru indică de obicei că parametrii studiați nu sunt legați între ei. Dar uneori apare o corelație zero dacă se face un eșantion nereușit care nu reflectă relația sau relația are o natură complexă neliniară.

Dacă coeficientul prezintă o relație medie sau puternică (de la ±0,5 la ±0,99), trebuie amintit că aceasta este doar o relație statistică, care nu garantează deloc influența unui parametru asupra altuia. De asemenea, este imposibil să se excludă situația în care ambii parametri sunt independenți unul de celălalt, dar sunt afectați de un al treilea factor necontabil. Excel vă ajută să calculați instantaneu coeficientul de corelație, dar de obicei doar metodele cantitative nu sunt suficiente pentru a stabili relații cauzale în probele corelate.



eroare: Conținutul este protejat!!