Jak vypočítat párový korelační koeficient v excelu. Jak vypočítat lineární korelační koeficient

27.09.2019 | Vzdělání

Korelační koeficient (nebo lineární korelační koeficient) se označuje jako "r" (ve vzácných případech jako "ρ") a charakterizuje lineární korelaci (tedy vztah, který je dán nějakou hodnotou a směrem) dvou nebo více proměnných. . Hodnota koeficientu leží mezi -1 a +1, to znamená, že korelace může být kladná i záporná. Pokud je korelační koeficient -1, existuje dokonalá negativní korelace; pokud je korelační koeficient +1, existuje dokonalá kladná korelace. V ostatních případech existuje pozitivní korelace, negativní korelace nebo žádná korelace mezi těmito dvěma proměnnými. Korelační koeficient lze vypočítat ručně, pomocí bezplatných online kalkulaček nebo pomocí dobré grafické kalkulačky.

Kroky

Ruční výpočet korelačního koeficientu

Sbírejte data. Než začnete počítat korelační koeficient, prozkoumejte danou dvojici čísel. Je lepší si je zapsat do tabulky, která může být uspořádána svisle nebo vodorovně. Označte každý řádek nebo sloupec jako "x" a "y".

Například jsou dány čtyři páry hodnot (čísla) proměnných "x" a "y". Můžete vytvořit následující tabulku:
- x || y
- 1 || 1
- 2 || 3
- 4 || 5
- 5 || 7

Vypočítejte aritmetický průměr "x". Chcete-li to provést, sečtěte všechny hodnoty „x“ a poté vydělte výsledek počtem hodnot.
- V našem příkladu dostáváme čtyři hodnoty pro proměnnou „x“. Chcete-li vypočítat aritmetický průměr "x", sečtěte tyto hodnoty a poté součet vydělte 4. Výpočty budou zapsány následovně:
- μ x = (1 + 2 + 4 + 5) / 4 (\displaystyle \mu _(x)=(1+2+4+5)/4)
- μ x = 12/4 (\displaystyle \mu _(x)=12/4)
- μ x = 3 (\displaystyle \mu _(x)=3)
Najděte aritmetický průměr "y". Chcete-li to provést, postupujte podle stejných kroků, to znamená sečtěte všechny hodnoty „y“ a poté vydělte součet počtem hodnot.
- V našem příkladu dostáváme čtyři hodnoty pro proměnnou "y". Sečtěte tyto hodnoty a poté součet vydělte 4. Výpočty budou zapsány následovně:
- μ y = (1 + 3 + 5 + 7) / 4 (\displaystyle \mu _(y)=(1+3+5+7)/4)
- μ y = 16/4 (\displaystyle \mu _(y)=16/4)
- μ y = 4 (\displaystyle \mu _(y)=4)
Vypočítejte směrodatnou odchylku "x". Po výpočtu průměrů "x" a "y" najděte směrodatné odchylky tyto proměnné. Směrodatná odchylka se vypočítá pomocí následujícího vzorce:
- σ x = 1 n − 1 Σ (x − μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(n-1))\Sigma (x-\mu _( x))^(2))))
- σ x = 1 4 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2))))
- σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
- σ x = 1 3 ∗ (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10))))
- σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
- σ x = 1, 83 (\displaystyle \sigma _(x)=1,83)
Vypočítejte směrodatnou odchylku "y". Postupujte podle kroků v předchozím kroku. Použijte stejný vzorec, ale nahraďte do něj hodnoty "y".
- V našem příkladu budou výpočty zapsány následovně:
- σ y = 1 4 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2))))
- σ y = 1 3 ∗ (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
- σ y = 1 3 ∗ (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
- σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
- σ y = 2 , 58 (\displaystyle \sigma _(y)=2,58)
Zapište si základní vzorec pro výpočet korelačního koeficientu. Tento vzorec zahrnuje střední hodnoty, směrodatné odchylky a počet (n) dvojic čísel obou proměnných. Korelační koeficient je označen jako "r" (ve vzácných případech jako "ρ"). Tento článek používá vzorec k výpočtu Pearsonova korelačního koeficientu.
- Zde i v jiných zdrojích lze veličiny označovat různými způsoby. Například některé vzorce mají „ρ“ a „σ“, zatímco jiné mají „r“ a „s“. Některé učebnice uvádějí jiné vzorce, ale ty jsou matematickým ekvivalentem výše uvedeného vzorce.
Vypočítali jste průměry a směrodatné odchylky obou proměnných, takže můžete pomocí vzorce vypočítat korelační koeficient. Připomeňme, že „n“ je počet dvojic hodnot obou proměnných. Hodnota ostatních veličin byla vypočtena dříve.
- V našem příkladu budou výpočty zapsány následovně:
- ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\vpravo) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y))(\sigma _(y)))\vpravo))
- ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\right)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1,83))\vpravo)*\doleva((\frac (1-4)(2,58))\vpravo)+\doleva((\frac (2-3)(1,83))\vpravo) *\doleva((\ frac (3-4) (2,58))\vpravo))
  + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3) )(1,83))\vpravo)*\vlevo((\frac (5-4)(2,58))\vpravo)+\vlevo ((\frac (5-3)(1,83))\ vpravo)*\vlevo ( (\frac (7-4)(2,58))\right))]
- ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6) +1+1+6)(4721))\vpravo))
- ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\right)*2,965)
- ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2,965)(3))\right))
- ρ = 0,988 (\displaystyle \rho =0,988)
Analyzujte výsledek. V našem příkladu je korelační koeficient 0,988. Tato hodnota nějakým způsobem charakterizuje danou množinu dvojic čísel. Věnujte pozornost znaménku a velikosti hodnoty.
- Jelikož je hodnota korelačního koeficientu kladná, existuje kladná korelace mezi proměnnými „x“ a „y“. To znamená, že když se zvýší hodnota "x", zvýší se i hodnota "y".
- Protože hodnota korelačního koeficientu je velmi blízká +1, jsou hodnoty proměnných x a y vysoce korelované. Pokud si dáte tečky souřadnicová rovina, budou umístěny blízko nějaké přímky.
Použití online kalkulaček k výpočtu korelačního koeficientu
1. Najděte si na internetu kalkulačku pro výpočet korelačního koeficientu. Tento koeficient se často počítá ve statistikách. Pokud existuje mnoho dvojic čísel, je prakticky nemožné vypočítat korelační koeficient ručně. Proto existují online kalkulačky pro výpočet korelačního koeficientu. Do vyhledávače zadejte "kalkulátor korelačních koeficientů" (bez uvozovek).
2. Zadejte údaje. Přečtěte si pokyny na stránce, abyste správně zadali údaje (dvojice čísel). Je nesmírně důležité zadat příslušné dvojice čísel; jinak dostanete špatný výsledek. Mějte na paměti, že různé webové stránky mají různé formáty zadávání dat.
  - Například na webu http://ncalculators.com/statistics/correlation-coefficient-calculator.htm jsou hodnoty proměnných „x“ a „y“ zadány ve dvou vodorovných řádcích. Hodnoty jsou odděleny čárkami. To znamená, že v našem příkladu jsou hodnoty "x" zadány takto: 1,2,4,5 a hodnoty "y" jsou takto: 1,3,5,7.
  - Na jiném webu, http://www.alcula.com/calculators/statistics/correlation-coefficient/ , se data zadávají svisle; v tomto případě nezaměňujte odpovídající dvojice čísel.
3. Vypočítejte korelační koeficient. Po zadání údajů stačí kliknout na tlačítko "Vypočítat", "Vypočítat" nebo podobné, abyste získali výsledek.
  
  Použití grafické kalkulačky
  1. Zadejte údaje. Uchopte grafickou kalkulačku, přepněte do režimu statistických výpočtů a vyberte příkaz Upravit.
    - Na různých kalkulačkách musíte stisknout různé klávesy. Tento článek se zaměřuje na kalkulačku Texas Instruments TI-86.
    - Pro přepnutí do režimu statistického výpočtu stiskněte - Stat (nad tlačítkem "+"). Poté stiskněte F2 - Upravit (Upravit).
  2. Smazat dříve uložená data. Většina kalkulaček uchovává zadané statistiky, dokud je nevymažete. Abyste předešli záměně starých dat s novými daty, nejprve odstraňte všechny uložené informace.
    - Pomocí kláves se šipkami posuňte kurzor a zvýrazněte nadpis „xStat“. Poté stiskněte Clear a Enter pro vymazání všech hodnot zadaných ve sloupci xStat.
    - Pomocí kláves se šipkami zvýrazněte nadpis „yStat“. Poté stiskněte Clear a Enter pro vymazání všech hodnot zadaných ve sloupci yStat.
  3. Zadejte počáteční údaje. Pomocí kláves se šipkami přesuňte kurzor na první buňku pod nadpisem „xStat“. Zadejte první hodnotu a stiskněte Enter. V dolní části obrazovky se zobrazí "xStat (1) = __" se zadanou hodnotou místo mezery. Po stisknutí klávesy Enter se zadaná hodnota objeví v tabulce a kurzor se přesune na další řádek; toto zobrazí "xStat(2) = __" ve spodní části obrazovky.
    - Zadejte všechny hodnoty proměnné "x".
    - Jakmile zadáte všechny hodnoty pro proměnnou x, přejděte pomocí kláves se šipkami do sloupce yStat a zadejte hodnoty pro proměnnou y.
    - Po zadání všech dvojic čísel stiskněte Exit pro vymazání obrazovky a opuštění režimu agregace.
  4. Vypočítejte korelační koeficient. Charakterizuje, jak blízko jsou data k nějaké přímce. Grafický kalkulátor dokáže rychle určit vhodnou přímku a vypočítat korelační koeficient.
    - Klikněte na Stat (Statistics) - Calc (Calculations). Na TI-86 stiskněte - - .
    - Vyberte funkci "Lineární regrese" ( Lineární regrese). Na TI-86 stiskněte , což je označeno „LinR“. Řádek „LinR _“ se zobrazí na obrazovce s blikajícím kurzorem.
    - Nyní zadejte názvy dvou proměnných: xStat a yStat.
      - Na TI-86 otevřete seznam jmen; k tomu stiskněte – – .
      - Dostupné proměnné jsou zobrazeny na spodním řádku obrazovky. Vyberte (nejpravděpodobněji stisknutím F1 nebo F2), zadejte čárku a poté vyberte .
      - Stiskněte Enter pro zpracování zadaných údajů.
  5. Analyzujte výsledky. Po stisknutí klávesy Enter se na obrazovce zobrazí následující informace:
    - y = a + b x (\displaystyle y=a+bx): je funkce, která popisuje přímku. Všimněte si, že funkce není zapsána ve standardním tvaru (y = kx + b).
    - a = (\displaystyle a=). Toto je y-ová souřadnice bodu, kde se přímka protíná s y-ovou osou.
    - b = (\displaystyle b=). Toto je sklon přímky.
    - corr = (\displaystyle (\text(corr))=). Toto je korelační koeficient.
    - n = (\displaystyle n=). Jedná se o počet dvojic čísel, které byly použity při výpočtu.

Kvantitativní charakteristiku vztahu lze získat výpočtem korelačního koeficientu.

Korelační analýza v Excelu

Funkce samotná má obecná forma CORREL(pole1; pole2). Do pole "Array1" zadejte souřadnice rozsahu buněk jedné z hodnot, jejichž závislost by měla být určena. Jak vidíte, korelační koeficient ve formě čísla se objeví v buňce, kterou jsme předtím vybrali. Otevře se okno s parametry korelační analýzy. Na rozdíl od předchozí metody v poli "Interval vstupu" zadáváme interval nikoli pro každý sloupec zvlášť, ale pro všechny sloupce, které se účastní analýzy. Jak vidíte, aplikace Excel nabízí dvě metody korelační analýzy najednou.

korelační graf v excelu

6) První prvek výsledné tabulky se objeví v levé horní buňce vybrané oblasti. Proto je hypotéza H0 zamítnuta, to znamená, že regresní parametry a korelační koeficient nejsou náhodně odlišné od nuly, ale jsou statisticky významné. 7. Získané odhady regresní rovnice nám umožňují její použití pro prognózování.

Jak vypočítat korelační koeficient v Excelu

Pokud je koeficient 0, znamená to, že mezi hodnotami není žádný vztah. Chcete-li najít vztah mezi proměnnými a y, použijte vestavěnou funkci Microsoft Excel"CORREL". Například pro "Array1" vyberte hodnoty y a pro "Array2" vyberte hodnoty x. V důsledku toho získáte korelační koeficient vypočítaný programem. Dále musíte vypočítat rozdíl mezi každým x a xav a yav. Do vybraných buněk napište vzorce x-x, y-. Nezapomeňte připnout buňky s průměrnými hodnotami. Získaným výsledkem bude požadovaný korelační koeficient.

Výše uvedený vzorec pro výpočet Pearsonova koeficientu ukazuje, jak pracný je tento proces, pokud se provádí ručně. Za druhé, doporučte prosím, jaký druh korelační analýzy lze použít pro různé vzorky s velkým rozptylem dat? Jak mohu statisticky prokázat rozdíl mezi skupinou nad 60 let a všemi ostatními?

Udělej si sám: Výpočet měnových korelací pomocí Excelu

My například používáme Microsoft Excel, ale postačí jakýkoli jiný program, který umí použít korelační vzorec. 7. Poté vyberte buňky s údaji o EUR/USD. 9. Stiskněte Enter pro výpočet korelačního koeficientu pro EUR/USD a USD/JPY. Nemá cenu aktualizovat čísla každý den (no, pokud nejste posedlí měnovými korelacemi).

Již jste se setkali s potřebou vypočítat míru vztahu mezi dvěma statistika a určit vzorec, podle kterého korelují? K tomu jsem použil funkci CORREL (CORREL) - zde je o ní málo informací. Vrací stupeň korelace mezi dvěma rozsahy dat. Teoreticky lze korelační funkci zpřesnit jejím převedením z lineární na exponenciální nebo logaritmickou. Analýza dat a korelačních grafů může velmi výrazně zlepšit její spolehlivost.

Předpokládejme, že buňka B2 obsahuje samotný korelační koeficient, buňka B3 obsahuje počet úplných pozorování. Máte rusky mluvící kancelář?Mimochodem, také jsem našel chybu - pro negativní korelace se nepočítá významnost. Pokud jsou obě proměnné metrické a mají normální distribuce, pak je volba správná. A je možné charakterizovat kritérium podobnosti křivek pouze pomocí jedné QC?Nemáte podobnost "křivek", ale podobnost dvou řad, které lze v zásadě popsat křivkou.

Setkali jste se již s nutností vypočítat míru vztahu mezi dvěma statistickými veličinami a určit vzorec, kterým korelují? Normální člověk se může ptát, proč je to vůbec nutné. Kupodivu je to opravdu nutné. Znalost spolehlivých korelací vám může pomoci vydělat jmění, pokud jste, řekněme, obchodník s akciemi. Problém je, že z nějakého důvodu tyto korelace nikdo nezveřejňuje (překvapivé, že?).

Pojďme si je sami spočítat! Například jsem se rozhodl zkusit vypočítat korelaci rublu vůči dolaru přes euro. Podívejme se, jak se to provádí podrobně.

Tento článek je určen pro pokročilé úrovně znalostí aplikace Microsoft Excel. Pokud nemáte čas číst celý článek, můžete si soubor stáhnout a poradit si s ním sami.

Pokud se často přistihnete, že něco takového potřebujete udělat Vřele doporučuji zvážit koupi knihy. Statistické výpočty v Excelu.

Co je důležité vědět o korelacích

Pro výpočet spolehlivé korelace je nutné mít spolehlivý vzorek, čím větší je, tím spolehlivější bude výsledek. Pro účely tohoto příkladu jsem vzal denní vzorek směnných kurzů za 10 let. Data jsou volně dostupná, převzal jsem je ze stránek http://oanda.com.

Co jsem vlastně udělal

(1) Když jsem měl svá původní data, začal jsem kontrolou míry korelace mezi těmito dvěma datovými sadami. K tomu jsem použil funkci CORREL (CORREL) - je o ní málo informací. Vrací stupeň korelace mezi dvěma rozsahy dat. Výsledek, upřímně řečeno, nebyl nijak zvlášť působivý (jen asi 70 %). Obecně je míra korelace mezi dvěma hodnotami považována za druhou mocninu této hodnoty, to znamená, že korelace se ukázala jako spolehlivá přibližně na 49%. To je velmi málo!

(2) Připadalo mi to velmi zvláštní. Jaké chyby se mohly vloudit do mých výpočtů? Rozhodl jsem se tedy vytvořit graf a zjistit, co se může stát. Graf byl záměrně jednoduchý, rozdělený podle let, abyste mohli vizuálně vidět, kde se korelace zlomí. Graf vypadá takto

(3) Z grafu je zřejmé, že v rozmezí cca 35 rublů za euro se korelace začíná lámat na dvě části. Z tohoto důvodu se ukázalo, že je nespolehlivá. Bylo nutné určit v souvislosti s tím, co se děje.

(4) Barva ukazuje, že tyto údaje se týkají let 2007, 2008, 2009. Rozhodně! Období ekonomických vrcholů a recesí obvykle nejsou statisticky spolehlivá, což se v tomto případě stalo. Proto jsem se pokusil tato období z dat vyloučit (dobře, pro ověření jsem zkontroloval míru korelace dat v tomto období). Míra korelace pouze těchto údajů je 0,01 %, to znamená, že v zásadě chybí. Ale bez nich data korelují přibližně z 81 %. To už je poměrně spolehlivá korelace. Zde je graf s funkcí.

Další kroky

Teoreticky lze korelační funkci zpřesnit jejím převedením z lineární na exponenciální nebo logaritmickou. V tomto případě statistická významnost korelace roste přibližně o jedno procento, ale enormně se zvyšuje složitost aplikace vzorce. Proto si za sebe kladu otázku: je to opravdu nutné? Vy rozhodujete – pro každý konkrétní případ.

S korelací stejná hodnota jednoho atributu odpovídá různým hodnotám druhého. Například: existuje korelace mezi výškou a hmotností, mezi výskytem zhoubných novotvarů a věkem atd.

Pro výpočet korelačního koeficientu existují 2 metody: metoda čtverců (Pearson), metoda pořadí (Spearman).

Nejpřesnější je metoda čtverců (Pearson), ve které je korelační koeficient určen vzorcem: , kde

r xy je korelační koeficient mezi statistickými řadami X a Y.

d x je odchylka každého z čísel statistické řady X od jeho aritmetického průměru.

d y je odchylka každého z čísel statistické řady Y od jeho aritmetického průměru.

V závislosti na síle spojení a jeho směru se korelační koeficient může pohybovat od 0 do 1 (-1). Korelační koeficient 0 znamená úplný nedostatek spojení. Čím blíže je úroveň korelačního koeficientu 1 nebo (-1), tím větší je, v tomto pořadí, tím bližší je přímá nebo zpětná vazba jím měřená. S korelačním koeficientem rovným 1 nebo (-1) je spojení kompletní, funkční.

Schéma pro odhad síly korelace pomocí korelačního koeficientu

Síla spojení	Hodnota korelačního koeficientu, je-li k dispozici
Síla spojení	přímé připojení (+)	zpětná vazba (-)
Žádné připojení
Komunikace je malá (slabá)	od 0 do +0,29	0 až -0,29
Průměrná komunikace (střední)	+0,3 až +0,69	-0,3 až -0,69
Komunikace velká (silná)	+0,7 až +0,99	-0,7 až -0,99
Komunikace je kompletní (funkční)

Pro výpočet korelačního koeficientu metodou čtverců je sestavena tabulka o 7 sloupcích. Pojďme analyzovat proces výpočtu na příkladu:

URČITE SILU A CHARAKTER VZTAHU MEZI MEZI

Je čas- ness struma (PROTI y )	d x= PROTI X –M X	d y= PROTI y –M y	d X d y	d X 2	d y 2







			Σ -1345 ,0	Σ 13996 ,0	Σ 313 , 47

1. Určete průměrný obsah jódu ve vodě (v mg / l).

mg/l

2. Určete průměrný výskyt strumy v %.

3. Určete odchylku každého V x od M x, tzn. d x .

201–138=63; 178–138=40 atd.

4. Podobně určíme odchylku každého V y od M y, tzn. d

0,2–3,8=-3,6; 0,6–38 = -3,2 atd.

5. Určujeme součiny odchylek. Výsledný produkt se sečte a získá.

6. Odmocnime d x a shrneme výsledky, dostaneme.

7. Podobně odmocníme d y, shrneme výsledky, dostaneme

8. Nakonec dosadíme všechny obdržené částky do vzorce:

Pro vyřešení otázky spolehlivosti korelačního koeficientu je stanoven průměrná chyba podle vzorce:

(Pokud je počet pozorování menší než 30, pak je jmenovatelem n-1).

V našem příkladu

Hodnota korelačního koeficientu se považuje za spolehlivou, pokud je alespoň 3x vyšší než jeho střední chyba.

V našem příkladu

Korelační koeficient tedy není spolehlivý, a proto je nutné zvýšit počet pozorování.

Korelační koeficient lze určit poněkud méně přesným, ale mnohem jednodušším způsobem, metodou pořadí (Spearman).

Spearmanova metoda: P=1-(6∑d 2 /n-(n 2 -1))

vytvořte dvě řady spárovaných porovnávaných prvků, přičemž označte první a druhou řadu x a y. Současně uveďte první řádek atributu v sestupném nebo vzestupném pořadí a umístěte číselné hodnoty druhého řádku naproti hodnotám prvního řádku, kterým odpovídají.

hodnota prvku v každém z porovnávaných řádků by měla být nahrazena sériovým číslem (rank). Pořadí neboli čísla označují místa ukazatelů (hodnot) prvního a druhého řádku. V tomto případě by hodnosti měly být přiřazeny k číselným hodnotám druhého atributu ve stejném pořadí, jaké bylo přijato při distribuci jejich hodnot na hodnoty prvního atributu. Při stejných hodnotách atributu v řadě by se pořadí mělo určit jako průměrné číslo ze součtu pořadových čísel těchto hodnot

určete rozdíl v pořadí mezi x a y (d): d = x - y

druhá mocnina výsledného rozdílu pořadí (d 2)

získejte součet čtverců rozdílu (Σ d 2) a získané hodnoty dosaďte do vzorce:

Příklad: použití hodnostní metody ke stanovení směru a síly vztahu mezi délkou služby v letech a četností zranění, pokud jsou získány následující údaje:

Odůvodnění výběru metody: k vyřešení problému lze zvolit pouze metodu hodnostní korelace, protože první řádek atributu „pracovní praxe v letech“ má otevřené možnosti (praxe do 1 roku a 7 a více let), což neumožňuje přesnější metodou – metodou čtverců – stanovit vztah mezi porovnávané vlastnosti.

Řešení. Posloupnost výpočtů je popsána v textu, výsledky jsou uvedeny v tabulce. 2.

tabulka 2

Pracovní zkušenosti v letech	Počet zranění	Pořadová čísla (hodnosti)	Rozdíl v pořadí	rozdíl pořadí na druhou
Pracovní zkušenosti v letech	Počet zranění		d(x-y)	d 2

Každý z řádků párových znaků je označen "x" a "y" (sloupce 1-2).

Hodnota každého ze znaků je nahrazena hodnostním (sériovým) číslem. Pořadí rozdělení hodností v řadě „x“ je následující: minimální hodnotě atributu (zkušenosti do 1 roku) je přiděleno pořadové číslo „1“, následné varianty stejné řady atributu, resp. , ve vzestupném pořadí od 2., 3., 4. a 5. pořadového čísla - pořadí (viz sloupec 3). Podobné pořadí je pozorováno při distribuci hodnocení do druhého prvku „y“ (sloupec 4). V případech, kdy existuje více variant stejné velikosti (například ve standardním úkolu se jedná o 12 a 12 zranění na 100 pracovníků s praxí 3-4 roky a 5-6 let), je uvedeno sériové číslo o průměrný počet ze součtu jejich pořadových čísel.Tyto údaje o počtu zranění (12 zranění) v žebříčku by měly obsadit 2. a 3. místo, takže průměrný počet je (2 + 3) / 2 = 2,5. ) by měla mít stejná pořadí – „2,5“ (sloupec 4).

Určete rozdíl v pozicích d = (x - y) - (sloupec 5)

Umocnění rozdílu v řadách (d 2) a získání součtu druhých mocnin rozdílu v řadách Σ d 2 (sloupec 6).

Vypočítejte koeficient pořadové korelace pomocí vzorce:

kde n je počet shodných párů možností v řádku „x“ a řádku „y“

"Korelace" v latině znamená "souvztažnost", "vztah". Kvantitativní charakteristiku vztahu lze získat výpočtem korelačního koeficientu. Tento koeficient, oblíbený ve statistických analýzách, ukazuje, zda spolu nějaké parametry souvisejí (například výška a váha; úroveň inteligence a akademický výkon; počet zranění a hodin práce).

Použití korelace

Korelační výpočet je zvláště široce používán v ekonomii, sociologický výzkum, medicína a biometrie – všude tam, kde můžete získat dvě sady dat, mezi kterými lze najít souvislost.

Korelaci můžete vypočítat ručně provedením jednoduchých aritmetických operací. Proces výpočtu je však velmi časově náročný, pokud je soubor dat velký. Zvláštností metody je, že vyžaduje sběr velký počet zdrojová data, aby bylo možné co nejpřesněji zobrazit, zda existuje vztah mezi prvky. Proto je seriózní použití korelační analýzy nemožné bez použití výpočetní techniky. Jedním z nejpopulárnějších a cenově dostupných programů pro řešení tohoto problému je.

Jak provést korelaci v Excelu?

Časově nejnáročnějším krokem při určování korelace je soubor dat. Porovnávaná data jsou obvykle uspořádána do dvou sloupců nebo řádků. Tabulka by měla být vyrobena bez mezer v buňkách. Moderní verze Excelu (od roku 2007 a mladší) nevyžadují další nastavení pro statistické výpočty; potřebné manipulace lze provést:

Vyberte prázdnou buňku, ve které se zobrazí výsledek výpočtu.
Klikněte na položku "Vzorce" v hlavní nabídce aplikace Excel.
Mezi tlačítky seskupenými v "Knihovně funkcí" vyberte "Další funkce".
V rozevíracích seznamech vyberte funkci výpočtu korelace (Statistická - KOREL).
Excel otevře panel Argumenty funkcí. "Pole 1" a "Pole 2" jsou rozsahy porovnávaných dat. Chcete-li automaticky vyplnit tato pole, můžete jednoduše vybrat požadované buňky tabulky.
Klepnutím na tlačítko OK zavřete okno argumentů funkce. V buňce se objeví vypočítaný korelační koeficient.

Korelace může být přímá (pokud je koeficient větší než nula) a inverzní (od -1 do 0).

První znamená, že jak se jeden parametr zvyšuje, zvyšuje se i druhý. Inverzní (negativní) korelace odráží skutečnost, že když jedna proměnná roste, druhá klesá.

Korelace se může blížit nule. To obvykle naznačuje, že studované parametry spolu nesouvisí. Někdy však dojde k nulové korelaci, pokud je vytvořen neúspěšný vzorek, který neodráží vztah, nebo má vztah komplexní nelineární povahu.

Pokud koeficient vykazuje střední nebo silný vztah (od ±0,5 do ±0,99), je třeba mít na paměti, že se jedná pouze o statistický vztah, který vůbec nezaručuje vliv jednoho parametru na druhý. Nelze také vyloučit situaci, že oba parametry jsou na sobě nezávislé, ale jsou ovlivněny nějakým třetím nezapočteným faktorem. Excel vám pomůže okamžitě vypočítat korelační koeficient, ale obvykle pouze kvantitativní metody nestačí ke stanovení kauzálních vztahů v korelovaných vzorcích.