Odaberite Stranica

Spearmanova metoda korelacije rangova na mreži. Korelaciona analiza po Spearman metodi (Spearman rangovi)

koeficijent rang korelacije Spearman je neparametarska metoda na koju se koristi statistička studija veze između pojava. U ovom slučaju se utvrđuje stvarni stepen paralelizma između dvije kvantitativne serije proučavanih karakteristika i procjenjuje čvrstoća uspostavljene veze pomoću kvantitativno izraženog koeficijenta.

1. Istorijat razvoja koeficijenta rang korelacije

Ovaj kriterijum je razvijen i predložen za analizu korelacije 1904. godine Charles Edward Spearman, engleski psiholog, profesor na Univerzitetima u Londonu i Chesterfieldu.

2. Za šta se koristi Spearmanov omjer?

Spearmanov koeficijent korelacije ranga koristi se za identifikaciju i procjenu bliskosti odnosa između dvije serije upoređenih kvantitativnih indikatora. U slučaju da se rangovi indikatora, poredani po stepenu povećanja ili smanjenja, u većini slučajeva poklapaju (veća vrijednost jednog indikatora odgovara većoj vrijednosti drugog indikatora - npr. kada se poredi visina pacijenta i njegova tjelesna težina), zaključuje se da postoji ravno korelacija. Ako rangovi indikatora imaju suprotan smjer (veća vrijednost jednog indikatora odgovara nižoj vrijednosti drugog - npr. kada se poredi starost i broj otkucaja srca), zatim razgovaraju o obrnuto veze između indikatora.

    Spearmanov koeficijent korelacije ima sljedeća svojstva:
  1. Koeficijent korelacije može imati vrijednosti od minus jedan do jedan, a pri rs=1 postoji strogo direktan odnos, a pri rs= -1 - striktno Povratne informacije.
  2. Ako je koeficijent korelacije negativan, onda postoji inverzna veza; ako je pozitivan, onda postoji direktna veza.
  3. Ako je koeficijent korelacije jednak nuli, onda odnos između veličina praktično izostaje.
  4. Što je modul koeficijenta korelacije bliži jedinici, to je veza između izmjerenih vrijednosti jača.

3. U kojim slučajevima se može koristiti Spearmanov koeficijent?

Zbog činjenice da je koeficijent metoda neparametrijska analiza, nije potrebna provjera normalne distribucije.

Uporedivi indikatori se mogu mjeriti kao u kontinuirana skala(na primjer, broj eritrocita u 1 µl krvi), i u redni(na primjer, ocjene kolega od 1 do 5).

Učinkovitost i kvalitet Spearmanove procjene se smanjuje ako je razlika između različitih vrijednosti bilo koje mjerene veličine dovoljno velika. Ne preporučuje se korištenje Spearmanovog koeficijenta ako postoji neravnomjerna raspodjela vrijednosti mjerene veličine.

4. Kako izračunati Spearmanov omjer?

Izračun koeficijenta korelacije Spearmanovog ranga uključuje sljedeće korake:

5. Kako protumačiti vrijednost Spearmanovog koeficijenta?

Kada se koristi koeficijent korelacije ranga, bliskost veze između znakova se uslovno procjenjuje, s obzirom na vrijednosti koeficijenta jednake 0,3 ili manje - pokazatelje slabe bliskosti veze; vrijednosti veće od 0,4, ali manje od 0,7 su pokazatelji umjerene bliskosti veze, a vrijednosti od 0,7 i više su pokazatelji velike bliskosti komunikacije.

Statistička značajnost dobijenog koeficijenta procjenjuje se pomoću Studentovog t-testa. Ako je izračunata vrijednost t-kriterijuma manja od tabelarne vrijednosti za dati broj stupnjeva slobode, statistička značajnost promatranog odnosa izostaje. Ako je više, tada se korelacija smatra statistički značajnom.

37. Spearmanov koeficijent korelacije ranga.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Spearmanov koeficijent korelacije ranga koristi se kada:
- varijable imaju skala rangiranja mjerenja;
- distribucija podataka se previše razlikuje od normalno ili uopšte nije poznato
- uzorci su mali (N< 30).

Tumačenje Spearmanovog koeficijenta rang korelacije ne razlikuje se od Pearsonovog koeficijenta, ali je njegovo značenje nešto drugačije. Da bismo razumjeli razliku između ovih metoda i logično potkrijepili područja njihove primjene, uporedimo njihove formule.

Pearsonov koeficijent korelacije:

Spearmanov koeficijent korelacije:

Kao što vidite, formule se značajno razlikuju. Uporedite formule

Formula Pirsonove korelacije koristi aritmetičku sredinu i standardnu ​​devijaciju koreliranog niza, dok Spearmanova formula ne koristi. Dakle, da bi se dobio adekvatan rezultat prema Pearsonovoj formuli, potrebno je da korelirani niz bude blizak normalnoj raspodjeli (srednja i standardna devijacija su parametri normalna distribucija ). Za Spearmanovu formulu to nije relevantno.

Element Pearsonove formule je standardizacija svake serije u z-score.

Kao što vidite, konverzija varijabli u Z-skalu je prisutna u formuli koeficijenta korelacije Pearson. Shodno tome, za Pearsonov koeficijent, skala podataka je apsolutno irelevantna: na primjer, možemo povezati dvije varijable, od kojih jedna ima min. = 0 i max. = 1, a drugi min. = 100 i maks. = 1000. Bez obzira na to koliko se raspon vrijednosti razlikuje, sve će se konvertirati u standardni z-rezultati identične po obimu.

Ne postoji takva normalizacija u Spearmanovom koeficijentu, dakle

OBAVEZNI USLOVI ZA KORIŠĆENJE SPEERMANOVOG KOEFICIJENTA JE JE JEDNAKOST OPSEGA DVIJE VARIJABLE.

Prije korištenja Spearmanovog koeficijenta za nizove podataka s različitim rasponima, potrebno je rang. Rangiranje dovodi do toga da vrednosti ovih serija dobijaju isti minimum = 1 (minimalni rang) i maksimum jednak broju vrednosti (maksimum, poslednji rang = N, tj. maksimalni broj slučajeva u uzorak).

U kojim slučajevima je moguće bez rangiranja

To su slučajevi u kojima su podaci izvorni skala rangiranja. Na primjer, Rokeachov test orijentacije vrijednosti.

Također, ovo su slučajevi kada je broj opcija vrijednosti mali, a u uzorku su fiksni minimum i maksimum. Na primjer, u semantičkom diferencijalu, minimum = 1, maksimum = 7.

Primjer izračunavanja koeficijenta korelacije Spearmanovog ranga

Rokeachov test vrednosnih orijentacija proveden je na dva uzorka X i Y. Zadatak je bio otkriti koliko su bliske hijerarhije vrijednosti ovih uzoraka (bukvalno, koliko su slične).

Provjerava se rezultirajuća vrijednost r=0,747 tabela kritičnih vrednosti. Prema tabeli, pri N=18, dobijena vrijednost je pouzdana na nivou p<=0,005

Koeficijenti korelacije ranga prema Spearmanu i Kendalu

Za varijable koje pripadaju ordinalnoj skali ili za varijable koje ne prate normalnu distribuciju, kao i za varijable koje pripadaju intervalnoj skali, umjesto Pirsonovog koeficijenta izračunava se Spearmanova rang korelacija. Da bi se to postiglo, pojedinačnim vrijednostima varijabli dodijeljena su mjesta rangiranja, koja se naknadno obrađuju pomoću odgovarajućih formula. Da biste otkrili korelaciju ranga, poništite izbor u polju za potvrdu zadane Pearsonove korelacije u dijaloškom okviru Bivarijantne korelacije.... Umjesto toga, aktivirajte Spearmanovo izračunavanje korelacije. Ovaj proračun će dati sljedeće rezultate. Koeficijenti korelacije ranga su vrlo blizu odgovarajućim vrijednostima Pearsonovih koeficijenata (originalne varijable imaju normalnu distribuciju).

titkova-matmetody.pdf str. 45

Spearmanova metoda korelacije ranga omogućava vam da odredite čvrstoću (snagu) i smjer

korelacija između dva znaka ili dva profila (hijerarhije) znakovi.

Za izračunavanje rang korelacije potrebno je imati dvije serije vrijednosti,

koji se mogu rangirati. Ovi rasponi vrijednosti mogu biti:

1) dva znaka mjereno u istom grupa ispitanici;

2) dvije pojedinačne hijerarhije karakteristika, identifikovana u dva predmeta za isti

skup karakteristika;

3) dva grupne hijerarhije karakteristika,

4) individualno i grupno hijerarhija karakteristika.

Prvo, indikatori se rangiraju zasebno za svaku od karakteristika.

Po pravilu, nižoj vrijednosti osobine dodjeljuje se niži rang.

U prvom slučaju (dvije karakteristike), pojedinačne vrijednosti se rangiraju prema prvom

osobina koju su dobili različiti subjekti, a zatim pojedinačne vrijednosti za drugu

sign.

Ako su dva znaka pozitivno povezana, onda su subjekti niskog ranga u

jedan od njih će imati niske rangove u drugom, a subjekti sa visokim rangom

jedna od osobina će takođe imati visoke rangove druge osobine. Za brojanje rs

potrebno je utvrditi razlike (d) između rangova koje su ovi subjekti stekli na oba

znakovi. Zatim se ovi indikatori d transformišu na određeni način i oduzmu od 1. Nego

što je manja razlika između rangova, veći će biti rs, to će biti bliže +1.

Ako nema korelacije, onda će svi rangovi biti pomiješani i neće ih biti

nema podudaranja. Formula je dizajnirana tako da u ovom slučaju rs bude blizu 0.

U slučaju negativne korelacije nizak rang subjekata po jednom osnovu

će odgovarati visokim rangovima na drugom atributu, i obrnuto. Što više neusklađenosti

između rangova subjekata u dvije varijable, rs je bliži -1.

U drugom slučaju (dva pojedinačna profila), pojedinac

vrijednosti koje je dobio svaki od 2 subjekta prema određenom (isto za njih

oba) skup karakteristika. Prvi rang će dobiti osobinu sa najnižom vrijednošću; drugi rang -

znak veće vrednosti itd. Očigledno, sve karakteristike moraju biti izmjerene

iste jedinice, inače je rangiranje nemoguće. Na primjer, nemoguće je

rangirajte indikatore prema Cattell upitniku ličnosti (16PF), ako su izraženi u

"sirovi" rezultati, budući da su rasponi vrijednosti različiti za različite faktore: od 0 do 13, od 0 do

20 i od 0 do 26. Ne možemo reći koji će od faktora zauzeti prvo mjesto po pitanju

ozbiljnosti, dok sve vrijednosti ne dovedemo u jednu skalu (najčešće je to skala zidova).

Ako su pojedinačne hijerarhije dvaju subjekata pozitivno povezane, onda znaci

ako imate niske rangove u jednom od njih, imaćete niske rangove u drugom, i obrnuto.

Na primjer, ako za jedan subjekt faktor E (dominacija) ima najniži rang, onda za

drugi predmet, trebalo bi da ima nizak rang ako jedan subjekt ima faktor C

(emocionalna stabilnost) ima najviši rang, onda mora imati i drugi subjekt

ovaj faktor ima visok rang i tako dalje.

U trećem slučaju (dva grupna profila) rangiraju se prosječne vrijednosti grupe,

primljeno u 2 grupe predmeta prema određenom, identičnom za dvije grupe, skupu

znakovi. U daljem tekstu, linija rezonovanja je ista kao u prethodna dva slučaja.

U slučaju 4. (individualni i grupni profili), oni se posebno rangiraju

individualne vrijednosti subjekta i prosječne grupne vrijednosti za isti skup

znakovi koji se dobijaju, po pravilu, isključujući ovaj pojedinačni subjekt - on

ne učestvuje u prosečnom grupnom profilu, sa kojim će se njegov pojedinac uporediti

profil. Korelacija ranga će vam omogućiti da provjerite koliko je dosljedan pojedinac i

grupni profili.

U sva četiri slučaja značajnost dobijenog koeficijenta korelacije određena je pomoću

po broju rangiranih vrijednosti N. U prvom slučaju, ovaj broj će se poklopiti sa

veličina uzorka n. U drugom slučaju, broj zapažanja će biti broj karakteristika,

čine hijerarhiju. U trećem i četvrtom slučaju, N je takođe broj uparivanja

znakova, a ne broja subjekata u grupama. Detaljna objašnjenja su data u primjerima. Ako

apsolutna vrijednost rs dostiže kritičnu vrijednost ili je premašuje, korelacija

pouzdan.

Hipoteze.

Postoje dvije moguće hipoteze. Prvi se odnosi na slučaj 1, drugi na ostala tri

Prva verzija hipoteza

H0: Korelacija između varijabli A i B se ne razlikuje od nule.

H2: Korelacija između varijabli A i B značajno se razlikuje od nule.

Druga verzija hipoteza

H0: Korelacija između hijerarhija A i B se ne razlikuje od nule.

H2: Korelacija između hijerarhija A i B značajno se razlikuje od nule.

Ograničenja koeficijenta korelacije ranga

1. Za svaku varijablu mora se dostaviti najmanje 5 zapažanja. Upper

granica uzorkovanja određena je dostupnim tabelama kritičnih vrijednosti .

2. Spearmanov koeficijent korelacije ranga rs sa velikim brojem identičnih

rangovi za jednu ili obje podudarne varijable daje grube vrijednosti. Idealno

obje korelirane serije moraju biti dvije nepodudarne sekvence

vrijednosti. Ako ovaj uslov nije ispunjen, potrebno je izvršiti prilagodbu

isti činovi.

Spearmanov koeficijent korelacije ranga izračunava se po formuli:

Ako u obje upoređene serije rangiranja postoje grupe istog ranga,

prije izračunavanja koeficijenta rang korelacije potrebno je izvršiti korekciju za isti

rangovi Ta i Tv:

Ta \u003d Σ (a3 - a) / 12,

TV \u003d Σ (v3 - c) / 12,

Gdje A - zapremina svake grupe identičnih rangova u nizu rangova A, in obim svake

grupe jednakih rangova u rangu serije B.

Da biste izračunali empirijsku vrijednost rs, koristite formulu:

38. Isprekidani biserijski koeficijent korelacije.

Za korelaciju uopšte, videti pitanje br.36 With. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Neka se varijabla X mjeri na jakoj skali, a varijabla Y na dihotomnoj skali. Koeficijent biserijske korelacije tačaka rpb izračunava se po formuli:

Ovdje je x 1 prosječna vrijednost za X objekte sa vrijednošću "jedan" za Y;

x 0 - prosječna vrijednost za X objekte sa vrijednošću "nula" za Y;

s x - standardna devijacija svih vrijednosti za X;

n 1 - broj objekata "jedan" u Y, n 0 - broj objekata "nula" u Y;

n = n 1 + n 0 je veličina uzorka.

Koeficijent biserijske korelacije tačaka se također može izračunati korištenjem drugih ekvivalentnih izraza:

Evo x je ukupna srednja vrijednost za varijablu X.

Koeficijent biserijske korelacije tačaka rpb varira od –1 do +1. Njegova vrijednost je jednaka nuli u slučaju da su varijable s jedinicom za Y imaju prosek Y, jednako srednjoj vrijednosti varijabli sa nulom preko Y.

Ispitivanje hipoteze o značaju tačka biserijski koeficijent korelacije treba provjeriti Nulta hipotezah 0 o jednakosti opšteg koeficijenta korelacije sa nulom: ρ = 0, što se izvodi po Studentovom kriterijumu. Empirijska vrijednost

u poređenju sa kritičnim vrednostima t a (df) za broj stepeni slobode df = n– 2

Ako je uslov | t| ≤ ta(df), nulta hipoteza ρ = 0 se ne odbacuje. Koeficijent biserijske korelacije tačaka značajno se razlikuje od nule ako je empirijska vrijednost | t| pada u kritično područje, odnosno ako je uslov | t| > ta(n– 2). Pouzdanost odnosa izračunata korišćenjem biserijskog koeficijenta korelacije tačaka rpb, može se odrediti i korištenjem kriterija χ 2 za broj stupnjeva slobode df= 2.

Tačka-biserijska korelacija

Naknadna modifikacija koeficijenta korelacije proizvoda momenata odrazila se u točkasto-biserijskom r. Ova stat. prikazuje odnos između dvije varijable, od kojih je jedna navodno kontinuirana i normalno raspoređena, dok je druga diskretna u tačnom smislu te riječi. Tačka-biserijski koeficijent korelacije je označen sa r pbis Jer u r pbis dihotomija odražava pravu prirodu diskretne varijable, a ne umjetna, kao u slučaju r bis, njegov predznak je proizvoljno određen. Dakle, za sve prakse ciljevi r pbis razmatra se u rasponu od 0,00 do +1,00.

Postoji i takav slučaj kada se dvije varijable smatraju kontinuiranim i normalno raspoređenim, ali su obje umjetno dihotomizirane, kao u slučaju biserijske korelacije. Za procjenu odnosa između takvih varijabli koristi se tetrahorični koeficijent korelacije r tet, koju je također uzgajao Pearson. Main (tačne) formule i procedure za izračunavanje r tet su prilično složeni. Stoga, sa praksom. ova metoda koristi aproksimacije r tet dobijene na osnovu skraćenih postupaka i tabela.

/online/dictionary/dictionary.php?term=511

BISERIJSKI KOEFICIJENT KORELACIJE S TAČKAMA je koeficijent korelacije između dvije varijable, od kojih se jedna mjeri na dihotomnoj skali, a druga na intervalnoj skali. Koristi se u klasičnoj i modernoj testologiji kao pokazatelj kvaliteta. test zadatak– pouzdanost-konzistentnost sa ukupnim rezultatom testa.

Za korelaciju varijabli izmjerenih u dihotomna i intervalna skala koristiti tačka-biserijski koeficijent korelacije.
Bod-biserijski koeficijent korelacije je metoda korelacijske analize omjera varijabli, od kojih se jedna mjeri u skali imena i uzima samo 2 vrijednosti (na primjer, muškarci / žene, odgovor je tačan / odgovor je netačan, postoji znak / nema znaka), a drugi u omjeru skale ili skali intervala. Formula za izračunavanje koeficijenta biserijske korelacije:

gdje:
m1 i m0 su prosječne vrijednosti X sa vrijednošću 1 ili 0 u Y.
σx je standardna devijacija svih vrijednosti za X
n1 ,n0 – broj X vrijednosti od 1 ili 0 do Y.
n je ukupan broj parova vrijednosti

Najčešće se ovaj tip koeficijenta korelacije koristi za izračunavanje odnosa testnih jedinica sa sumarnom skalom. Ovo je jedna vrsta provjere valjanosti.

39. Rang-biserijski koeficijent korelacije.

Za korelaciju uopšte, videti pitanje br.36 With. 56 (64) 063.JPG

harchenko-korranaliz.pdf str. 28

Koeficijent korelacije rang-biser koji se koristi kada je jedna od varijabli ( X) je predstavljen u ordinalnoj skali, a drugi ( Y) - dihotomno, izračunato po formuli

.

Ovdje je prosječan rang objekata koji imaju jedinstvo Y; je prosječan rang objekata sa nula in Y, n je veličina uzorka.

Ispitivanje hipoteze o značaju rang-biserijski koeficijent korelacije izvodi se slično kao i biserijski koeficijent korelacije tačaka koristeći Studentov t-test sa zamjenom u formulama rpb on rrb.

Kada se jedna varijabla mjeri na dihotomnoj skali (varijabla x), a drugi na skali ranga (varijabla Y), koristeći rang-biserijski koeficijent korelacije. Sjećamo se da je varijabla x, mjeren u dihotomnoj skali, uzima samo dvije vrijednosti (šifre) 0 i 1. Naglasimo posebno da uprkos činjenici da ovaj koeficijent varira u rasponu od –1 do +1, njegov predznak nije bitan za tumačenje rezultate. Ovo je još jedan izuzetak od opšteg pravila.

Izračun ovog koeficijenta vrši se prema formuli:

gdje ` X 1 prosječni rang nad tim elementima varijable Y, što odgovara kodu (obilježju) 1 u varijabli X;

`X 0 – prosječan rang za te elemente varijable Y,što odgovara kodu (obilježju) 0 u varijabli X\

N- ukupan broj elemenata u varijabli x.

Za primjenu rang-biserijskog koeficijenta korelacije, moraju biti ispunjeni sljedeći uslovi:

1. Varijable koje se upoređuju moraju se mjeriti na različitim skalama: jedan X- u dihotomnoj skali; drugi Y– na ljestvici rangiranja.

2. Broj različitih karakteristika u upoređenim varijablama X I Y trebao bi biti isti.

3. Za procjenu stepena pouzdanosti koeficijenta rang-biserijske korelacije treba koristiti formulu (11.9) i tabelu kritičnih vrijednosti za Studentov test kada k = n - 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Slučajevi u kojima je jedna od varijabli prisutna u dihotomna skala, a drugi u rang (redni), zahtijevaju upotrebu rang-biserijski koeficijent korelacije:

rpb=2 / n * (m1 - m0)

gdje:
n je broj mjernih objekata
m1 i m0 - prosječni rang objekata sa 1 ili 0 u drugoj varijabli.
Ovaj koeficijent se također koristi prilikom provjere valjanosti testova.

40. Koeficijent linearne korelacije.

O korelaciji uopšte (a posebno o linearnoj korelaciji), vidi pitanje br. 36 With. 56 (64) 063.JPG

PEARSONOV KOEFICIJENT KORELACIJE

r-Pearson (Pearson r) se koristi za proučavanje odnosa između dvije metrikedruge varijable mjerene na istom uzorku. Postoje mnoge situacije u kojima ga je prikladno koristiti. Utječe li inteligencija na uspješnost u višim godinama studija? Da li je visina plate zaposlenog povezana sa njegovom dobrom voljom prema kolegama? Da li raspoloženje učenika utiče na uspješnost rješavanja složenog aritmetičkog zadatka? Da bi odgovorio na takva pitanja, istraživač mora izmjeriti dva indikatora od interesa za svakog člana uzorka. Podaci za proučavanje odnosa se zatim prikazuju u tabeli, kao u primjeru ispod.

PRIMJER 6.1

U tabeli je dat primjer početnih podataka mjerenja za dva indikatora inteligencije (verbalni i neverbalni) kod 20 učenika 8. razreda.

Odnos između ovih varijabli može se prikazati pomoću dijagrama raspršenja (vidi sliku 6.3). Dijagram pokazuje da postoji određena veza između mjerenih indikatora: što je veća vrijednost verbalne inteligencije, to je (uglavnom) veća vrijednost neverbalne inteligencije.

Pre nego što damo formulu za koeficijent korelacije, pokušajmo da pratimo logiku njegovog nastanka, koristeći podatke primera 6.1. Položaj svake /-tačke (subjekta sa brojem /) na dijagramu raspršenja u odnosu na ostale tačke (slika 6.3) može se dati veličinama i predznacima odstupanja odgovarajućih vrijednosti varijabli od njihovih prosječne vrijednosti: (xj - MJ I (um at ). Ako se znaci ovih odstupanja poklapaju, onda to ukazuje u korist pozitivnog odnosa (velike vrijednosti za X odgovaraju velikim vrednostima at ili manje vrijednosti za X odgovaraju manjim vrijednostima y).

Za predmet br. 1, odstupanje od prosjeka X i po at pozitivna, a za predmet br. 3 oba odstupanja su negativna. Shodno tome, podaci oba ukazuju na pozitivnu vezu između proučavanih osobina. Naprotiv, ako su znaci odstupanja od prosjeka X i po at razlikuju, to će ukazati na negativan odnos između znakova. Tako je za predmet br. 4 odstupanje od prosjeka X je negativan, prema y - pozitivno, a za predmet br. 9 - obrnuto.

Dakle, ako je proizvod odstupanja (x, - M X ) X (um at ) pozitivan, tada podaci /-subjekta ukazuju na direktnu (pozitivnu) vezu, a ako je negativna, onda na inverznu (negativnu) vezu. Shodno tome, ako Xwy su uglavnom direktno proporcionalni, tada će većina proizvoda odstupanja biti pozitivna, a ako su obrnuto povezani, tada će većina proizvoda biti negativna. Stoga, zbir svih proizvoda odstupanja za dati uzorak može poslužiti kao opći pokazatelj jačine i smjera odnosa:

Uz direktno proporcionalnu vezu između varijabli, ova vrijednost je velika i pozitivna - za većinu ispitanika odstupanja se poklapaju u znaku (velike vrijednosti jedne varijable odgovaraju velikim vrijednostima druge varijable i obrnuto). Ako X I at imaju povratnu informaciju, tada će za većinu ispitanika velike vrijednosti jedne varijable odgovarati manjim vrijednostima druge varijable, tj. predznaci proizvoda će biti negativni, a zbir proizvoda u cjelini također će biti velik u apsolutnoj vrijednosti, ali negativno u predznaku. Ako ne postoji sistematski odnos između varijabli, tada će pozitivni članovi (proizvodi odstupanja) biti uravnoteženi negativnim članovima, a zbir svih proizvoda odstupanja će biti blizu nule.

Da zbir proizvoda ne zavisi od veličine uzorka, dovoljno je da se usredsredi. Ali nas zanima mera odnosa ne kao opšti parametar, već kao njegova izračunata procena – statistika. Stoga, što se tiče formule disperzije, u ovom slučaju ćemo učiniti isto, podijelimo zbir proizvoda odstupanja ne sa N, a na TV-u - 1. Ispada mjera komunikacije, koja se široko koristi u fizici i tehničkim naukama, koja se zove kovarijansa (Covahance):


IN psihologija, za razliku od fizike, većina varijabli se mjeri na proizvoljnim skalama, jer psihologe ne zanima apsolutna vrijednost atributa, već međusobnog dogovora ispitanici u grupi. Osim toga, kovarijansa je vrlo osjetljiva na skalu (disperziju) u kojoj se mjere mjere. Da bi mjera komunikacije bila nezavisna od mjernih jedinica bilo kojeg atributa, dovoljno je podijeliti kovarijansu na odgovarajuće standardne devijacije. Tako je i dobijeno za-K. Pearsonov koeficijent korelacije mule:

ili, nakon zamjene izraza za o x i


Ako su vrijednosti obje varijable pretvorene u r-vrijednosti pomoću formule


tada formula r-Pearsonovog koeficijenta korelacije izgleda jednostavnije (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

KORELACIJA LINEARNA- statistička nekauzalna linearna veza između dvije kvantitativne varijable X I at. Mjereno korištenjem "faktora K.L." Pearson, koji je rezultat dijeljenja kovarijance sa standardnim devijacijama obje varijable:

,

Gdje s xy- kovarijansa između varijabli X I at;

s x , s y- standardne devijacije za varijable X I at;

x i , y i- varijabilne vrijednosti X I at za broj objekta i;

x, y- aritmetički prosjek za varijable X I at.

Pearsonov omjer r može uzeti vrijednosti iz intervala [-1; +1]. Značenje r = 0 znači da nema linearnog odnosa između varijabli X I at(ali ne isključuje nelinearnu statističku vezu). Pozitivne vrijednosti koeficijenta ( r> 0) ukazuje na direktnu linearnu vezu; što je njegova vrijednost bliža +1, to je statistički direktni odnos jači. Negativne vrijednosti koeficijenta ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 znači prisustvo pune linearne veze, direktne ili obrnute. U slučaju potpune veze, sve tačke sa koordinatama ( x i , y i) leže na pravoj liniji y = a + bx.

"Koeficijent K.L." Pearson se također koristi za mjerenje čvrstoće odnosa u modelu linearne regresije para.

41. Korelaciona matrica i korelacioni graf.

Za korelaciju uopšte, videti pitanje br.36 With. 56 (64) 063.JPG

korelacione matrice.Često, analiza korelacije uključuje proučavanje odnosa ne dvije, već mnogih varijabli mjerenih na kvantitativnoj skali na jednom uzorku. U ovom slučaju, korelacije se izračunavaju za svaki par ovog skupa varijabli. Proračuni se obično vrše na računaru, a rezultat je matrica korelacije.

Korelaciona matrica(korelacija matrica) je rezultat izračunavanja korelacija istog tipa za svaki par iz skupa R varijable mjerene u kvantitativnoj skali na jednom uzorku.

PRIMJER

Pretpostavimo da proučavamo odnose između 5 varijabli (vl, v2,..., v5; P= 5), mjereno na uzorku od N=30Čovjek. Ispod je tabela početnih podataka i matrica korelacije.

I
povezani podaci:

Korelaciona matrica:

Lako je vidjeti da je matrica korelacije kvadratna, simetrična u odnosu na glavnu dijagonalu (takkakg, y = /) y), sa jedinicama na glavnoj dijagonali (od G I = Gu = 1).

Korelaciona matrica je kvadrat: broj redova i kolona jednak je broju varijabli. Ona simetrično u odnosu na glavnu dijagonalu, budući da je korelacija X With at jednaka korelacija at With X. Jedinice se nalaze na njegovoj glavnoj dijagonali, jer je korelacija karakteristike sa sobom jednaka jedinici. Shodno tome, nisu svi elementi korelacione matrice predmet analize, već oni koji su iznad ili ispod glavne dijagonale.

Broj koeficijenata korelacije, P karakteristike koje treba analizirati u proučavanju odnosa određuje se formulom: P(P- 1)/2. U gornjem primjeru, broj takvih koeficijenata korelacije je 5(5 - 1)/2 = 10.

Glavni zadatak analize korelacione matrice je otkrivanje strukture međuodnosa skupa karakteristika. Ovo omogućava vizuelnu analizu korelacijske plejade- grafička slika strukturira statističkiznačajne veze ako takvih veza nema mnogo (do 10-15). Drugi način je korištenje multivarijantnih metoda: višestruka regresija, faktorska ili klaster analiza (pogledajte odjeljak "Multivarijantne metode..."). Koristeći faktorijalnu ili klaster analizu, moguće je identificirati grupe varijabli koje su bliže povezane jedna s drugom nego s drugim varijablama. Kombinacija ovih metoda je također vrlo učinkovita, na primjer, ako ima mnogo znakova i nisu homogeni.

Poređenje korelacija - dodatni zadatak analize korelacijske matrice, koja ima dvije opcije. Ukoliko je potrebno uporediti korelacije u jednom od redova korelacione matrice (za jednu od varijabli), primenjuje se metoda poređenja za zavisne uzorke (str. 148-149). Kada se porede istoimene korelacije izračunate za različite uzorke, koristi se metoda poređenja za nezavisne uzorke (str. 147-148).

Comparison Methods korelacije u dijagonalama matrica korelacije (za procjenu stacionarnosti slučajnog procesa) i poređenje nekoliko korelacione matrice dobijene za različite uzorke (zbog njihove homogenosti) su dugotrajne i izvan okvira ove knjige. Sa ovim metodama možete se upoznati iz knjige GV Sukhodolsky 1 .

Problem statistički značaj korelacije. Problem je što je procedura statistička provera hipoteza sugeriše jedan-višestruko test obavljen na jednom uzorku. Ako se primeni ista metoda mnogo puta,čak i ako u odnosu na različite varijable, onda se povećava vjerovatnoća da se rezultat dobije čisto slučajno. IN opšti slučaj ako ponovimo istu metodu testiranja hipoteze do vremena u odnosu na različite varijable ili uzorke, tada sa utvrđenom vrijednošću a, garantirano ćemo dobiti potvrdu hipoteze u ahk broj slučajeva.

Pretpostavimo da je analizirana matrica korelacije za 15 varijabli, odnosno da je izračunato 15(15-1)/2 = 105 koeficijenata korelacije. Za provjeru hipoteza postavlja se nivo a = 0,05. Testiranjem hipoteze 105 puta dobićemo njenu potvrdu pet puta (!) bez obzira da li veza zaista postoji. Znajući to i primivši, recimo, 15 "statistički značajnih" koeficijenata korelacije, možemo li reći koji su od njih dobijeni slučajno, a koji odražavaju stvarnu vezu?

Strogo govoreći, prihvatiti statističko rješenje potrebno je smanjiti nivo a onoliko puta koliko se hipoteze provjeravaju. Ali to je teško preporučljivo, jer se vjerovatnoća ignorisanja stvarno postojeće veze (napraviti grešku tipa II) povećava na nepredvidiv način.

Korelaciona matrica sama po sebi nije dovoljna osnovaza statističke zaključke o pojedinačnim koeficijentima uključenim u njegakorelacije!

Postoji samo jedan zaista uvjerljiv način rješavanja ovog problema: nasumično podijeliti uzorak na dva dijela i uzeti u obzir samo one korelacije koje su statistički značajne u oba dijela uzorka. Alternativa može biti upotreba multivarijatnih metoda (faktorska, klasterska ili višestruka regresijska analiza) - za odabir i naknadnu interpretaciju grupa statistički značajno povezanih varijabli.

Problem nedostajućih vrijednosti. Ako u podacima nedostaju vrijednosti, tada su moguće dvije opcije za izračunavanje korelacijske matrice: a) red po red brisanje vrijednosti (isključitislučajevimapo listi); b) parno brisanje vrijednosti (isključitislučajevimau paru). At brisanje red po red zapažanja sa prazninama, briše se cijela linija za objekt (subjekt) koji ima najmanje jednu vrijednost koja nedostaje za jednu od varijabli. Ova metoda dovodi do "ispravne" korelacijske matrice u smislu da su svi koeficijenti izračunati iz istog skupa objekata. Međutim, ako su vrijednosti koje nedostaju nasumično raspoređene u varijablama, tada ova metoda može dovesti do činjenice da u razmatranom skupu podataka neće ostati niti jedan objekt (svaki red će sadržavati barem jednu vrijednost koja nedostaje). Da biste izbjegli ovu situaciju, koristite drugu metodu tzv uklanjanje u paru. Ova metoda uzima u obzir samo praznine u svakom odabranom paru varijabli stupaca i zanemaruje praznine u drugim varijablama. Korelacija za par varijabli izračunava se za one objekte kod kojih nema praznina. U mnogim situacijama, posebno kada je broj praznina relativno mali, recimo 10%, a praznine su prilično nasumično raspoređene, ova metoda ne dovodi do ozbiljnih grešaka. Međutim, ponekad to nije slučaj. Na primjer, u sistematskoj pristranosti (pomaku) procjene, sistematska lokacija praznina može biti "skrivena", što je razlog za razliku u koeficijentima korelacije izgrađenim na različitim podskupovima (na primjer, za različite podgrupe objekata). ). Još jedan problem povezan sa korelacionom matricom izračunatom sa u parovima Do uklanjanja jaza dolazi kada se ova matrica koristi u drugim vrstama analiza (na primjer, u višestrukoj regresiji ili faktorska analiza). Oni pretpostavljaju da se koristi "ispravna" matrica korelacije sa određenim nivoom konzistentnosti i "korespondencije" različitih koeficijenata. Upotreba matrice sa "lošim" (pristranim) procjenama dovodi do činjenice da program ili nije u stanju analizirati takvu matricu, ili će rezultati biti pogrešni. Stoga, ako se koristi parni metod eliminacije podataka koji nedostaju, potrebno je provjeriti da li postoje ili ne postoje sistematski obrasci u raspodjeli praznina.

Ako eliminacija podataka koji nedostaju u paru ne dovede do bilo kakvog sistematskog pomaka u srednjim vrijednostima i varijansama (standardne devijacije), onda će ove statistike biti slične onima izračunatim metodom red-by-line uklanjanja praznina. Ako postoji značajna razlika, onda postoji razlog za pretpostavku da je došlo do pomaka u procjenama. Na primjer, ako je srednja vrijednost (ili standardna devijacija) vrijednosti varijable A, koja je korištena za izračunavanje njegove korelacije sa varijablom IN, mnogo manje od srednje vrijednosti (ili standardne devijacije) istih vrijednosti varijable A, koji su korišćeni za izračunavanje njegove korelacije sa varijablom C, onda ima razloga za očekivati ​​da će ove dve korelacije (A-Bnas) na osnovu različitih podskupova podataka. Doći će do pomaka u korelacijama uzrokovanih nenasumičnom lokacijom praznina u vrijednostima varijabli.

Analiza korelacijskih plejada. Nakon rješavanja problema statističke značajnosti elemenata korelacijske matrice, statistički značajne korelacije mogu se grafički prikazati u obliku korelacijske plejade ili plejade. Korelaciona galaksija - to je figura koja se sastoji od vrhova i linija koje ih povezuju. Vrhovi odgovaraju karakteristikama i obično se označavaju brojevima - brojevima varijabli. Linije odgovaraju statistički značajnim odnosima i grafički izražavaju znak, a ponekad i nivo /j-značajnosti odnosa.

Korelaciona galaksija može reflektovati Sve statistički značajni odnosi korelacione matrice (ponekad se nazivaju korelacioni graf ) ili samo njihov smisleno odabrani dio (na primjer, koji odgovara jednom faktoru prema rezultatima faktorske analize).

PRIMJER KONSTRUKCIJE KORELACIJSKOG PLEJADA


Priprema za državnu (završnu) sertifikaciju diplomaca: formiranje baze podataka USE (opšta lista učesnika USE svih kategorija, sa naznakom predmeta) - uzimajući u obzir rezervne dane u slučaju podudarnosti predmeta;

  • Plan rada (27)

    Rješenje

    2. Aktivnosti obrazovne ustanove na poboljšanju sadržaja i procjeni kvaliteta u predmetima prirodno-matematičkog obrazovanja MOU srednja škola br. 4, Litvinovskaya, Chapaevskaya,

  • Spearmanova metoda korelacije rangova omogućava vam da odredite čvrstoću (snagu) i smjer korelacije između dvije karakteristike ili dva profila (hijerarhije) karakteristika.

    Za izračunavanje rang korelacije potrebno je imati dvije serije vrijednosti,

    koji se mogu rangirati. Ovi rasponi vrijednosti mogu biti:

    1) dva znaka merena u istoj grupi ispitanika;

    2) dve pojedinačne hijerarhije osobina identifikovanih kod dva subjekta za isti skup osobina;

    3) dvije grupne hijerarhije karakteristika,

    4) pojedinačne i grupne hijerarhije karakteristika.

    Prvo, indikatori se rangiraju zasebno za svaku od karakteristika.

    Po pravilu, nižoj vrijednosti osobine dodjeljuje se niži rang.

    U prvom slučaju (dva obilježja) rangiraju se pojedinačne vrijednosti za prvo obilježje koje su dobili različiti subjekti, a zatim pojedinačne vrijednosti za drugo obilježje.

    Ako su dva atributa pozitivno povezana, onda će subjekti sa niskim rangom u jednom od njih imati niske rangove u drugom, a subjekti sa visokim rangom u

    jedna od osobina će takođe imati visoke rangove druge osobine. Za izračunavanje rs potrebno je odrediti razliku (d) između rangova dobijenih od strane datog subjekta po oba osnova. Zatim se ovi indikatori d transformišu na određeni način i oduzmu od 1. Nego

    što je manja razlika između rangova, veći će biti rs, to će biti bliže +1.

    Ako nema korelacije, onda će svi rangovi biti pomiješani i neće ih biti

    nema podudaranja. Formula je dizajnirana tako da u ovom slučaju rs bude blizu 0.

    U slučaju negativne korelacije, nizak rang ispitanika po jednom atributu

    će odgovarati visokim rangovima na drugom atributu, i obrnuto. Što je veća razlika između rangova ispitanika na dvije varijable, to je rs bliži -1.

    U drugom slučaju (dva individualna profila), individualno

    vrijednosti koje je dobio svaki od 2 subjekta prema određenom (isto za oba) skupu karakteristika. Prvi rang će dobiti osobinu sa najnižom vrijednošću; drugi rang je karakteristika sa višom vrijednošću i tako dalje. Očigledno je da se sve karakteristike moraju mjeriti u istim jedinicama, inače je rangiranje nemoguće. Na primjer, nemoguće je rangirati indikatore prema Cattellovom upitniku ličnosti (16PF), ako su izraženi u "sirovim" ocjenama, jer su rasponi vrijednosti za različite faktore različiti: od 0 do 13, od 0 do

    20 i od 0 do 26. Ne možemo reći koji će od faktora zauzeti prvo mjesto po ozbiljnosti dok sve vrijednosti ne dovedemo na jednu skalu (najčešće je to zidna skala).

    Ako su pojedinačne hijerarhije dvaju subjekata pozitivno povezane, onda će karakteristike koje imaju niske rangove za jedan od njih imati niske rangove za drugi, i obrnuto. Na primjer, ako za jedan subjekt faktor E (dominacija) ima najniži rang, onda bi za drugi subjekt trebao imati nizak rang, ako jedan subjekt ima faktor C

    (emocionalna stabilnost) ima najviši rang, onda mora imati i drugi subjekt

    ovaj faktor ima visok rang i tako dalje.

    U trećem slučaju (dva grupna profila), prosječne grupne vrijednosti dobijene u 2 grupe ispitanika rangiraju se prema određenom skupu karakteristika koji je isti za dvije grupe. U daljem tekstu, linija rezonovanja je ista kao u prethodna dva slučaja.

    U slučaju 4. (individualni i grupni profili), pojedinačne vrijednosti subjekta i srednje grupne vrijednosti se rangiraju zasebno prema istom skupu karakteristika koje se po pravilu dobijaju isključivanjem ovog pojedinca. subjekat - ne učestvuje u srednjem grupnom profilu, sa kojim će se porediti individualni profil. Korelacija ranga će vam omogućiti da provjerite koliko su konzistentni individualni i grupni profili.

    U sva četiri slučaja, značajnost dobijenog koeficijenta korelacije određena je brojem rangiranih vrijednosti N. U prvom slučaju, ovaj broj će se poklapati sa veličinom uzorka n. U drugom slučaju, broj zapažanja će biti broj karakteristika koje čine hijerarhiju. U trećem i četvrtom slučaju, N je i broj upoređenih karakteristika, a ne broj ispitanika u grupama. Detaljna objašnjenja su data u primjerima. Ako apsolutna vrijednost rs dostigne ili premaši kritičnu vrijednost, korelacija je značajna.

    Hipoteze.

    Postoje dvije moguće hipoteze. Prvi se odnosi na slučaj 1, drugi na ostala tri slučaja.

    Prva verzija hipoteza

    H0: Korelacija između varijabli A i B se ne razlikuje od nule.

    H1: Korelacija između varijabli A i B značajno se razlikuje od nule.

    Druga verzija hipoteza

    H0: Korelacija između hijerarhija A i B se ne razlikuje od nule.

    H1: Korelacija između hijerarhija A i B značajno se razlikuje od nule.

    Ograničenja koeficijenta korelacije ranga

    1. Za svaku varijablu mora se dostaviti najmanje 5 zapažanja. Gornja granica uzorka određena je dostupnim tabelama kritičnih vrijednosti.

    2. Spearmanov koeficijent korelacije ranga rs sa velikim brojem identičnih rangova za jednu ili obje upoređene varijable daje grube vrijednosti. U idealnom slučaju, obje korelirane serije trebale bi biti dva niza neusklađenih vrijednosti. Ukoliko ovaj uslov nije ispunjen, potrebno je izvršiti prilagodbu za iste činove.

    Spearmanov koeficijent korelacije ranga izračunava se po formuli:

    Ako u obe upoređene serije ranga postoje grupe istih rangova, pre izračunavanja koeficijenta korelacije ranga potrebno je izvršiti korekcije za iste rangove Ta i Tv:

    Ta \u003d Σ (a3 - a) / 12,

    TV \u003d Σ (v3 - c) / 12,

    gdje je a volumen svake grupe identičnih rangova u nizu rangova A, c je volumen svakog

    grupe jednakih rangova u rangu serije B.

    Da biste izračunali empirijsku vrijednost rs, koristite formulu:

    Izračunavanje Spearmanovog koeficijenta korelacije ranga rs

    1. Odredite u kojoj će dvije karakteristike ili dvije karakteristične hijerarhije sudjelovati

    poređenje kao varijable A i B.

    2. Rangirajte vrijednosti varijable A, dodijelivši rang 1 najmanjoj vrijednosti, u skladu sa pravilima rangiranja (vidi A.2.3). Upišite rangove u prvu kolonu tabele prema broju subjekata ili znakova.

    3. Naručite vrijednosti varijable B, u skladu sa istim pravilima. Upišite rangove u drugu kolonu tabele prema broju subjekata ili znakova.

    5. Kvadrirajte svaku razliku: d2. Unesite ove vrijednosti u četvrtu kolonu tabele.

    Ta \u003d Σ (a3 - a) / 12,

    TV \u003d Σ (v3 - c) / 12,

    gdje je a volumen svake grupe identičnih rangova u rang-redu A; c - obim svake grupe

    isti rang u rang-seriji B.

    a) u nedostatku identičnih rangova

    rs  1 − 6 ⋅

    b) u prisustvu istih činova

    Σd 2  T  T

    r  1 − 6 ⋅ a in,

    gdje je Σd2 zbir kvadrata razlika između rangova; Ta i TV su ispravke za isto

    N je broj subjekata ili karakteristika koje su učestvovale u rangiranju.

    9. Odredite iz tabele (vidi Dodatak 4.3) kritične vrijednosti rs za dati N. Ako je rs veći ili barem jednak kritičnoj vrijednosti, korelacija se značajno razlikuje od 0.

    Primjer 4.1 Prilikom utvrđivanja stepena zavisnosti reakcije konzumiranja alkohola od okulomotorne reakcije u ispitivanoj grupi, podaci su dobijeni prije konzumiranja alkohola i nakon pijenja. Da li reakcija subjekta zavisi od stanja intoksikacije?

    Rezultati eksperimenta:

    Prije: 16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. Poslije: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Formulirajmo hipoteze:

    H0: korelacija između stepena zavisnosti reakcije pre konzumiranja alkohola i posle pijenja ne razlikuje se od nule.

    H1: korelacija između stepena zavisnosti reakcije pre konzumiranja alkohola i posle pijenja značajno se razlikuje od nule.

    Tabela 4.1. Izračunavanje d2 za Spearmanov koeficijent korelacije ranga rs prilikom poređenja parametara okulomotorne reakcije prije i poslije eksperimenta (N=17)

    vrijednosti

    vrijednosti

    Budući da imamo duplirane rangove, u ovom slučaju ćemo primijeniti formulu prilagođenu za iste rangove:

    Ta= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

    Tb =((23-2)+(23-2)+(33-3))/12=3

    Pronađite empirijsku vrijednost Spearmanovog koeficijenta:

    rs = 1- 6*((767,75+6+3)/(17*(172-1)))=0,05

    Prema tabeli (Prilog 4.3) nalazimo kritične vrijednosti koeficijenta korelacije

    0,48 (p ≤ 0,05)

    0,62 (p ≤ 0,01)

    Dobijamo

    rs=0,05∠rcr(0,05)=0,48

    Zaključak: hipoteza H1 se odbacuje, a H0 prihvata. One. korelacija između stepena

    ovisnost reakcije prije konzumiranja alkohola i poslije ne razlikuje se od nule.

    Disciplina" višu matematiku"prouzrokuje određeno odbacivanje, jer ga zaista ne mogu svi razumjeti. Ali oni koji imaju sreću da proučavaju ovu temu i rješavaju probleme koristeći različite jednačine i koeficijente mogu se pohvaliti gotovo potpunim znanjem o tome. psihološka nauka ne postoji samo humanitarna orijentacija, već i određene formule i metode za matematičku provjeru hipoteze iznesene u toku istraživanja. Za to se primjenjuju različiti koeficijenti.

    Spearmanov koeficijent korelacije

    Ovo je uobičajeno mjerenje za određivanje bliskosti odnosa između bilo koje dvije karakteristike. Koeficijent se naziva i neparametarska metoda. Prikazuje statistiku veze. Odnosno, znamo, na primjer, da su kod djeteta agresija i razdražljivost povezane, a koeficijent korelacije Spearmanovog ranga pokazuje statistički matematički odnos ove dvije karakteristike.

    Kako se izračunava koeficijent rangiranja?

    Naravno, sve matematičke definicije ili veličine imaju svoje formule po kojima se izračunavaju. Takođe ima Spearmanov koeficijent korelacije. Njegova formula je sljedeća:

    Na prvi pogled formula nije sasvim jasna, ali ako pogledate, sve je vrlo lako izračunati:

    • n je broj karakteristika ili indikatora koji su rangirani.
    • d je razlika između određena dva ranga koja odgovaraju dvije specifične varijable svakog subjekta.
    • ∑d 2 je zbir svih kvadrata razlika rangova karakteristika, čiji se kvadrati izračunavaju posebno za svaki rang.

    Opseg matematičke mjere veze

    Za primjenu koeficijenta ranga potrebno je da se kvantitativni podaci osobine rangiraju, odnosno da im se dodijeli određeni broj u zavisnosti od mjesta na kojem se osobina nalazi i njene vrijednosti. Dokazano je da su dva reda znakova, izražena u numeričkom obliku, donekle međusobno paralelna. Spearmanov koeficijent korelacije ranga određuje stepen ovog paralelizma, čvrstoću odnosa karakteristika.

    Da biste matematičkom operacijom izračunali i odredili odnos karakteristika pomoću navedenog koeficijenta, morate izvršiti neke radnje:

    1. Svakoj vrijednosti bilo kojeg predmeta ili fenomena dodjeljuje se redom broj - rang. Može odgovarati vrijednosti fenomena u rastućem i opadajućem redoslijedu.
    2. Zatim se uspoređuju rangovi vrijednosti znakova dvije kvantitativne serije kako bi se utvrdila razlika između njih.
    3. U posebnoj koloni tabele, za svaku dobijenu razliku upisuje se njen kvadrat, a rezultati su sumirani u nastavku.
    4. Nakon ovih koraka primjenjuje se formula po kojoj se izračunava Spearmanov koeficijent korelacije.

    Svojstva koeficijenta korelacije

    Glavna svojstva Spearmanovog koeficijenta uključuju sljedeće:

    • Mjerenje vrijednosti između -1 i 1.
    • Predznak koeficijenta interpretacije nema.
    • Bliskost veze određena je principom: što je veća vrijednost, to je veza bliža.

    Kako provjeriti primljenu vrijednost?

    Da biste provjerili odnos između znakova, morate izvršiti određene radnje:

    1. Postavlja se nulta hipoteza (H0), koja je ujedno i glavna, zatim se formuliše druga, alternativna prvoj (H 1). Prva hipoteza bi bila da je Spearmanov koeficijent korelacije 0, što znači da neće biti veze. Drugi, naprotiv, kaže da koeficijent nije jednak 0, tada postoji veza.
    2. Sledeći korak je pronalaženje posmatrane vrednosti kriterijuma. Nalazi se osnovnom formulom Spearmanovog koeficijenta.
    3. Zatim se pronalaze kritične vrijednosti datog kriterija. To se može učiniti samo uz pomoć posebne tablice, koja prikazuje različite vrijednosti za date indikatore: nivo značajnosti (l) i broj koji određuje (n).
    4. Sada treba da uporedimo dve primljene vrednosti: ustanovljenu vidljivu, kao i kritičnu. Da biste to učinili, morate izgraditi kritičnu regiju. Potrebno je nacrtati pravu liniju, na njoj označiti tačke kritične vrijednosti koeficijenta znakom "-" i znakom "+". Lijevo i desno od kritičnih vrijednosti, kritična područja su iscrtana polukružno od tačaka. U sredini, kombinujući dvije vrijednosti, označen je polukrugom OPG-a.
    5. Nakon toga dolazi se do zaključka o čvrstoći odnosa između ove dvije karakteristike.

    Gdje je najbolje mjesto za korištenje ove vrijednosti?

    Prva nauka u kojoj se ovaj koeficijent aktivno koristio bila je psihologija. Na kraju krajeva, ovo je nauka koja se ne zasniva na brojevima, međutim, za dokazivanje bilo kakvih važnih hipoteza o razvoju odnosa, karakternih osobina ljudi, znanja učenika, potrebna je statistička potvrda zaključaka. Takođe se koristi u privredi, posebno u deviznim transakcijama. Ovdje se procjenjuju karakteristike bez statistike. Spearmanov koeficijent korelacije ranga je vrlo zgodan u ovoj oblasti primjene jer se procjena vrši neovisno o distribuciji varijabli, budući da su one zamijenjene brojem ranga. Spearmanov koeficijent se aktivno koristi u bankarstvo. U svojim istraživanjima ga koriste i sociologija, političke nauke, demografija i druge nauke. Rezultati se dobijaju brzo i što preciznije.

    Pogodno i brzo se koristi Spearmanov koeficijent korelacije u Excelu. Ovdje postoje posebne funkcije koje vam pomažu da brzo dobijete potrebne vrijednosti.

    Koji drugi koeficijenti korelacije postoje?

    Osim onoga što smo naučili o Spearmanovom koeficijentu korelacije, postoje i različiti koeficijenti korelacije, omogućavajući mjerenje, procjenu kvalitativnih karakteristika, odnos između kvantitativnih karakteristika, bliskost odnosa između njih, predstavljenih na skali ranga. To su koeficijenti kao što su bis-serial, rank-bis-serial, sadržaj, asocijacije i tako dalje. Spearmanov koeficijent vrlo precizno pokazuje čvrstoću veze, za razliku od svih drugih metoda njenog matematičkog određivanja.

    Spearmanova korelacija ranga(rang korelacija). Spearmanova rang korelacija je najjednostavniji način da se odredi stepen povezanosti između faktora. Naziv metode ukazuje da se utvrđuje odnos između rangova, odnosno niza dobijenih kvantitativnih vrijednosti, rangiranih u opadajućem ili rastućem redoslijedu. Treba imati na umu da se, prvo, ne preporučuje korelacija ranga ako je veza parova manja od četiri i više od dvadeset; drugo, korelacija ranga vam omogućava da odredite odnos u drugom slučaju, ako su vrijednosti polukvantitativne, odnosno nemaju numerički izraz, odražavaju jasan slijed ovih vrijednosti; treće, preporučljivo je koristiti rang korelaciju u slučajevima kada je dovoljno dobiti približne podatke. Primjer izračunavanja koeficijenta rang korelacije za određivanje pitanja: upitnik mjeri X i Y slične lične kvalitete ispitanika. Uz pomoć dva upitnika (X i Y), koji zahtijevaju alternativne odgovore „da“ ili „ne“, dobijeni su primarni rezultati – odgovori 15 ispitanika (N=10). Rezultati su predstavljeni kao zbir potvrdnih odgovora odvojeno za Upitnik X i Upitnik B. Ovi rezultati su sažeti u tabeli 1. 5.19.

    Tabela 5.19. Tabela primarnih rezultata za izračunavanje koeficijenta korelacije Spearmanovog ranga (p) *

    Analiza sumarne korelacijske matrice. Metoda korelacionih plejada.

    Primjer. U tabeli. 6.18 prikazuje interpretaciju jedanaest varijabli koje se testiraju prema Wechslerovoj metodi. Podaci su dobijeni na homogenom uzorku starosti od 18 do 25 godina (n = 800).

    Prije stratifikacije, preporučljivo je rangirati matricu korelacije. Da biste to učinili, u originalnoj matrici izračunavaju se prosječne vrijednosti koeficijenata korelacije svake varijable sa svim ostalima.

    Zatim prema tabeli. 5.20 odrediti dozvoljene nivoe stratifikacije korelacione matrice za datu nivo samopouzdanja 0,95 i n - količine

    Tabela 6.20. Rastuća korelaciona matrica

    Varijable 1 2 3 4 bi 0 7 8 0 10 11 M (rij) Rang
    1 1 0,637 0,488 0,623 0,282 0,647 0,371 0,485 0,371 0,365 0,336 0,454 1
    2 1 0,810 0,557 0,291 0,508 0,173 0,486 0,371 0,273 0,273 0,363 4
    3 1 0,346 0,291 0,406 0,360 0,818 0,346 0,291 0,282 0,336 7
    4 1 0,273 0,572 0,318 0,442 0,310 0,318 0,291 0,414 3
    5 1 0,354 0,254 0,216 0,236 0,207 0,149 0,264 11
    6 1 0,365 0,405 0,336 0,345 0,282 0,430 2
    7 1 0,310 0,388 0,264 0,266 0,310 9
    8 1 0,897 0,363 0,388 0,363 5
    9 1 0,388 0,430 0,846 6
    10 1 0,336 0,310 8
    11 1 0,300 10

    Oznake: 1 - opšta svijest; 2 - konceptualnost; 3 - pažnja; 4 - vdatnist K generalizacija; b - direktno pamćenje (u brojevima) 6 - stepen razvoja maternji jezik; 7 - brzina savladavanja senzomotoričkih sposobnosti (kodiranje simbolima) 8 - zapažanje; 9 - kombinatorne sposobnosti (za analizu i sintezu) 10 - sposobnost organizovanja delova u smislenu celinu; 11 - sposobnost heurističke sinteze; M (rij) - prosječna vrijednost koeficijenata korelacije varijable sa ostalim varijablama posmatranja (u našem slučaju n = 800): r (0) - vrijednost nulte ravni "rezanja" - minimalno značajno apsolutno vrijednost koeficijenta korelacije (n - 120, r (0) = 0,236, n = 40, r(0) = 0,407) | Δr | - dozvoljeni korak razdvajanja (n = 40, | Δr | = 0,558) c - dozvoljeni broj nivoa razdvajanja (n = 40, s = 1; n = 120, s = 2); r(1), r(2), ..., r(9) je apsolutna vrijednost rezne ravni (n=40, r(1)=0,965).

    Za n = 800, nalazimo vrijednost rtype i granice ri, nakon čega je Stratificiranje rangiralo matricu korelacije, naglašavajući korelacijske plejade unutar slojeva, ili razdvajajući dijelove matrice korelacije, crtajući sindikate korelacijskih plejada za slojeva koji su iznad (slika 5.5).

    Smislena analiza dobijenih plejada prevazilazi granice matematičke statistike. Treba napomenuti dva formalna pokazatelja koji pomažu u smislenom tumačenju Plejada. Jedan značajan indikator je stepen vrha, odnosno broj ivica koje su susedne vrhu. Varijabilno sa najveći broj rubova je "jezgro" galaksije i može se smatrati indikatorom ostalih varijabli ove galaksije. Drugi značajan pokazatelj je gustina komunikacije. Varijabla može imati manje veza u jednoj galaksiji, ali bliže, a više veza u drugoj galaksiji, ali manje bliske.

    Predviđanja i procjene. Jednadžba y \u003d b1x + b0 naziva se općom jednadžbom prave linije. Označava da su parovi tačaka (x, y), koji

    Rice. 5.5. Korelacijske plejade dobivene razdvajanjem matrice

    leže na pravoj liniji, spojene na takav način da se za bilo koju vrijednost x, vrijednost in u paru s njom može naći množenjem x nekim brojem b1 dodajući drugi, broj b0 ovom proizvodu.

    Koeficijent regresije vam omogućava da odredite stepen promjene istražnog faktora kada se uzročni faktor promijeni za jednu jedinicu. Apsolutne vrijednosti karakteriziraju odnos između varijabilnih faktora njihovim apsolutnim vrijednostima. Koeficijent regresije se izračunava po formuli:

    Planiranje i analiza eksperimenata. Dizajn i analiza eksperimenata je treća glavna grana statističkih metoda razvijenih za pronalaženje i testiranje uzročno-posledičnih veza između varijabli.

    Za proučavanje multifaktorskih zavisnosti, poslednjih godina se sve više koriste metode matematičkog planiranja eksperimenta.

    Mogućnost simultane varijacije od strane svih faktora omogućava: a) smanjenje broja eksperimenata;

    b) svesti eksperimentalnu grešku na minimum;

    c) pojednostaviti obradu primljenih podataka;

    d) pružaju jasnoću i lakoću poređenja rezultata.

    Svaki faktor može dobiti neku odgovarajuću količinu različita značenja, koji se nazivaju nivoi i označavaju -1, 0 i 1. Fiksni skup nivoa faktora određuje uslove jednog od mogućih eksperimenata.

    Ukupnost svih mogućih kombinacija izračunava se po formuli:

    Potpuni faktorski eksperiment je eksperiment u kojem se implementiraju sve moguće kombinacije nivoa faktora. Potpuni faktorijalni eksperimenti mogu imati svojstvo ortogonalnosti. Kod ortogonalnog planiranja, faktori u eksperimentu su nekorelirani, regresijski koeficijenti koji su izračunati kao rezultat određuju se nezavisno jedan od drugog.

    Važna prednost metode matematičkog planiranja eksperimenta je njena svestranost i pogodnost u mnogim oblastima istraživanja.

    Razmotrimo primjer poređenja utjecaja određenih faktora na formiranje nivoa mentalnog stresa kod TV kontrolera u boji.

    Eksperiment se zasniva na ortogonalnom planu 2 tri (tri faktora se mijenjaju na dva nivoa).

    Eksperiment je izveden kompletnim dijelom 2+3 sa trostrukim ponavljanjem.

    Ortogonalno planiranje se zasniva na konstrukciji regresione jednačine. Za tri faktora to izgleda ovako:

    Obrada rezultata u ovom primjeru uključuje:

    a) izrada ortogonalnog plana 2+3 tabele za proračun;

    b) izračunavanje koeficijenata regresije;

    c) provjeravanje njihovog značaja;

    d) tumačenje primljenih podataka.

    Za koeficijente regresije navedene jednačine bilo je potrebno staviti N = 2 3 = 8 opcija kako bi se mogla procijeniti značajnost koeficijenata, pri čemu je broj ponavljanja K bio 3.

    Sastavljena matrica planiranja eksperimenta je izgledala ovako.



    greška: Sadržaj je zaštićen!!