Njega lica: korisni savjeti

Korelacije u diplomskim radovima iz psihologije. Spearmanova korelacijska analiza

Korelacije u diplomskim radovima iz psihologije.  Spearmanova korelacijska analiza

37. Spearmanov koeficijent korelacije ranga.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Spearmanov koeficijent korelacije ranga koristi se kada:
- varijable imaju skala rangiranja mjerenja;
- distribucija podataka se previše razlikuje od normalno ili uopšte nije poznato
- uzorci su mali (N< 30).

Tumačenje Spearmanovog koeficijenta rang korelacije ne razlikuje se od Pearsonovog koeficijenta, ali je njegovo značenje nešto drugačije. Da bismo razumjeli razliku između ovih metoda i logično potkrijepili područja njihove primjene, uporedimo njihove formule.

Pearsonov koeficijent korelacije:

Spearmanov koeficijent korelacije:

Kao što vidite, formule se značajno razlikuju. Uporedite formule

Formula Pirsonove korelacije koristi aritmetičku sredinu i standardnu ​​devijaciju koreliranog niza, dok Spearmanova formula ne koristi. Dakle, da bi se dobio adekvatan rezultat prema Pearsonovoj formuli, potrebno je da korelirani niz bude blizak normalnoj raspodjeli (srednja i standardna devijacija su parametri normalne distribucije). Za Spearmanovu formulu to nije relevantno.

Element Pearsonove formule je standardizacija svake serije u z-score.

Kao što vidite, konverzija varijabli u Z-skalu je prisutna u formuli koeficijenta korelacije Pearson. Shodno tome, za Pearsonov koeficijent, skala podataka je apsolutno irelevantna: na primjer, možemo povezati dvije varijable, od kojih jedna ima min. = 0 i max. = 1, a drugi min. = 100 i maks. = 1000. Bez obzira koliko je raspon vrijednosti različit, sve će biti pretvorene u standardne z-vrijednosti koje su iste u skali.

Ne postoji takva normalizacija u Spearmanovom koeficijentu, dakle

OBAVEZNI USLOVI ZA KORIŠĆENJE SPEERMANOVOG KOEFICIJENTA JE JE JEDNAKOST OPSEGA DVIJE VARIJABLE.

Prije korištenja Spearmanovog koeficijenta za nizove podataka s različitim rasponima, potrebno je rang. Rangiranje dovodi do toga da vrednosti ovih serija dobijaju isti minimum = 1 (minimalni rang) i maksimum jednak broju vrednosti (maksimum, poslednji rang = N, tj. maksimalni broj slučajeva u uzorak).

U kojim slučajevima je moguće bez rangiranja

To su slučajevi u kojima su podaci izvorni skala rangiranja. Na primjer, Rokeachov test orijentacije vrijednosti.

Također, ovo su slučajevi kada je broj opcija vrijednosti mali, a u uzorku su fiksni minimum i maksimum. Na primjer, u semantičkom diferencijalu, minimum = 1, maksimum = 7.

Primjer izračunavanja koeficijenta korelacije Spearmanovog ranga

Rokeachov test vrednosnih orijentacija proveden je na dva uzorka X i Y. Zadatak je bio otkriti koliko su bliske hijerarhije vrijednosti ovih uzoraka (bukvalno, koliko su slične).

Provjerava se rezultirajuća vrijednost r=0,747 tabela kritičnih vrednosti. Prema tabeli, pri N=18, dobijena vrijednost je pouzdana na nivou p<=0,005

Koeficijenti korelacije ranga prema Spearmanu i Kendalu

Za varijable koje pripadaju ordinalnoj skali ili za varijable koje ne prate normalnu distribuciju, kao i za varijable koje pripadaju intervalnoj skali, umjesto Pirsonovog koeficijenta izračunava se Spearmanova rang korelacija. Da bi se to postiglo, pojedinačnim vrijednostima varijabli dodijeljena su mjesta rangiranja, koja se naknadno obrađuju pomoću odgovarajućih formula. Da biste otkrili korelaciju ranga, poništite izbor u polju za potvrdu zadane Pearsonove korelacije u dijaloškom okviru Bivarijantne korelacije.... Umjesto toga, aktivirajte Spearmanovo izračunavanje korelacije. Ovaj proračun će dati sljedeće rezultate. Koeficijenti korelacije ranga su vrlo blizu odgovarajućim vrijednostima Pearsonovih koeficijenata (originalne varijable imaju normalnu distribuciju).

titkova-matmetody.pdf str. 45

Spearmanova metoda korelacije ranga omogućava vam da odredite čvrstoću (snagu) i smjer

korelacija između dva znaka ili dva profila (hijerarhije) znakovi.

Za izračunavanje rang korelacije potrebno je imati dvije serije vrijednosti,

koji se mogu rangirati. Ovi rasponi vrijednosti mogu biti:

1) dva znaka mjereno u istom grupa ispitanici;

2) dvije pojedinačne hijerarhije karakteristika, identifikovana u dva predmeta za isti

skup karakteristika;

3) dva grupne hijerarhije karakteristika,

4) individualno i grupno hijerarhija karakteristika.

Prvo, indikatori se rangiraju zasebno za svaku od karakteristika.

Po pravilu, nižoj vrijednosti osobine dodjeljuje se niži rang.

U prvom slučaju (dvije karakteristike), pojedinačne vrijednosti se rangiraju prema prvom

osobina koju su dobili različiti subjekti, a zatim pojedinačne vrijednosti za drugu

sign.

Ako su dva znaka pozitivno povezana, onda su subjekti niskog ranga u

jedan od njih će imati niske rangove u drugom, a subjekti sa visokim rangom

jedna od osobina će takođe imati visoke rangove druge osobine. Za brojanje rs

potrebno je utvrditi razlike (d) između rangova koje su ovi subjekti stekli na oba

znakovi. Zatim se ovi indikatori d transformišu na određeni način i oduzmu od 1. Nego

što je manja razlika između rangova, veći će biti rs, to će biti bliže +1.

Ako nema korelacije, onda će svi rangovi biti pomiješani i neće ih biti

nema podudaranja. Formula je dizajnirana tako da u ovom slučaju rs bude blizu 0.

U slučaju negativne korelacije nizak rang subjekata po jednom osnovu

će odgovarati visokim rangovima na drugom atributu, i obrnuto. Što više neusklađenosti

između rangova subjekata u dvije varijable, rs je bliži -1.

U drugom slučaju (dva pojedinačna profila), pojedinac

vrijednosti koje je dobio svaki od 2 subjekta prema određenom (isto za njih

oba) skup karakteristika. Prvi rang će dobiti osobinu sa najnižom vrijednošću; drugi rang -

znak veće vrednosti itd. Očigledno, sve karakteristike moraju biti izmjerene

iste jedinice, inače je rangiranje nemoguće. Na primjer, nemoguće je

rangirajte indikatore prema Cattell upitniku ličnosti (16PF), ako su izraženi u

"sirovi" rezultati, budući da su rasponi vrijednosti različiti za različite faktore: od 0 do 13, od 0 do

20 i od 0 do 26. Ne možemo reći koji će od faktora zauzeti prvo mjesto po pitanju

ozbiljnosti, sve dok ne dovedemo sve vrijednosti ​​na jednu skalu (najčešće je to skala zidova).

Ako su pojedinačne hijerarhije dvaju subjekata pozitivno povezane, onda znaci

ako imate niske rangove u jednom od njih, imaćete niske rangove u drugom, i obrnuto.

Na primjer, ako za jedan subjekt faktor E (dominacija) ima najniži rang, onda za

drugi predmet, trebalo bi da ima nizak rang ako jedan subjekt ima faktor C

(emocionalna stabilnost) ima najviši rang, onda mora imati i drugi subjekt

ovaj faktor ima visok rang i tako dalje.

U trećem slučaju (dva grupna profila) rangiraju se prosječne vrijednosti grupe,

primljeno u 2 grupe predmeta prema određenom, identičnom za dvije grupe, skupu

znakovi. U daljem tekstu, linija rezonovanja je ista kao u prethodna dva slučaja.

U slučaju 4. (individualni i grupni profili), oni se posebno rangiraju

individualne vrijednosti subjekta i prosječne grupne vrijednosti za isti skup

znakovi koji se dobijaju, po pravilu, isključujući ovaj pojedinačni subjekt - on

ne učestvuje u prosečnom grupnom profilu, sa kojim će se njegov pojedinac uporediti

profil. Korelacija ranga će vam omogućiti da provjerite koliko je dosljedan pojedinac i

grupni profili.

U sva četiri slučaja značajnost dobijenog koeficijenta korelacije određena je pomoću

po broju rangiranih vrijednosti N. U prvom slučaju, ovaj broj će se poklopiti sa

veličina uzorka n. U drugom slučaju, broj zapažanja će biti broj karakteristika,

čine hijerarhiju. U trećem i četvrtom slučaju, N je takođe broj uparivanja

znakova, a ne broja subjekata u grupama. Detaljna objašnjenja su data u primjerima. Ako a

apsolutna vrijednost rs dostiže kritičnu vrijednost ili je premašuje, korelacija

pouzdan.

Hipoteze.

Postoje dvije moguće hipoteze. Prvi se odnosi na slučaj 1, drugi na ostala tri

Prva verzija hipoteza

H0: Korelacija između varijabli A i B se ne razlikuje od nule.

H2: Korelacija između varijabli A i B značajno se razlikuje od nule.

Druga verzija hipoteza

H0: Korelacija između hijerarhija A i B se ne razlikuje od nule.

H2: Korelacija između hijerarhija A i B značajno se razlikuje od nule.

Ograničenja koeficijenta korelacije ranga

1. Za svaku varijablu mora se dostaviti najmanje 5 zapažanja. Upper

granica uzorkovanja određena je dostupnim tabelama kritičnih vrijednosti .

2. Spearmanov koeficijent korelacije ranga rs sa velikim brojem identičnih

rangovi za jednu ili obje podudarne varijable daje grube vrijednosti. Idealno

obje korelirane serije moraju biti dvije nepodudarne sekvence

vrijednosti. Ako ovaj uslov nije ispunjen, potrebno je izvršiti prilagodbu

isti činovi.

Spearmanov koeficijent korelacije ranga izračunava se po formuli:

Ako u obje upoređene serije rangiranja postoje grupe istog ranga,

prije izračunavanja koeficijenta rang korelacije potrebno je izvršiti korekciju za isti

rangovi Ta i Tv:

Ta \u003d Σ (a3 - a) / 12,

TV \u003d Σ (v3 - c) / 12,

gdje a - zapremina svake grupe identičnih rangova u nizu rangova A, in obim svake

grupe jednakih rangova u rangu serije B.

Da biste izračunali empirijsku vrijednost rs, koristite formulu:

38. Isprekidani biserijski koeficijent korelacije.

Za korelaciju uopšte, videti pitanje br.36 With. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Neka se varijabla X mjeri na jakoj skali, a varijabla Y na dihotomnoj. Koeficijent biserijske korelacije tačaka rpb izračunava se po formuli:

Ovdje je x 1 prosječna vrijednost za X objekte sa vrijednošću "jedan" za Y;

x 0 - prosječna vrijednost za X objekte sa vrijednošću "nula" za Y;

s x - standardna devijacija svih vrijednosti za X;

n 1 - broj objekata "jedan" u Y, n 0 - broj objekata "nula" u Y;

n = n 1 + n 0 je veličina uzorka.

Koeficijent biserijske korelacije tačaka se također može izračunati korištenjem drugih ekvivalentnih izraza:

Evo x je ukupna srednja vrijednost za varijablu X.

Koeficijent biserijske korelacije tačaka rpb varira od –1 do +1. Njegova vrijednost je jednaka nuli u slučaju da su varijable s jedinicom za Y imaju prosek Y, jednako srednjoj vrijednosti varijabli sa nulom preko Y.

Ispitivanje hipoteze o značaju tačka biserijski koeficijent korelacije treba provjeriti Nulta hipotezah 0 o jednakosti opšteg koeficijenta korelacije sa nulom: ρ = 0, što se izvodi po Studentovom kriterijumu. Empirijska vrijednost

u poređenju sa kritičnim vrednostima t a (df) za broj stepeni slobode df = n– 2

Ako je uslov | t| ≤ ta(df), nulta hipoteza ρ = 0 se ne odbacuje. Koeficijent biserijske korelacije tačaka značajno se razlikuje od nule ako je empirijska vrijednost | t| pada u kritično područje, odnosno ako je uslov | t| > ta(n– 2). Pouzdanost odnosa izračunata korišćenjem biserijskog koeficijenta korelacije tačaka rpb, može se odrediti i korištenjem kriterija χ 2 za broj stupnjeva slobode df= 2.

Tačka-biserijska korelacija

Naknadna modifikacija koeficijenta korelacije proizvoda momenata odrazila se u točkasto-biserijskom r. Ova stat. prikazuje odnos između dvije varijable, od kojih je jedna navodno kontinuirana i normalno raspoređena, dok je druga diskretna u tačnom smislu te riječi. Tačka-biserijski koeficijent korelacije je označen sa r pbis Jer u r pbis dihotomija odražava pravu prirodu diskretne varijable, a ne umjetna, kao u slučaju r bis, njegov predznak je proizvoljno određen. Dakle, za sve prakse ciljevi r pbis razmatra se u rasponu od 0,00 do +1,00.

Postoji i takav slučaj kada se dvije varijable smatraju kontinuiranim i normalno raspoređenim, ali su obje umjetno dihotomizirane, kao u slučaju biserijske korelacije. Za procjenu odnosa između takvih varijabli koristi se tetrahorični koeficijent korelacije r tet, koju je također uzgajao Pearson. Main (tačne) formule i procedure za izračunavanje r tet su prilično složeni. Stoga, sa praksom. ova metoda koristi aproksimacije r tet dobijene na osnovu skraćenih postupaka i tabela.

/online/dictionary/dictionary.php?term=511

BISERIJSKI KOEFICIJENT KORELACIJE S TAČKAMA je koeficijent korelacije između dvije varijable, od kojih se jedna mjeri na dihotomnoj skali, a druga na intervalnoj skali. Koristi se u klasičnoj i modernoj testologiji kao pokazatelj kvaliteta testnog zadatka – pouzdanost-konzistentnost sa ukupnim rezultatom testa.

Za korelaciju varijabli izmjerenih u dihotomna i intervalna skala koristiti tačka-biserijski koeficijent korelacije.
Bod-biserijski koeficijent korelacije je metoda korelacijske analize omjera varijabli, od kojih se jedna mjeri u skali imena i uzima samo 2 vrijednosti (na primjer, muškarci / žene, odgovor je tačan / odgovor je netačan, postoji znak / nema znaka), a drugi u omjeru skale ili skali intervala. Formula za izračunavanje koeficijenta biserijske korelacije:

gdje:
m1 i m0 su prosječne vrijednosti X sa vrijednošću 1 ili 0 u Y.
σx je standardna devijacija svih vrijednosti za X
n1 ,n0 – broj X vrijednosti od 1 ili 0 do Y.
n je ukupan broj parova vrijednosti

Najčešće se ovaj tip koeficijenta korelacije koristi za izračunavanje odnosa testnih jedinica sa sumarnom skalom. Ovo je jedna vrsta provjere valjanosti.

39. Rang-biserijski koeficijent korelacije.

Za korelaciju uopšte, videti pitanje br.36 With. 56 (64) 063.JPG

harchenko-korranaliz.pdf str. 28

Koeficijent korelacije rang-biser koji se koristi kada je jedna od varijabli ( X) je predstavljen u ordinalnoj skali, a drugi ( Y) - dihotomno, izračunato po formuli

.

Ovdje je prosječan rang objekata koji imaju jedinstvo Y; je prosječan rang objekata sa nula in Y, n je veličina uzorka.

Ispitivanje hipoteze o značaju rang-biserijski koeficijent korelacije izvodi se slično kao i biserijski koeficijent korelacije tačaka koristeći Studentov t-test sa zamjenom u formulama rpb na rrb.

Kada se jedna varijabla mjeri na dihotomnoj skali (varijabla x), a drugi na skali ranga (varijabla Y), koristeći rang-biserijski koeficijent korelacije. Sjećamo se da je varijabla x, mjeren u dihotomnoj skali, uzima samo dvije vrijednosti (šifre) 0 i 1. Naglasimo posebno da uprkos činjenici da ovaj koeficijent varira u rasponu od –1 do +1, njegov predznak nije bitan za tumačenje rezultate. Ovo je još jedan izuzetak od opšteg pravila.

Izračun ovog koeficijenta vrši se prema formuli:

gdje ` X 1 prosječni rang nad tim elementima varijable Y, što odgovara kodu (obilježju) 1 u varijabli X;

`X 0 – prosječan rang za te elemente varijable Y,što odgovara kodu (obilježju) 0 u varijabli X\

N- ukupan broj elemenata u varijabli x.

Za primjenu rang-biserijskog koeficijenta korelacije, moraju biti ispunjeni sljedeći uslovi:

1. Varijable koje se upoređuju moraju se mjeriti na različitim skalama: jedan X- u dihotomnoj skali; drugi Y– na ljestvici rangiranja.

2. Broj različitih karakteristika u upoređenim varijablama X i Y trebao bi biti isti.

3. Za procjenu stepena pouzdanosti koeficijenta rang-biserijske korelacije treba koristiti formulu (11.9) i tabelu kritičnih vrijednosti za Studentov test kada k = n - 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Slučajevi u kojima je jedna od varijabli prisutna u dihotomna skala, a drugi u rang (redni), zahtijevaju upotrebu rang-biserijski koeficijent korelacije:

rpb=2 / n * (m1 - m0)

gdje:
n je broj mjernih objekata
m1 i m0 - prosječni rang objekata sa 1 ili 0 u drugoj varijabli.
Ovaj koeficijent se također koristi prilikom provjere valjanosti testova.

40. Koeficijent linearne korelacije.

O korelaciji uopšte (a posebno o linearnoj korelaciji), vidi pitanje br. 36 With. 56 (64) 063.JPG

PEARSONOV KOEFICIJENT KORELACIJE

r-Pearson (Pearson r) se koristi za proučavanje odnosa između dvije metrikedruge varijable mjerene na istom uzorku. Postoje mnoge situacije u kojima ga je prikladno koristiti. Utječe li inteligencija na uspješnost u višim godinama studija? Da li je visina plate zaposlenog povezana sa njegovom dobrom voljom prema kolegama? Da li raspoloženje učenika utiče na uspješnost rješavanja složenog aritmetičkog zadatka? Da bi odgovorio na takva pitanja, istraživač mora izmjeriti dva indikatora od interesa za svakog člana uzorka. Podaci za proučavanje odnosa se zatim prikazuju u tabeli, kao u primjeru ispod.

PRIMJER 6.1

U tabeli je dat primjer početnih podataka mjerenja za dva indikatora inteligencije (verbalni i neverbalni) kod 20 učenika 8. razreda.

Odnos između ovih varijabli može se prikazati pomoću dijagrama raspršenja (vidi sliku 6.3). Dijagram pokazuje da postoji određena veza između mjerenih indikatora: što je veća vrijednost verbalne inteligencije, to je (uglavnom) veća vrijednost neverbalne inteligencije.

Pre nego što damo formulu za koeficijent korelacije, pokušajmo da pratimo logiku njegovog nastanka, koristeći podatke primera 6.1. Položaj svake /-tačke (subjekta sa brojem /) na dijagramu raspršenja u odnosu na ostale tačke (slika 6.3) može se dati veličinama i predznacima odstupanja odgovarajućih vrijednosti varijabli od njihovih prosječne vrijednosti: (xj - MJ i (um at ). Ako se znaci ovih odstupanja poklapaju, onda to ukazuje u korist pozitivnog odnosa (velike vrijednosti za X odgovaraju velikim vrednostima at ili manje vrijednosti za X odgovaraju manjim vrijednostima y).

Za predmet br. 1, odstupanje od prosjeka X i po at pozitivna, a za predmet br. 3 oba odstupanja su negativna. Shodno tome, podaci oba ukazuju na pozitivnu vezu između proučavanih osobina. Naprotiv, ako su znaci odstupanja od prosjeka X i po at razlikuju, to će ukazati na negativan odnos između znakova. Tako je za predmet br. 4 odstupanje od prosjeka X je negativan, prema y - pozitivno, a za predmet br. 9 - obrnuto.

Dakle, ako je proizvod odstupanja (x, - M X ) X (um at ) pozitivan, tada podaci /-subjekta ukazuju na direktnu (pozitivnu) vezu, a ako je negativna, onda na inverznu (negativnu) vezu. Shodno tome, ako Xwy su uglavnom direktno proporcionalni, tada će većina proizvoda odstupanja biti pozitivna, a ako su obrnuto povezani, tada će većina proizvoda biti negativna. Stoga, zbir svih proizvoda odstupanja za dati uzorak može poslužiti kao opći pokazatelj jačine i smjera odnosa:

Uz direktno proporcionalnu vezu između varijabli, ova vrijednost je velika i pozitivna - za većinu ispitanika odstupanja se poklapaju u znaku (velike vrijednosti jedne varijable odgovaraju velikim vrijednostima druge varijable i obrnuto). Ako X i at imaju povratnu informaciju, tada će za većinu ispitanika velike vrijednosti jedne varijable odgovarati manjim vrijednostima druge varijable, tj. predznaci proizvoda će biti negativni, a zbir proizvoda u cjelini također će biti velik u apsolutnoj vrijednosti, ali negativno u predznaku. Ako ne postoji sistematski odnos između varijabli, tada će pozitivni članovi (proizvodi odstupanja) biti uravnoteženi negativnim članovima, a zbir svih proizvoda odstupanja će biti blizu nule.

Da zbir proizvoda ne zavisi od veličine uzorka, dovoljno je da se usredsredi. Ali nas zanima mera odnosa ne kao opšti parametar, već kao njegova izračunata procena – statistika. Stoga, što se tiče formule disperzije, u ovom slučaju ćemo učiniti isto, podijelimo zbir proizvoda odstupanja ne sa N, a na TV-u - 1. Ispada mjera komunikacije, koja se široko koristi u fizici i tehničkim naukama, koja se zove kovarijansa (Covahance):


AT psihologija, za razliku od fizike, većina varijabli se mjeri na proizvoljnim skalama, jer psihologe ne zanima apsolutna vrijednost atributa, već relativni položaj ispitanika u grupi. Osim toga, kovarijansa je vrlo osjetljiva na skalu (disperziju) u kojoj se mjere mjere. Da bi mjera komunikacije bila nezavisna od mjernih jedinica bilo kojeg atributa, dovoljno je podijeliti kovarijansu na odgovarajuće standardne devijacije. Tako je i dobijeno za-K. Pearsonov koeficijent korelacije mule:

ili, nakon zamjene izraza za o x i


Ako su vrijednosti obje varijable pretvorene u r-vrijednosti pomoću formule


tada formula r-Pearsonovog koeficijenta korelacije izgleda jednostavnije (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

KORELACIJA LINEARNA- statistička nekauzalna linearna veza između dvije kvantitativne varijable X i at. Mjereno korištenjem "faktora K.L." Pearson, koji je rezultat dijeljenja kovarijance sa standardnim devijacijama obje varijable:

,

gdje s xy- kovarijansa između varijabli X i at;

s x , s y- standardne devijacije za varijable X i at;

x i , y i- varijabilne vrijednosti X i at za broj objekta i;

x, y- aritmetički prosjek za varijable X i at.

Pearsonov omjer r može uzeti vrijednosti iz intervala [-1; +1]. Značenje r = 0 znači da nema linearnog odnosa između varijabli X i at(ali ne isključuje nelinearnu statističku vezu). Pozitivne vrijednosti koeficijenta ( r> 0) ukazuje na direktnu linearnu vezu; što je njegova vrijednost bliža +1, to je statistički direktni odnos jači. Negativne vrijednosti koeficijenta ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 znači prisustvo pune linearne veze, direktne ili obrnute. U slučaju potpune veze, sve tačke sa koordinatama ( x i , y i) leže na pravoj liniji y = a + bx.

"Koeficijent K.L." Pearson se također koristi za mjerenje čvrstoće odnosa u modelu linearne regresije para.

41. Korelaciona matrica i korelacioni graf.

Za korelaciju uopšte, videti pitanje br.36 With. 56 (64) 063.JPG

korelacione matrice.Često, analiza korelacije uključuje proučavanje odnosa ne dvije, već mnogih varijabli mjerenih na kvantitativnoj skali na jednom uzorku. U ovom slučaju, korelacije se izračunavaju za svaki par ovog skupa varijabli. Proračuni se obično vrše na računaru, a rezultat je matrica korelacije.

Korelaciona matrica(korelacija matrica) je rezultat izračunavanja korelacija istog tipa za svaki par iz skupa R varijable mjerene u kvantitativnoj skali na jednom uzorku.

PRIMJER

Pretpostavimo da proučavamo odnose između 5 varijabli (vl, v2,..., v5; P= 5), mjereno na uzorku od N=30čovjek. Ispod je tabela početnih podataka i matrica korelacije.

I
povezani podaci:

Korelaciona matrica:

Lako je vidjeti da je matrica korelacije kvadratna, simetrična u odnosu na glavnu dijagonalu (takkakg, y = /) y), sa jedinicama na glavnoj dijagonali (od G i = Gu = 1).

Korelaciona matrica je kvadrat: broj redova i kolona jednak je broju varijabli. Ona je simetrično u odnosu na glavnu dijagonalu, budući da je korelacija X With at jednaka korelacija at With X. Jedinice se nalaze na njegovoj glavnoj dijagonali, jer je korelacija karakteristike sa sobom jednaka jedinici. Shodno tome, nisu svi elementi korelacione matrice predmet analize, već oni koji su iznad ili ispod glavne dijagonale.

Broj koeficijenata korelacije, P karakteristike koje treba analizirati u proučavanju odnosa određuje se formulom: P(P- 1)/2. U gornjem primjeru, broj takvih koeficijenata korelacije je 5(5 - 1)/2 = 10.

Glavni zadatak analize korelacione matrice je otkrivanje strukture međuodnosa skupa karakteristika. Ovo omogućava vizuelnu analizu korelacijske plejade- grafička slika strukturira statističkiznačajne veze ako takvih veza nema mnogo (do 10-15). Drugi način je korištenje multivarijantnih metoda: višestruka regresija, faktorska ili klaster analiza (pogledajte odjeljak "Multivarijantne metode..."). Koristeći faktorijalnu ili klaster analizu, moguće je identificirati grupe varijabli koje su bliže povezane jedna s drugom nego s drugim varijablama. Kombinacija ovih metoda je također vrlo učinkovita, na primjer, ako ima mnogo znakova i nisu homogeni.

Poređenje korelacija - dodatni zadatak analize korelacijske matrice, koja ima dvije opcije. Ukoliko je potrebno uporediti korelacije u jednom od redova korelacione matrice (za jednu od varijabli), primenjuje se metoda poređenja za zavisne uzorke (str. 148-149). Kada se porede istoimene korelacije izračunate za različite uzorke, koristi se metoda poređenja za nezavisne uzorke (str. 147-148).

Comparison Methods korelacije u dijagonalama matrica korelacije (za procjenu stacionarnosti slučajnog procesa) i poređenje nekoliko korelacione matrice dobijene za različite uzorke (zbog njihove homogenosti) su dugotrajne i izvan okvira ove knjige. Sa ovim metodama možete se upoznati iz knjige GV Sukhodolsky 1 .

Problem statističke značajnosti korelacija. Problem je u tome što procedura testiranja statističkih hipoteza uključuje jedan-višestruko test obavljen na jednom uzorku. Ako se primeni ista metoda mnogo puta,čak i ako u odnosu na različite varijable, onda se povećava vjerovatnoća da se rezultat dobije čisto slučajno. Općenito, ako ponovimo istu metodu testiranja hipoteze do vremena u odnosu na različite varijable ili uzorke, tada sa utvrđenom vrijednošću a, garantirano ćemo dobiti potvrdu hipoteze u ahk broj slučajeva.

Pretpostavimo da je analizirana matrica korelacije za 15 varijabli, odnosno da je izračunato 15(15-1)/2 = 105 koeficijenata korelacije. Za provjeru hipoteza postavlja se nivo a = 0,05. Testiranjem hipoteze 105 puta dobićemo njenu potvrdu pet puta (!) bez obzira da li veza zaista postoji. Znajući to i primivši, recimo, 15 "statistički značajnih" koeficijenata korelacije, možemo li reći koji su od njih dobijeni slučajno, a koji odražavaju stvarnu vezu?

Strogo govoreći, da bi se donijela statistička odluka, potrebno je nivo a smanjiti za onoliko puta koliko je hipoteza koje se testiraju. Ali to je teško preporučljivo, jer se vjerovatnoća ignorisanja stvarno postojeće veze (napraviti grešku tipa II) povećava na nepredvidiv način.

Korelaciona matrica sama po sebi nije dovoljna osnovaza statističke zaključke o pojedinačnim koeficijentima uključenim u njegakorelacije!

Postoji samo jedan zaista uvjerljiv način rješavanja ovog problema: nasumično podijeliti uzorak na dva dijela i uzeti u obzir samo one korelacije koje su statistički značajne u oba dijela uzorka. Alternativa može biti upotreba multivarijatnih metoda (faktorska, klasterska ili višestruka regresijska analiza) - za odabir i naknadnu interpretaciju grupa statistički značajno povezanih varijabli.

Problem nedostajućih vrijednosti. Ako u podacima nedostaju vrijednosti, tada su moguće dvije opcije za izračunavanje korelacijske matrice: a) red po red brisanje vrijednosti (isključitislučajevimapo listi); b) parno brisanje vrijednosti (isključitislučajevimau paru). At brisanje red po red zapažanja sa prazninama, briše se cijela linija za objekt (subjekt) koji ima najmanje jednu vrijednost koja nedostaje za jednu od varijabli. Ova metoda dovodi do "ispravne" korelacijske matrice u smislu da su svi koeficijenti izračunati iz istog skupa objekata. Međutim, ako su vrijednosti koje nedostaju nasumično raspoređene u varijablama, tada ova metoda može dovesti do činjenice da u razmatranom skupu podataka neće ostati niti jedan objekt (svaki red će sadržavati barem jednu vrijednost koja nedostaje). Da biste izbjegli ovu situaciju, koristite drugu metodu tzv uklanjanje u paru. Ova metoda uzima u obzir samo praznine u svakom odabranom paru varijabli stupaca i zanemaruje praznine u drugim varijablama. Korelacija za par varijabli izračunava se za one objekte kod kojih nema praznina. U mnogim situacijama, posebno kada je broj praznina relativno mali, recimo 10%, a praznine su prilično nasumično raspoređene, ova metoda ne dovodi do ozbiljnih grešaka. Međutim, ponekad to nije slučaj. Na primjer, u sistematskoj pristranosti (pomaku) procjene, sistematska lokacija praznina može biti "skrivena", što je razlog za razliku u koeficijentima korelacije izgrađenim na različitim podskupovima (na primjer, za različite podgrupe objekata). ). Još jedan problem povezan sa korelacionom matricom izračunatom sa u parovima Do uklanjanja jaza dolazi kada se ova matrica koristi u drugim vrstama analize (na primjer, u višestrukoj regresijskoj ili faktorskoj analizi). Oni pretpostavljaju da se koristi "ispravna" matrica korelacije sa određenim nivoom konzistentnosti i "korespondencije" različitih koeficijenata. Upotreba matrice sa "lošim" (pristranim) procjenama dovodi do činjenice da program ili nije u stanju analizirati takvu matricu, ili će rezultati biti pogrešni. Stoga, ako se koristi parni metod eliminacije podataka koji nedostaju, potrebno je provjeriti da li postoje ili ne postoje sistematski obrasci u raspodjeli praznina.

Ako eliminacija podataka koji nedostaju u paru ne dovede do bilo kakvog sistematskog pomaka u srednjim vrijednostima i varijansama (standardne devijacije), onda će ove statistike biti slične onima izračunatim metodom red-by-line uklanjanja praznina. Ako postoji značajna razlika, onda postoji razlog za pretpostavku da je došlo do pomaka u procjenama. Na primjer, ako je srednja vrijednost (ili standardna devijacija) vrijednosti varijable ALI, koja je korištena za izračunavanje njegove korelacije sa varijablom AT, mnogo manje od srednje vrijednosti (ili standardne devijacije) istih vrijednosti varijable ALI, koji su korišćeni za izračunavanje njegove korelacije sa varijablom C, onda ima razloga za očekivati ​​da će ove dve korelacije (A-Bnas) na osnovu različitih podskupova podataka. Doći će do pomaka u korelacijama uzrokovanih nenasumičnom lokacijom praznina u vrijednostima varijabli.

Analiza korelacijskih plejada. Nakon rješavanja problema statističke značajnosti elemenata korelacijske matrice, statistički značajne korelacije mogu se grafički prikazati u obliku korelacijske plejade ili plejade. Korelaciona galaksija - to je figura koja se sastoji od vrhova i linija koje ih povezuju. Vrhovi odgovaraju karakteristikama i obično se označavaju brojevima - brojevima varijabli. Linije odgovaraju statistički značajnim odnosima i grafički izražavaju znak, a ponekad i nivo /j-značajnosti odnosa.

Korelaciona galaksija može reflektovati sve statistički značajni odnosi korelacione matrice (ponekad se nazivaju korelacioni graf ) ili samo njihov smisleno odabrani dio (na primjer, koji odgovara jednom faktoru prema rezultatima faktorske analize).

PRIMJER KONSTRUKCIJE KORELACIJSKOG PLEJADA


Priprema za državnu (završnu) sertifikaciju diplomaca: formiranje baze podataka USE (opšta lista učesnika USE svih kategorija, sa naznakom predmeta) - uzimajući u obzir rezervne dane u slučaju podudarnosti predmeta;

  • Plan rada (27)

    Rješenje

    2. Aktivnosti obrazovne ustanove na poboljšanju sadržaja i procjeni kvaliteta u predmetima prirodno-matematičkog obrazovanja MOU srednja škola br. 4, Litvinovskaya, Chapaevskaya,

  • Korelaciona analiza je metoda koja vam omogućava da otkrijete odnose između određenog broja slučajnih varijabli. Svrha korelacione analize je da se identifikuje procena jačine veza između takvih slučajnih varijabli ili karakteristika koje karakterišu određene stvarne procese.

    Danas predlažemo da razmotrimo kako se Spearmanova analiza korelacije koristi za vizuelni prikaz oblika komunikacije u praktičnom trgovanju.

    Spearmanova korelacija ili osnova korelacione analize

    Da bi se razumjelo šta je korelacija analiza, prvo treba razumjeti koncept korelacije.

    Istovremeno, ako cijena počne da se kreće u smjeru koji vam je potreban, potrebno je na vrijeme deblokirati pozicije.


    Za ovu strategiju, koja se zasniva na korelacionoj analizi, najprikladniji su instrumenti za trgovanje sa visokim stepenom korelacije (EUR/USD i GBP/USD, EUR/AUD i EUR/NZD, AUD/USD i NZD/USD, CFD ugovori, itd.) .

    Video: Primjena Spearmanove korelacije na Forex tržište

    U praksi, Spearmanov koeficijent korelacije ranga (P) se često koristi za određivanje bliskosti odnosa između dvije karakteristike. Vrijednosti svake karakteristike se rangiraju rastućim redoslijedom (od 1 do n), zatim se utvrđuje razlika (d) između rangova koji odgovaraju jednom opažanju.

    Primjer #1. Odnos između obima industrijske proizvodnje i investicija u fiksni kapital u 10 regiona jednog od federalnih okruga Ruske Federacije u 2003. godini karakterišu sledeći podaci.
    Izračunati Spearmanovi koeficijenti korelacije ranga i Kendala. Provjerite njihovu značajnost na α=0,05. Formulirajte zaključak o odnosu između obima industrijske proizvodnje i ulaganja u osnovna sredstva u razmatranim regijama Ruske Federacije.

    Dodijelite rang osobini Y i faktoru X. Naći zbir razlike kvadrata d 2 .
    Koristeći kalkulator, izračunavamo Spearmanov koeficijent korelacije ranga:

    X Y rang X, dx rang Y, d y (dx - dy) 2
    1.3 300 1 2 1
    1.8 1335 2 12 100
    2.4 250 3 1 4
    3.4 946 4 8 16
    4.8 670 5 7 4
    5.1 400 6 4 4
    6.3 380 7 3 16
    7.5 450 8 5 9
    7.8 500 9 6 9
    17.5 1582 10 16 36
    18.3 1216 11 9 4
    22.5 1435 12 14 4
    24.9 1445 13 15 4
    25.8 1820 14 19 25
    28.5 1246 15 10 25
    33.4 1435 16 14 4
    42.4 1800 17 18 1
    45 1360 18 13 25
    50.4 1256 19 11 64
    54.8 1700 20 17 9
    364

    Veza između faktora Y karakteristike X je jaka i direktna.

    Procjena Spearmanovog koeficijenta korelacije ranga



    Prema Studentovoj tabeli nalazimo Ttable.
    T tablica = (18; 0,05) = 1,734
    Pošto je Tobs > Ttabl, odbacujemo hipotezu da je koeficijent korelacije ranga jednak nuli. Drugim riječima, Spearmanov koeficijent korelacije ranga je statistički značajan.

    Procjena intervala za koeficijent korelacije ranga (interval povjerenja)
    Interval povjerenja za Spearmanov koeficijent korelacije ranga: p(0,5431;0,9095).

    Primjer #2. Početni podaci.

    5 4
    3 4
    1 3
    3 1
    6 6
    2 2
    Pošto matrica ima povezane rangove (isti rang broj) 1. reda, mi ćemo ih preoblikovati. Redovi se ponovo formiraju bez promjene važnosti ranga, odnosno moraju se sačuvati odgovarajući omjeri (veći, manji ili jednaki) između brojeva rangova. Također se ne preporučuje postavljanje ranga iznad 1 i ispod vrijednosti jednake broju parametara (u ovom slučaju n = 6). Reformiranje činova je urađeno u tabeli.
    Novi činovi
    1 1 1
    2 2 2
    3 3 3.5
    4 3 3.5
    5 5 5
    6 6 6
    Pošto postoje vezani rangovi 2. reda u matrici, mi ćemo ih preoblikovati. Reformiranje činova je urađeno u tabeli.
    Brojevi sedišta u poređanom reduLokacija faktora prema procjeni vještakaNovi činovi
    1 1 1
    2 2 2
    3 3 3
    4 4 4.5
    5 4 4.5
    6 6 6
    Matrica ranga.
    rang X, dxrang Y, d y(dx - dy) 2
    5 4.5 0.25
    3.5 4.5 1
    1 3 4
    3.5 1 6.25
    6 6 0
    2 2 0
    21 21 11.5
    Budući da među vrijednostima karakteristika x i y postoji nekoliko identičnih, tj. formiraju se vezani rangovi, tada se u ovom slučaju Spearmanov koeficijent izračunava kao:

    gdje


    j - brojevi veza po redu za karakteristiku x;
    A j je broj identičnih rangova u j-tom snopu u x;
    k - brojevi snopova po redu za karakteristiku y;
    U k - broj identičnih rangova u k-tom paketu u y.
    A = [(2 3 -2)]/12 = 0,5
    B = [(2 3 -2)]/12 = 0,5
    D = A + B = 0,5 + 0,5 = 1

    Odnos između karakteristike Y i faktora X je umjeren i direktan.

    Spearmanova metoda korelacije rangova omogućava vam da odredite čvrstoću (snagu) i smjer korelacije između dvije karakteristike ili dva profila (hijerarhije) karakteristika.

    Za izračunavanje rang korelacije potrebno je imati dvije serije vrijednosti,

    koji se mogu rangirati. Ovi rasponi vrijednosti mogu biti:

    1) dva znaka merena u istoj grupi ispitanika;

    2) dve pojedinačne hijerarhije osobina identifikovanih kod dva subjekta za isti skup osobina;

    3) dvije grupne hijerarhije karakteristika,

    4) pojedinačne i grupne hijerarhije karakteristika.

    Prvo, indikatori se rangiraju zasebno za svaku od karakteristika.

    Po pravilu, nižoj vrijednosti osobine dodjeljuje se niži rang.

    U prvom slučaju (dva obilježja) rangiraju se pojedinačne vrijednosti za prvo obilježje koje su dobili različiti subjekti, a zatim pojedinačne vrijednosti za drugo obilježje.

    Ako su dva atributa pozitivno povezana, onda će subjekti sa niskim rangom u jednom od njih imati niske rangove u drugom, a subjekti sa visokim rangom u

    jedna od osobina će takođe imati visoke rangove druge osobine. Za izračunavanje rs potrebno je odrediti razliku (d) između rangova dobijenih od strane datog subjekta po oba osnova. Zatim se ovi indikatori d transformišu na određeni način i oduzmu od 1. Nego

    što je manja razlika između rangova, veći će biti rs, to će biti bliže +1.

    Ako nema korelacije, onda će svi rangovi biti pomiješani i neće ih biti

    nema podudaranja. Formula je dizajnirana tako da u ovom slučaju rs bude blizu 0.

    U slučaju negativne korelacije, nizak rang ispitanika po jednom atributu

    će odgovarati visokim rangovima na drugom atributu, i obrnuto. Što je veća razlika između rangova ispitanika na dvije varijable, to je rs bliži -1.

    U drugom slučaju (dva individualna profila), individualno

    vrijednosti koje je dobio svaki od 2 subjekta prema određenom (isto za oba) skupu karakteristika. Prvi rang će dobiti osobinu sa najnižom vrijednošću; drugi rang je karakteristika sa višom vrijednošću i tako dalje. Očigledno je da se sve karakteristike moraju mjeriti u istim jedinicama, inače je rangiranje nemoguće. Na primjer, nemoguće je rangirati indikatore prema Cattellovom upitniku ličnosti (16PF), ako su izraženi u "sirovim" ocjenama, jer su rasponi vrijednosti za različite faktore različiti: od 0 do 13, od 0 do

    20 i od 0 do 26. Ne možemo reći koji će od faktora zauzeti prvo mjesto po ozbiljnosti dok sve vrijednosti ne dovedemo na jednu skalu (najčešće je to zidna skala).

    Ako su pojedinačne hijerarhije dvaju subjekata pozitivno povezane, onda će karakteristike koje imaju niske rangove za jedan od njih imati niske rangove za drugi, i obrnuto. Na primjer, ako za jedan subjekt faktor E (dominacija) ima najniži rang, onda bi za drugi subjekt trebao imati nizak rang, ako jedan subjekt ima faktor C

    (emocionalna stabilnost) ima najviši rang, onda mora imati i drugi subjekt

    ovaj faktor ima visok rang i tako dalje.

    U trećem slučaju (dva grupna profila), prosječne grupne vrijednosti dobijene u 2 grupe ispitanika rangiraju se prema određenom skupu karakteristika koji je isti za dvije grupe. U daljem tekstu, linija rezonovanja je ista kao u prethodna dva slučaja.

    U slučaju 4. (individualni i grupni profili), pojedinačne vrijednosti subjekta i srednje grupne vrijednosti se rangiraju zasebno prema istom skupu karakteristika koje se po pravilu dobijaju isključivanjem ovog pojedinca. subjekat - ne učestvuje u srednjem grupnom profilu, sa kojim će se porediti individualni profil. Korelacija ranga će vam omogućiti da provjerite koliko su konzistentni individualni i grupni profili.

    U sva četiri slučaja, značajnost dobijenog koeficijenta korelacije određena je brojem rangiranih vrijednosti N. U prvom slučaju, ovaj broj će se poklapati sa veličinom uzorka n. U drugom slučaju, broj zapažanja će biti broj karakteristika koje čine hijerarhiju. U trećem i četvrtom slučaju, N je i broj upoređenih karakteristika, a ne broj ispitanika u grupama. Detaljna objašnjenja su data u primjerima. Ako apsolutna vrijednost rs dostigne ili premaši kritičnu vrijednost, korelacija je značajna.

    Hipoteze.

    Postoje dvije moguće hipoteze. Prvi se odnosi na slučaj 1, drugi na ostala tri slučaja.

    Prva verzija hipoteza

    H0: Korelacija između varijabli A i B se ne razlikuje od nule.

    H1: Korelacija između varijabli A i B značajno se razlikuje od nule.

    Druga verzija hipoteza

    H0: Korelacija između hijerarhija A i B se ne razlikuje od nule.

    H1: Korelacija između hijerarhija A i B značajno se razlikuje od nule.

    Ograničenja koeficijenta korelacije ranga

    1. Za svaku varijablu mora se dostaviti najmanje 5 zapažanja. Gornja granica uzorka određena je dostupnim tabelama kritičnih vrijednosti.

    2. Spearmanov koeficijent korelacije ranga rs sa velikim brojem identičnih rangova za jednu ili obje upoređene varijable daje grube vrijednosti. U idealnom slučaju, obje korelirane serije trebale bi biti dva niza neusklađenih vrijednosti. Ukoliko ovaj uslov nije ispunjen, potrebno je izvršiti prilagodbu za iste činove.

    Spearmanov koeficijent korelacije ranga izračunava se po formuli:

    Ako u obe upoređene serije ranga postoje grupe istih rangova, pre izračunavanja koeficijenta korelacije ranga potrebno je izvršiti korekcije za iste rangove Ta i Tv:

    Ta \u003d Σ (a3 - a) / 12,

    TV \u003d Σ (v3 - c) / 12,

    gdje je a volumen svake grupe identičnih rangova u nizu rangova A, c je volumen svakog

    grupe jednakih rangova u rangu serije B.

    Da biste izračunali empirijsku vrijednost rs, koristite formulu:

    Izračunavanje Spearmanovog koeficijenta korelacije ranga rs

    1. Odredite u kojoj će dvije karakteristike ili dvije karakteristične hijerarhije sudjelovati

    poređenje kao varijable A i B.

    2. Rangirajte vrijednosti varijable A, dodijelivši rang 1 najmanjoj vrijednosti, u skladu sa pravilima rangiranja (vidi A.2.3). Upišite rangove u prvu kolonu tabele prema broju subjekata ili znakova.

    3. Naručite vrijednosti varijable B, u skladu sa istim pravilima. Upišite rangove u drugu kolonu tabele prema broju subjekata ili znakova.

    5. Kvadrirajte svaku razliku: d2. Unesite ove vrijednosti u četvrtu kolonu tabele.

    Ta \u003d Σ (a3 - a) / 12,

    TV \u003d Σ (v3 - c) / 12,

    gdje je a volumen svake grupe identičnih rangova u rang-redu A; c - obim svake grupe

    isti rang u rang-seriji B.

    a) u nedostatku identičnih rangova

    rs  1 − 6 ⋅

    b) u prisustvu istih činova

    Σd 2  T  T

    r  1 − 6 ⋅ a in,

    gdje je Σd2 zbir kvadrata razlika između rangova; Ta i TV su ispravke za isto

    N je broj subjekata ili karakteristika koje su učestvovale u rangiranju.

    9. Odredite iz tabele (vidi Dodatak 4.3) kritične vrijednosti rs za dati N. Ako je rs veći ili barem jednak kritičnoj vrijednosti, korelacija se značajno razlikuje od 0.

    Primjer 4.1 Prilikom utvrđivanja stepena zavisnosti reakcije konzumiranja alkohola od okulomotorne reakcije u ispitivanoj grupi, podaci su dobijeni prije konzumiranja alkohola i nakon pijenja. Da li reakcija subjekta zavisi od stanja intoksikacije?

    Rezultati eksperimenta:

    Prije: 16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. Poslije: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Formulirajmo hipoteze:

    H0: korelacija između stepena zavisnosti reakcije pre konzumiranja alkohola i posle pijenja ne razlikuje se od nule.

    H1: korelacija između stepena zavisnosti reakcije pre konzumiranja alkohola i posle pijenja značajno se razlikuje od nule.

    Tabela 4.1. Izračunavanje d2 za Spearmanov koeficijent korelacije ranga rs prilikom poređenja parametara okulomotorne reakcije prije i poslije eksperimenta (N=17)

    vrijednosti

    vrijednosti

    Budući da imamo duplirane rangove, u ovom slučaju ćemo primijeniti formulu prilagođenu za iste rangove:

    Ta= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

    Tb =((23-2)+(23-2)+(33-3))/12=3

    Pronađite empirijsku vrijednost Spearmanovog koeficijenta:

    rs = 1- 6*((767,75+6+3)/(17*(172-1)))=0,05

    Prema tabeli (Prilog 4.3) nalazimo kritične vrijednosti koeficijenta korelacije

    0,48 (p ≤ 0,05)

    0,62 (p ≤ 0,01)

    Dobijamo

    rs=0,05∠rcr(0,05)=0,48

    Zaključak: hipoteza H1 se odbacuje, a H0 prihvata. One. korelacija između stepena

    ovisnost reakcije prije konzumiranja alkohola i poslije ne razlikuje se od nule.

    je kvantitativna procjena statističke studije odnosa među pojavama, koja se koristi u neparametarskim metodama.

    Indikator pokazuje kako se posmatrani zbir kvadrata razlika između rangova razlikuje od slučaja bez veze.

    Servisni zadatak. Pomoću ovog online kalkulatora možete:

    • izračunavanje Spearmanovog koeficijenta korelacije ranga;
    • izračunavanje intervala povjerenja za koeficijent i procjena njegove važnosti;

    Spearmanov koeficijent korelacije ranga odnosi se na indikatore procjene bliskosti komunikacije. Kvalitativna karakteristika čvrstoće odnosa koeficijenta korelacije ranga, kao i drugih koeficijenata korelacije, može se ocijeniti korištenjem Chaddock skale.

    Izračun koeficijenta sastoji se od sljedećih koraka:

    Svojstva Spearmanovog koeficijenta rang korelacije

    Područje primjene. Koeficijent korelacije ranga koristi se za procjenu kvaliteta komunikacije između dva skupa. Osim toga, njegova statistička značajnost se koristi kada se analiziraju podaci na heteroskedastičnost.

    Primjer. Na uzorku podataka posmatranih varijabli X i Y:

    1. napraviti tabelu rangiranja;
    2. pronađite Spearmanov koeficijent korelacije ranga i testirajte njegovu važnost na nivou 2a
    3. procijeniti prirodu ovisnosti
    Rješenje. Dodijelite rang osobini Y i faktoru X.
    XYrang X, dxrang Y, d y
    28 21 1 1
    30 25 2 2
    36 29 4 3
    40 31 5 4
    30 32 3 5
    46 34 6 6
    56 35 8 7
    54 38 7 8
    60 39 10 9
    56 41 9 10
    60 42 11 11
    68 44 12 12
    70 46 13 13
    76 50 14 14

    Matrica ranga.
    rang X, dxrang Y, d y(dx - dy) 2
    1 1 0
    2 2 0
    4 3 1
    5 4 1
    3 5 4
    6 6 0
    8 7 1
    7 8 1
    10 9 1
    9 10 1
    11 11 0
    12 12 0
    13 13 0
    14 14 0
    105 105 10

    Provjera ispravnosti kompilacije matrice na osnovu izračuna kontrolne sume:

    Zbir preko stupaca matrice jednaki su jedan drugom i kontrolnom zbroju, što znači da je matrica pravilno sastavljena.
    Koristeći formulu, izračunavamo Spearmanov koeficijent korelacije ranga.


    Veza između osobine Y i faktora X je jaka i direktna
    Značaj Spearmanovog koeficijenta rang korelacije
    Da bi se testirala nulta hipoteza na nivou značajnosti α da je opšti Spearmanov koeficijent korelacije ranga jednak nuli pod konkurentskom hipotezom H i . p ≠ 0, potrebno je izračunati kritičnu tačku:

    gdje je n veličina uzorka; ρ je koeficijent korelacije ranga Spearmanovog uzorka: t(α, k) je kritična tačka dvostranog kritičnog područja, koja se nalazi iz tabele kritičnih tačaka Studentove distribucije, prema nivou značajnosti α i broju stepeni slobode k = n-2.
    Ako |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - nulta hipoteza se odbacuje. Postoji značajna rang korelacija između kvalitativnih karakteristika.
    Prema Studentovoj tabeli nalazimo t(α/2, k) = (0,1/2;12) = 1,782

    Pošto T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.