Psichologijos baigiamųjų darbų sąsajos. Spearman koreliacijos analizė

37. Spearmano rango koreliacijos koeficientas.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Spearmano rango koreliacijos koeficientas naudojamas tais atvejais, kai:
- kintamieji turi reitingų skalė išmatavimai;
- duomenų paskirstymas per daug skiriasi nuo normalus arba iš viso nežinoma;
- mėginiai yra mažo tūrio (N< 30).

Spearmano rango koreliacijos koeficiento interpretacija nesiskiria nuo Pirsono koeficiento, tačiau jo reikšmė kiek kitokia. Norėdami suprasti skirtumą tarp šių metodų ir logiškai pagrįsti jų taikymo sritis, palyginkime jų formules.

Pearsono koreliacijos koeficientas:

Spearmano koreliacijos koeficientas:

Kaip matote, formulės labai skiriasi. Palyginkime formules

Pirsono koreliacijos formulėje naudojamas koreliuojamų eilučių aritmetinis vidurkis ir standartinis nuokrypis, tačiau Spearman formulė ne. Taigi, norint gauti tinkamą rezultatą naudojant Pearsono formulę, būtina, kad koreliacinė eilutė būtų artima normaliajam pasiskirstymui (vidurkis ir standartinis nuokrypis yra normalaus pasiskirstymo parametrai). Spearman formulei tai neaktualu.

Pearsono formulės elementas yra kiekvienos serijos standartizavimas z balas.

Kaip matote, kintamųjų konvertavimas į Z skalę yra Pirsono koreliacijos koeficiento formulėje. Atitinkamai, Pirsono koeficientui duomenų skalė visiškai nesvarbu: pavyzdžiui, galime koreliuoti du kintamuosius, kurių vienas turi min. = 0 ir maks. = 1, o antra min. = 100 ir maks. = 1000. Kad ir koks skirtingas būtų reikšmių diapazonas, jos visos bus konvertuojamos į standartines z reikšmes, kurios yra vienodos skalės.

Todėl Spearmano koeficiente toks normalizavimas neįvyksta

PRIVALOMA SĄLYGA NAUDOJANT SPEARMAN KOEFICENTĄ – Dviejų KINTAMŲJŲ DIAPONŲ LYGUMAS.

Prieš naudojant Spearman koeficientą duomenų serijoms su skirtingais diapazonais, būtina rangas. Dėl reitingavimo šių eilučių reikšmės įgyja tą patį minimumą = 1 (minimalus rangas) ir didžiausią, lygų reikšmių skaičiui (maksimalus, paskutinis rangas = N, t. y. maksimalus atvejų skaičius imtyje) .

Kokiais atvejais galima išsiversti be reitingavimo?

Tai atvejai, kai duomenys yra iš pradžių reitingų skalė. Pavyzdžiui, išbandyti vertybinės orientacijos Rokeachas.

Taip pat tai yra atvejai, kai reikšmių parinkčių skaičius yra mažas, o imtyje yra fiksuotas minimumas ir maksimumas. Pavyzdžiui, semantiniame diferenciate minimumas = 1, didžiausias = 7.

Spearmano rango koreliacijos koeficiento apskaičiavimo pavyzdys

Rokeacho vertės orientacijų testas buvo atliktas dviem pavyzdžiais X ir Y. Užduotis: išsiaiškinti, kiek artimos šių imčių verčių hierarchijos (tiesiog, kiek jos panašios).

Gauta reikšmė r=0,747 tikrinama pagal kritinių verčių lentelė. Pagal lentelę, kai N=18, gauta reikšmė reikšminga p lygyje<=0,005

Spearman ir Kendal rangų koreliacijos koeficientai

Kintamiesiems, priklausantiems eilės skalei arba kintamiesiems, kuriems netaikomas normalusis pasiskirstymas, taip pat kintamiesiems, priklausantiems intervalų skalei, vietoj Pirsono koeficiento skaičiuojama Spearman rango koreliacija. Norėdami tai padaryti, atskiroms kintamųjų reikšmėms priskiriamos eilės, kurios vėliau apdorojamos naudojant atitinkamas formules. Norėdami aptikti rango koreliaciją, išvalykite numatytojo Pearsono koreliacijos žymės langelį dialogo lange Dvimatės koreliacijos.... Vietoj to suaktyvinkite Spearman koreliacijos skaičiavimą. Šis skaičiavimas duos tokius rezultatus. Rango koreliacijos koeficientai yra labai artimi atitinkamoms Pearsono koeficientų reikšmėms (pradiniai kintamieji turi normalųjį pasiskirstymą).

titkova-matmetody.pdf p. 45

Spearmano rango koreliacijos metodas leidžia nustatyti sandarumą (stiprumą) ir kryptį

koreliacija tarp du ženklai arba du profiliai (hierarchijos)ženklai.

Norint apskaičiuoti rango koreliaciją, reikia turėti dvi verčių eilutes,

kuriuos galima reitinguoti. Tokios verčių serijos gali būti:

1) du ženklai matuojamas tuo pačiu grupė dalykų;

2) dvi individualios charakteristikų hierarchijos, nustatyta dviem tiriamiesiems naudojant tą patį

funkcijų rinkinys;

3) du charakteristikų grupių hierarchijos,

4) individualus ir grupinis bruožų hierarchija.

Pirma, kiekvienos charakteristikos rodikliai reitinguojami atskirai.

Paprastai žemesnei atributo reikšmei priskiriamas žemesnis rangas.

Pirmuoju atveju (dvi charakteristikos) individualios reikšmės reitinguojamos pagal pirmąją

charakteristika, gauta skirtingų dalykų, o tada individualios antrojo vertės

ženklas.

Jei dvi savybės yra teigiamai susijusios, tada žemų rangų subjektai

vienas iš jų turės žemus rangus kitame, o subjektai – aukštus rangus

viena iš charakteristikų taip pat turės aukštus rangus dėl kitos charakteristikos. Norėdami apskaičiuoti rs

reikia nustatyti skirtumus d) tarp rangų, gautų tam tikro dalyko abiejuose

ženklai. Tada šie rodikliai d transformuojami tam tikru būdu ir atimami iš 1. Nei

Kuo mažesnis skirtumas tarp rangų, tuo didesnis rs, tuo arčiau +1.

Jei koreliacijos nėra, tada visi rangai bus sumaišyti ir nebus

jokio susirašinėjimo. Formulė sukurta taip, kad šiuo atveju rs bus artimas 0.

Esant neigiamai koreliacijaižemi tiriamųjų reitingai vienu pagrindu

aukšti rangai kitu pagrindu atitiks, ir atvirkščiai. Kuo didesnis neatitikimas

tarp tiriamųjų gretų pagal du kintamuosius, tuo rs yra arčiau -1.

Antruoju atveju (du atskiri profiliai), reitinguojami pavieniai

vertės, kurias gavo kiekvienas iš 2 tiriamųjų pagal tam tikrą (jiems tas pats

tiek) požymių rinkinys. Pirmas reitingas bus suteiktas mažiausią reikšmę turinčiam objektui; antrasis rangas –

pasirašyti su daugiau Aukšta vertė ir tt Akivaizdu, kad visos charakteristikos turi būti išmatuotos

tie patys vienetai, kitaip reitinguoti neįmanoma. Pavyzdžiui, tai neįmanoma

reitinguokite rodiklius Cattell asmenybės inventoriuje (16PF), jei jie išreikšti

„neapdoroti“ taškai, nes skirtingų veiksnių verčių diapazonai skiriasi: nuo 0 iki 13, nuo 0 iki

20 ir nuo 0 iki 26. Negalime pasakyti, kuris veiksnys užims pirmąją vietą

išraiška, kol visos reikšmės nesukeliame į vieną skalę (dažniausiai tai yra sienos skalė).

Jei dviejų dalykų individualios hierarchijos yra teigiamai susijusios, tada ženklai

turintys žemus rangus vienoje iš jų turės žemus rangus kitoje, ir atvirkščiai.

Pavyzdžiui, jei vieno subjekto faktorius E (dominavimas) turi žemiausią reitingą, tada

kitas bandomasis asmuo, jo reitingas turėtų būti žemas, jei vienas tiriamasis turi faktorių C

(emocinis stabilumas) turi aukščiausią rangą, tada turi turėti ir kitas tiriamasis

šis veiksnys turi aukštą rangą ir kt.

Trečiuoju atveju (dviejų grupių profiliai) reitinguojamos grupės vidutinės vertės,

gautas 2 tiriamųjų grupėse pagal konkretų rinkinį, identiškas abiem grupėms

ženklai. Toliau samprotavimo linija yra tokia pati kaip ir ankstesniais dviem atvejais.

4 atveju (asmeniniai ir grupiniai profiliai) jie reitinguojami atskirai

individualios tiriamojo ir grupės vidutinės vertės tam pačiam rinkiniui

ženklai, kurie gaunami, kaip taisyklė, neįtraukiant šio atskiro subjekto – jis

nedalyvauja vidutiniame grupės profilyje, su kuriuo bus lyginamas jo individualus profilis

profilį. Reitingų koreliacija leis patikrinti, kiek nuoseklus individas ir

grupės profiliai.

Visais keturiais atvejais nustatoma gauto koreliacijos koeficiento reikšmė

pagal reitinguotų verčių skaičių N. Pirmuoju atveju šis kiekis sutaps su

imties dydis n. Antruoju atveju stebėjimų skaičius bus elementų skaičius,

sudaro hierarchiją. Trečiuoju ir ketvirtuoju atveju N taip pat yra lyginamasis skaičius

charakteristikas, o ne tiriamųjų skaičių grupėse. Išsamūs paaiškinimai pateikti pavyzdžiuose. Jeigu

absoliuti rs reikšmė pasiekia arba viršija kritinę reikšmę, koreliaciją

patikimas.

Hipotezės.

Galimos dvi hipotezės. Pirmasis taikomas 1 atveju, antrasis – kitiems trims

Pirmoji hipotezių versija

H0: Koreliacija tarp kintamųjų A ir B nesiskiria nuo nulio.

H2: Koreliacija tarp kintamųjų A ir B labai skiriasi nuo nulio.

Antroji hipotezių versija

H0: koreliacija tarp hierarchijų A ir B nesiskiria nuo nulio.

H2: koreliacija tarp hierarchijų A ir B labai skiriasi nuo nulio.

Rango koreliacijos koeficiento apribojimai

1. Kiekvienam kintamajam turi būti pateiktos ne mažiau kaip 5 pastabos. Viršutinė

mėginių ėmimo riba nustatoma pagal turimas kritinių verčių lenteles .

2. Spearmano rango koreliacijos koeficientas rs daugeliui identiškų

Vieno arba abiejų lyginamų kintamųjų reitingai pateikia apytiksles reikšmes. Idealiu atveju

abi koreliuotos eilutės turi atstovauti dvi skirtingų sekų

vertybes. Jei ši sąlyga neįvykdyta, turi būti padarytas pakeitimas

tos pačios eilės.

Spearmano rango koreliacijos koeficientas apskaičiuojamas pagal formulę:

Jei abiejose lyginamosiose eilėse yra to paties rango grupių,

prieš skaičiuojant rango koreliacijos koeficientą, reikia atlikti pataisymus tam pačiam

Ta ir TV gretos:

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

Kur A - kiekvienos A eilės identiškų eilučių grupės apimtis, in – kiekvieno tūris

identiškų rangų grupės B rangų serijoje.

Norėdami apskaičiuoti empirinę rs reikšmę, naudokite formulę:

38. Taškinės dvieilės koreliacijos koeficientas.

Apie koreliaciją apskritai žr. 36 klausimą Su. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Tegul kintamasis X matuojamas stipria skale, o kintamasis Y – dichotomine skale. Taškinio biserinio koreliacijos koeficientas rpb apskaičiuojamas pagal formulę:

Čia x 1 yra vidutinė X objektų vertė, o reikšmė "vienas" virš Y;

x 0 – vidutinė X objektų reikšmė, kurios reikšmė "nulis" virš Y;

s x – standartinis visų verčių išilgai X nuokrypis;

n 1 – objektų skaičius „vienas“ Y, n 0 – objektų skaičius „nulis“ Y;

n = n 1 + n 0 – imties dydis.

Taškinio biserinio koreliacijos koeficientą taip pat galima apskaičiuoti naudojant kitas lygiavertes išraiškas:

Čia x– bendra vidutinė kintamojo vertė X.

Taškų biserinės koreliacijos koeficientas rpb svyruoja nuo –1 iki +1. Jo reikšmė lygi nuliui, jei kintamieji su vienu Y turėti vidurkį Y, lygus kintamųjų, kurių nulis viršija nulį, vidurkiui Y.

Apžiūra reikšmingumo hipotezės taško biserinės koreliacijos koeficientas yra patikrinti nulinė hipotezėh 0 apie bendrojo koreliacijos koeficiento lygybę nuliui: ρ = 0, kuri atliekama naudojant Stjudento t-testą. Empirinė reikšmė

palyginti su kritinėmis vertėmis t a (df) laisvės laipsnių skaičiui df = n– 2

Jei sąlyga | t| ≤ tα(df), nulinė hipotezė ρ = 0 neatmetama. Taškinės biserinės koreliacijos koeficientas labai skiriasi nuo nulio, jei empirinė reikšmė | t| patenka į kritinę sritį, tai yra, jei būklė | t| > tα(n– 2). Sąryšio patikimumas, apskaičiuotas naudojant taškinės biserinės koreliacijos koeficientą rpb, taip pat galima nustatyti naudojant kriterijų χ 2 – laisvės laipsnių skaičius df= 2.

Taškinė biserinė koreliacija

Vėlesnis momentų sandaugos koreliacijos koeficiento modifikavimas atsispindėjo taško biserijoje r. Šis stat. rodo ryšį tarp dviejų kintamųjų, kurių vienas yra tariamai tęstinis ir normaliai paskirstytas, o kitas yra diskretiškas griežtąja to žodžio prasme. Taškinis biserinės koreliacijos koeficientas žymimas r pbis Nuo m r pbis dichotomija atspindi tikrąją diskretiškojo kintamojo prigimtį, o ne dirbtinę, kaip šiuo atveju r bis, jo ženklas nustatomas savavališkai. Todėl visais praktiniais tikslais. tikslus r pbis laikoma intervale nuo 0,00 iki +1,00.

Taip pat yra atvejis, kai daroma prielaida, kad du kintamieji yra nuolatiniai ir normaliai pasiskirstę, tačiau abu yra dirbtinai dichotomizuoti, kaip ir biserinės koreliacijos atveju. Tokių kintamųjų ryšiui įvertinti naudojamas tetrachorinės koreliacijos koeficientas r tet, kurį taip pat išvedė Pearsonas. Pagrindinis (tikslios) skaičiavimo formulės ir procedūros r tet gana sudėtinga. Todėl su praktiška Šis metodas naudoja aproksimacijas r tet,gautas sutrumpintų procedūrų ir lentelių pagrindu.

/on-line/dictionary/dictionary.php?term=511

TAŠKŲ BISERIJOS KOEFICIENTAS yra koreliacijos koeficientas tarp dviejų kintamųjų, kurių vienas matuojamas dichotominėje skalėje, o kitas – intervalų skalėje. Naudojamas klasikiniuose ir šiuolaikiniuose bandymuose kaip kokybės rodiklis bandomoji užduotis– patikimumas – suderinamumas su bendru testo rezultatu.

Norėdami koreliuoti kintamuosius, išmatuotus dichotominė ir intervalinė skalė naudoti taško-dvejų serijų koreliacijos koeficientas.
Koreliacijos koeficientas taškas ir dvieilis yra kintamųjų ryšio koreliacinės analizės metodas, iš kurių vienas matuojamas vardų skalėje ir turi tik 2 reikšmes (pavyzdžiui, vyrai/moterys, teisingas atsakymas/klaidingas atsakymas, požymis yra / nėra), o antrasis pagal skalės santykius arba intervalų skalę. Formulė taško-biserinės koreliacijos koeficientui apskaičiuoti:

Kur:
m1 ir m0 yra vidutinės X reikšmės, kurių Y reikšmė yra 1 arba 0.
σx – standartinis visų verčių nuokrypis X
n1,n0 – X reikšmių skaičius nuo 1 arba 0 iki Y.
n – bendras reikšmių porų skaičius

Dažniau Šis tipas Koreliacijos koeficientas naudojamas skaičiuojant ryšį tarp tiriamųjų elementų ir bendros skalės. Tai yra vienas iš galiojimo patikrinimo tipų.

39. Rango-biserinės koreliacijos koeficientas.

Apie koreliaciją apskritai žr. 36 klausimą Su. 56 (64) 063.JPG

harchenko-korranaliz.pdf p. 28

Reitingo biserinės koreliacijos koeficientas, naudojamas tais atvejais, kai vienas iš kintamųjų ( X) pateikiamas eilės skalėje, o kitas ( Y) – dichotominis, skaičiuojamas pagal formulę

Čia yra vidutinis objektų, turinčių vieną colią, reitingas Y; – vidutinis objektų reitingas nuo nulio iki Y, n– imties dydis.

Apžiūra reikšmingumo hipotezės Rango-biserinės koreliacijos koeficientas atliekamas panašiai kaip taškinės dvieilės koreliacijos koeficientas, naudojant Stjudento testą su pakeitimu formulėse rpbįjungta rrb.

Tais atvejais, kai vienas kintamasis matuojamas dichotomine skale (kintamasis X), o kitas rangų skalėje (kintamasis Y), naudojamas rango dvieilis koreliacijos koeficientas. Mes prisimename, kad kintamasis X, matuojant dichotomine skale, ima tik dvi reikšmes (kodas) 0 ir 1. Ypač pabrėžiame: nepaisant to, kad šis koeficientas svyruoja nuo –1 iki +1, jo ženklas neturi reikšmės interpretuojant rezultatus. Tai dar viena bendrosios taisyklės išimtis.

Šis koeficientas apskaičiuojamas pagal formulę:

kur ` X 1– vidutinis tų kintamojo elementų reitingas Y, kuris atitinka kodą (ženklą) 1 kintamajame X;

„X 0 – vidutinis tų kintamojo elementų reitingas Y, kuris atitinka kodą (ženklą) 0 kintamajame X\

N – bendras kintamojo elementų skaičius X.

Norint taikyti rango ir biserialo koreliacijos koeficientą, turi būti įvykdytos šios sąlygos:

1. Lyginami kintamieji turi būti matuojami skirtingomis skalėmis: viena X – dichotominiu mastu; kitas Y- reitingų skalėje.

2. Kintančių charakteristikų skaičius lyginamuosiuose kintamuosiuose X Ir Y turėtų būti tas pats.

3. Norėdami įvertinti rango dvieilės koreliacijos koeficiento patikimumo lygį, turėtumėte naudoti formulę (11.9) ir Studento testo kritinių verčių lentelę. k = n – 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Atvejai, kai vaizduojamas vienas iš kintamųjų dichotominė skalė, o kitas į rangas (eilinis), reikalinga paraiška rango dvisluoksnės koreliacijos koeficientas:

rpb = 2 / n * (m1 - m0)

Kur:
n – matavimo objektų skaičius
m1 ir m0 – vidutinis objektų, kurių antrasis kintamasis yra 1 arba 0, reitingas.
Šis koeficientas taip pat naudojamas tikrinant testų pagrįstumą.

40. Tiesinės koreliacijos koeficientas.

Dėl koreliacijos apskritai (o ypač tiesinės koreliacijos) žr. klausimą Nr. 36 Su. 56 (64) 063.JPG

P. PEARSONO KOEFICIENTAS

r- Pearsonas (Pearsonas r) naudojamas dviejų metrikų ryšiui tirtiskirtingi kintamieji, išmatuoti toje pačioje imtyje. Yra daug situacijų, kai jo naudojimas yra tinkamas. Ar intelektas turi įtakos akademiniams rezultatams vyresniųjų universitetų kursuose? Ar darbuotojo atlyginimo dydis susijęs su jo draugiškumu kolegoms? Ar mokinio nuotaika turi įtakos sudėtingo aritmetinio uždavinio sprendimo sėkmei? Norėdamas atsakyti į tokius klausimus, tyrėjas turi išmatuoti du dominančius rodiklius kiekvienam imties nariui. Duomenys, skirti tirti ryšį, pateikiami lentelėje, kaip parodyta toliau pateiktame pavyzdyje.

6.1 PAVYZDYS

Lentelėje pateiktas 20 8 klasės mokinių dviejų intelekto rodiklių (žodinio ir neverbalinio) matavimo pradinių duomenų pavyzdys.

Ryšys tarp šių kintamųjų gali būti pavaizduotas naudojant sklaidos diagramą (žr. 6.3 pav.). Diagrama rodo, kad tarp išmatuotų rodiklių yra tam tikras ryšys: kuo didesnė verbalinio intelekto vertė, tuo (dažniausiai) tuo didesnė neverbalinio intelekto vertė.

Prieš pateikdami koreliacijos koeficiento formulę, pabandykime atsekti jo atsiradimo logiką, pasinaudodami 6.1 pavyzdžio duomenimis. Kiekvieno /-taško (subjekto su skaičiumi /) padėtis sklaidos diagramoje kitų taškų atžvilgiu (6.3 pav.) gali būti nurodyta atitinkamų kintamųjų verčių nuokrypių nuo jų vidutinių verčių reikšmėmis ir ženklais. : (xj - MJ Ir (protas adresu ). Jei šių nukrypimų požymiai sutampa, tai rodo teigiamą ryšį ( didelės vertybės Autorius X atitinka dideles vertes adresu arba žemesnes vertes X atitinka mažesnes reikšmes y).

1 dalykui nukrypimas nuo vidurkio X ir pagal adresu teigiamas, o dalyko Nr. 3 abu nukrypimai yra neigiami. Vadinasi, abiejų duomenys rodo teigiamą ryšį tarp tirtų bruožų. Priešingai, jei nukrypimų nuo vidurkio požymių X ir pagal adresu skiriasi, tai parodys neigiamą charakteristikų ryšį. Taigi 4 dalykui nukrypimas nuo vidurkio X yra neigiamas, pagal y - teigiamas, o dalykui Nr.9 – atvirkščiai.

Taigi, jei nuokrypių sandauga (x,- M X ) X (protas adresu ) teigiamas, tai /-subjekto duomenys rodo tiesioginį (teigiamą) ryšį, o jei neigiamą, tai atvirkštinį (neigiamą) ryšį. Atitinkamai, jei Xwm y paprastai yra susiję tiesiogiai proporcingai, tada dauguma nukrypimų sandaugų bus teigiami, o jei jie yra susiję atvirkščiai, tada dauguma produktų bus neigiami. Todėl bendras ryšio stiprumo ir krypties rodiklis gali būti visų tam tikro pavyzdžio nuokrypių sandaugų suma:

Esant tiesiogiai proporcingam ryšiui tarp kintamųjų, ši vertė yra didelė ir teigiama - daugumos tiriamųjų nuokrypiai sutampa ženklu (didelės vieno kintamojo reikšmės atitinka dideles kito kintamojo reikšmes ir atvirkščiai). Jeigu X Ir adresu turėti grįžtamąjį ryšį, tada daugumai dalykų didelės vieno kintamojo reikšmės atitiks mažesnes kito kintamojo reikšmes, t.y. produktų ženklai bus neigiami, o produktų visuma taip pat bus didelė absoliučioji vertė, bet neigiamu ženklu. Jei tarp kintamųjų nėra sisteminio ryšio, tai teigiami nariai (nukrypimų sandaugai) bus subalansuoti neigiamais, o visų nukrypimų sandaugų suma bus artima nuliui.

Kad produktų suma nepriklausytų nuo imties dydžio, užtenka jos vidurkį. Bet mus domina sujungimo matas ne kaip bendras parametras, o kaip skaičiuojamas jo įvertinimas – statistika. Todėl, kalbant apie dispersijos formulę, šiuo atveju darysime tą patį, nuokrypių sandaugų sumą padalinsime ne iš N, o per televiziją – 1. Rezultatas – fizikoje ir technikos moksluose plačiai naudojamas ryšio matas, kuris vadinamas kovariacija (Kovahancija):

Psichologijoje, skirtingai nei fizikoje, dauguma kintamųjų matuojami savavališkomis skalėmis, nes psichologus domina ne absoliuti ženklo vertė, o santykinė subjektų padėtis grupėje. Be to, kovariacija yra labai jautri skalės (dispersijos), pagal kurią matuojami požymiai, skalei. Kad ryšio matas nepriklausytų nuo abiejų charakteristikų matavimo vienetų, pakanka kovariaciją padalyti į atitinkamus standartinius nuokrypius. Taip buvo gauta dėl-K. Pearsono koreliacijos koeficiento mulas:

arba, pakeitus išraiškas o x ir

Jei abiejų kintamųjų reikšmės buvo konvertuotos į r reikšmes naudojant formulę

tada r-Pearson koreliacijos koeficiento formulė atrodo paprastesnė (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

KORELIACIJA LINIJA- statistinis tiesinis ryšys tarp dviejų kiekybinių kintamųjų, neturintis priežastinio pobūdžio X Ir adresu. Matuojama naudojant „K.L koeficientą“. Pearsonas, kuris gaunamas padalijus kovariaciją iš abiejų kintamųjų standartinių nuokrypių:

Kur s xy- kovariacija tarp kintamųjų X Ir adresu;

s x , s y- kintamųjų standartiniai nuokrypiai X Ir adresu;

x i , y i- kintamos reikšmės X Ir adresu objektui su numeriu i;

x, y- kintamųjų aritmetiniai vidurkiai X Ir adresu.

Pearsono koeficientas r gali paimti reikšmes iš intervalo [-1; +1]. Reikšmė r = 0 reiškia, kad tarp kintamųjų nėra tiesinio ryšio X Ir adresu(tačiau neatmeta netiesinio statistinio ryšio). Teigiamos koeficiento vertės ( r> 0) nurodo tiesioginį tiesinį ryšį; kuo jo reikšmė arčiau +1, tuo stipresnis ryšys yra statistinė linija. Neigiamos vertybės koeficientas ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 reiškia visišką tiesinį ryšį, tiesioginį arba atvirkštinį. Visiško ryšio atveju visi taškai su koordinatėmis ( x i , y i) gulėkite tiesioje linijoje y = a + bx.

"Koeficientas K.L." Pearsonas taip pat naudojamas ryšio stiprumui matuoti tiesinės porinės regresijos modelyje.

41. Koreliacinė matrica ir koreliacijos grafikas.

Apie koreliaciją apskritai žr. 36 klausimą Su. 56 (64) 063.JPG

Koreliacijos matrica. Dažnai koreliacinė analizė apima ryšių tarp ne dviejų, o daugelio kintamųjų, išmatuotų kiekybine skale vienoje imtyje, tyrimą. Šiuo atveju koreliacijos apskaičiuojamos kiekvienai šio kintamųjų rinkinio porai. Skaičiavimai dažniausiai atliekami kompiuteriu, o rezultatas yra koreliacinė matrica.

Koreliacijos matrica(Koreliacija Matrica) yra kiekvienos aibės poros vieno tipo koreliacijų apskaičiavimo rezultatas R kintamieji, išmatuoti kiekybine skale vienoje imtyje.

PAVYZDYS

Tarkime, kad tiriame ryšius tarp 5 kintamųjų (vl, v2,..., v5; P= 5), išmatuotas pagal pavyzdį N = 30Žmogus. Žemiau yra šaltinio duomenų lentelė ir koreliacijos matrica.

IR
panašūs duomenys:

Koreliacijos matrica:

Nesunku pastebėti, kad koreliacijos matrica yra kvadratinė, simetriška pagrindinės įstrižainės atžvilgiu (takkak,y = /) y), o vienetai yra pagrindinėje įstrižainėje (nuo G Ir = Gu = 1).

Koreliacijos matrica yra kvadratas: eilučių ir stulpelių skaičius lygus kintamųjų skaičiui. Ji simetriškas pagrindinės įstrižainės atžvilgiu, nes koreliacija X Su adresu lygus koreliacijai adresu Su X. Vienetai yra pagrindinėje jo įstrižainėje, nes ypatybės koreliacija su savimi yra lygi vienetui. Vadinasi, analizuojami ne visi koreliacinės matricos elementai, o tie, kurie yra aukščiau arba žemiau pagrindinės įstrižainės.

Koreliacijos koeficientų skaičius, Savybės, kurias reikia analizuoti tiriant ryšius, nustatomos pagal formulę: P(P- 1)/2. Aukščiau pateiktame pavyzdyje tokių koreliacijos koeficientų skaičius yra 5(5 - 1)/2 = 10.

Pagrindinė koreliacinės matricos analizės užduotis yra identifikuojantis daugelio požymių santykių struktūrą. Šiuo atveju galima vizualinė analizė koreliacinės galaktikos- grafinis vaizdas struktūras statistiškaiprasmingi ryšiai, jei tokių jungčių nėra labai daug (iki 10-15). Kitas būdas – naudoti daugiamačius metodus: daugkartinę regresiją, faktorių ar klasterinę analizę (žr. skyrių „Daugiamatiniai metodai...“). Taikant faktorių arba klasterinę analizę, galima nustatyti kintamųjų grupes, kurios yra glaudžiau susijusios tarpusavyje nei su kitais kintamaisiais. Šių metodų derinys taip pat labai efektyvus, pavyzdžiui, jei ženklų yra daug ir jie nėra vienarūšiai.

Koreliacijų palyginimas - papildoma koreliacinės matricos analizės užduotis, kuri turi dvi galimybes. Jei reikia palyginti koreliacijas vienoje iš koreliacijos matricos eilučių (vienam iš kintamųjų), taikomas priklausomų imčių palyginimo metodas (p. 148-149). Lyginant skirtingoms imtims apskaičiuotas to paties pavadinimo koreliacijas, naudojamas nepriklausomų imčių palyginimo metodas (p. 147-148).

Palyginimo metodai koreliacijos įstrižainėse koreliacinė matrica (atsitiktinio proceso stacionarumui įvertinti) ir palyginimas kelis koreliacinės matricos, gautos skirtingiems pavyzdžiams (dėl jų homogeniškumo), yra daug darbo reikalaujančios ir nepatenka į šios knygos taikymo sritį. Su šiais metodais galite susipažinti iš G. V. Sukhodolsky knygos 1.

Koreliacijų statistinio reikšmingumo problema. Problema ta, kad statistinių hipotezių tikrinimo procedūra daro prielaidą vienas-daugkartinis bandymas atliktas su vienu mėginiu. Jei taikomas tas pats metodas pakartotinai, net jei skirtingų kintamųjų atžvilgiu tikimybė gauti rezultatą grynai atsitiktinai padidėja. Apskritai, jei kartosime tą patį hipotezės tikrinimo metodą kartą skirtingų kintamųjų ar imčių atžvilgiu, tada su nustatyta verte a garantuojame, kad gausime hipotezės patvirtinimą ah atvejų skaičius.

Tarkime, kad koreliacijos matrica analizuojama 15 kintamųjų, tai yra, apskaičiuojami 15(15-1)/2 = 105 koreliacijos koeficientai. Hipotezėms tikrinti nustatomas lygis a = 0,05 Patikrinus hipotezę 105 kartus, gausime jos patvirtinimą penkis kartus (!), nepriklausomai nuo to, ar ryšys iš tikrųjų egzistuoja. Ar žinant tai ir turėdami, tarkime, 15 „statistiškai reikšmingų“ koreliacijos koeficientų, galime pasakyti, kurie iš jų gauti atsitiktinai, o kurie atspindi tikrą ryšį?

Griežtai tariant, norint priimti statistinį sprendimą, reikia sumažinti a lygį tiek kartų, kiek yra tikrinamų hipotezių. Tačiau tai vargu ar patartina, nes nenuspėjamai tikimybė iš tikrųjų ignoruoti esamą ryšį(padaryti II tipo klaidą).

Vien koreliacijos matrica nėra pakankamas pagrindasstatistinėms išvadoms dėl į jį įtrauktų atskirų koeficientųkoreliacijos!

Yra tik vienas tikrai įtikinamas būdas išspręsti šią problemą: atsitiktine tvarka padalyti imtį į dvi dalis ir atsižvelgti tik į tas koreliacijas, kurios yra statistiškai reikšmingos abiejose imties dalyse. Alternatyva gali būti kelių kintamųjų metodų (faktorių, klasterių arba daugialypės regresijos analizės) naudojimas, siekiant nustatyti ir vėliau interpretuoti statistiškai reikšmingai susijusių kintamųjų grupes.

Trūkstamų vertybių problema. Jei duomenyse trūksta reikšmių, koreliacijos matricai apskaičiuoti galimi du variantai: a) reikšmių pašalinimas iš eilės. (Neįtrauktiatvejųlistwise); b) porinis reikšmių trynimas (Neįtrauktiatvejųporomis). At eilutė po eilutės ištrynimas stebėjimai su trūkstamomis reikšmėmis, ištrinama visa objekto (subjekto), kuriame trūksta bent vienos vieno iš kintamųjų reikšmės, eilutė. Šis metodas veda į „teisingą“ koreliacijos matricą ta prasme, kad visi koeficientai apskaičiuojami iš to paties objektų rinkinio. Tačiau jei trūkstamos reikšmės kintamuosiuose paskirstomos atsitiktinai, tai šis metodas gali lemti tai, kad nagrinėjamame duomenų rinkinyje neliks nė vieno objekto (kiekvienoje eilutėje bus bent viena trūkstama reikšmė). . Norėdami išvengti šios situacijos, naudokite kitą metodą, vadinamą porinis pašalinimas.Šis metodas atsižvelgia tik į kiekvienos pasirinktos stulpelio ir kintamųjų poros spragas ir nepaiso kitų kintamųjų spragų. Koreliacija kintamųjų porai apskaičiuojama tiems objektams, kuriuose nėra spragų. Daugeliu atvejų, ypač kai spragų skaičius yra palyginti mažas, tarkime, 10%, o tarpai pasiskirsto gana atsitiktinai, šis metodas nesukelia rimtų klaidų. Tačiau kartais taip nėra. Pavyzdžiui, sisteminis poslinkis (poslinkis) vertinime gali „paslėpti“ sistemingą praleidimų išdėstymą, dėl kurio skiriasi koreliacijos koeficientai, sukonstruoti skirtingiems pogrupiams (pavyzdžiui, skirtingiems objektų pogrupiams). Kita problema, susijusi su koreliacijos matrica, apskaičiuota naudojant poromis spragų pašalinimas atsiranda, kai ši matrica naudojama kitų tipų analizėje (pavyzdžiui, daugkartinėje regresinėje arba faktorinėje analizėje). Jie daro prielaidą, kad „teisinga“ koreliacijos matrica naudojama su tam tikru nuoseklumo ir įvairių koeficientų „atitikimo“ lygiu. Naudojant matricą su „blogais“ (šališkais) įverčiais, programa arba negali išanalizuoti tokios matricos, arba rezultatai bus klaidingi. Todėl, jei naudojamas porinis trūkstamų duomenų pašalinimo metodas, būtina patikrinti, ar nėra sistemingų trūkstamų duomenų paskirstymo modelių.

Jei porinis trūkstamų duomenų ištrynimas nesukelia jokių sistemingų vidurkių ir dispersijų (standartinių nuokrypių) poslinkių, ši statistika bus panaši į statistiką, apskaičiuotą naudojant trūkstamų duomenų ištrynimo eilutę metodą. Jei pastebimas reikšmingas skirtumas, yra pagrindo manyti, kad įverčiai pasikeitė. Pavyzdžiui, jei kintamojo reikšmių vidurkis (arba standartinis nuokrypis). A, kuris buvo naudojamas skaičiuojant jo koreliaciją su kintamuoju IN, daug mažiau nei tų pačių kintamojo verčių vidurkis (arba standartinis nuokrypis). A, kurios buvo naudojamos apskaičiuojant jo koreliaciją su kintamuoju C, tada yra pagrindo tikėtis, kad šios dvi koreliacijos (A-Bmus) remiantis skirtingais duomenų pogrupiais. Koreliacijose bus paklaida, kurią sukelia neatsitiktinis kintamųjų verčių spragų išdėstymas.

Koreliacinių galaktikų analizė. Išsprendus koreliacinės matricos elementų statistinio reikšmingumo problemą, statistiškai reikšmingas koreliacijas galima pavaizduoti grafiškai koreliacinės galaktikos arba galaktikos pavidalu. Koreliacinė galaktika - Tai figūra, susidedanti iš viršūnių ir jas jungiančių linijų. Viršūnės atitinka charakteristikas ir dažniausiai žymimos skaičiais – kintamaisiais skaičiais. Linijos atitinka statistiškai reikšmingus ryšius ir grafiškai išreiškia ryšio ženklą, o kartais ir j-lygį.

Koreliacinė galaktika gali atspindėti Visi statistiškai reikšmingi koreliacinės matricos ryšiai (kartais vadinami koreliacijos grafikas ) arba tik prasmingai parinkta jų dalis (pavyzdžiui, atitinkanti vieną veiksnį pagal faktorinės analizės rezultatus).

KORELIACIJOS PLEIADO KONSTRUKCIJOS PAVYZDYS

Pasirengimas abiturientų valstybiniam (baigiamajam) atestavimui: Vieningų valstybinių egzaminų duomenų bazės formavimas (bendras visų kategorijų vieningo valstybinio egzamino dalyvių sąrašas, nurodant dalykus) - atsižvelgiant į rezervines dienas tų pačių dalykų atveju;

Darbo planas (27)

Sprendimas

2. Švietimo įstaigos veikla gamtos mokslų ir matematikos ugdymo dalykų turiniui ir kokybei įvertinti Savivaldybės ugdymo įstaiga 4 vidurinė mokykla, Litvinovskaja, Čapajevskaja

Koreliacinė analizė yra metodas, leidžiantis nustatyti priklausomybes tarp tam tikro skaičiaus atsitiktinių dydžių. Koreliacinės analizės tikslas – nustatyti ryšių stiprumo tarp tokių atsitiktinių dydžių ar požymių, apibūdinančių tam tikrus realius procesus, įvertinimą.

Šiandien siūlome apsvarstyti, kaip Spearman koreliacinė analizė naudojama vizualiai parodyti komunikacijos formas praktinėje prekyboje.

Spearman koreliacija arba koreliacinės analizės pagrindas

Norėdami suprasti, kas yra koreliacinė analizė, pirmiausia turite suprasti koreliacijos sąvoką.

Tuo pačiu, jei kaina pradeda judėti norima kryptimi, reikia laiku atrakinti savo pozicijas.

Šiai koreliacijos analize pagrįstai strategijai geriausiai tinka prekybos priemonės su aukštu koreliacijos laipsniu (EUR/USD ir GBP/USD, EUR/AUD ir EUR/NZD, AUD/USD ir NZD/USD, CFD sutartys ir panašiai) .

Vaizdo įrašas: Spearman koreliacijos taikymas Forex rinkoje

Praktikoje Spearman rango koreliacijos koeficientas (P) dažnai naudojamas dviejų charakteristikų ryšio glaudumui nustatyti. Kiekvienos charakteristikos reikšmės surikiuojamos pagal padidėjimo laipsnį (nuo 1 iki n), tada nustatomas skirtumas (d) tarp eilučių, atitinkančių vieną stebėjimą.

1 pavyzdys. Pramonės produkcijos apimties ir investicijų į pagrindinį kapitalą santykis 10 vienos iš Rusijos Federacijos federalinių apygardų 2003 m. apibūdinamas šiais duomenimis.
Apskaičiuoti Spearman rango koreliacijos koeficientai ir Kendal. Patikrinkite jų reikšmingumą esant α=0,05. Suformuluokite išvadą apie pramonės produkcijos apimties ir investicijų į pagrindinį kapitalą ryšį nagrinėjamuose Rusijos Federacijos regionuose.

Priskirkime Y ir faktoriaus X rangus. Raskime kvadratų skirtumo d 2 sumą.
Naudodami skaičiuotuvą apskaičiuojame Spearman rango koreliacijos koeficientą:

X	Y	rangas X, d x	Y, d y reitingas	(d x – d y) 2
1.3	300	1	2	1
1.8	1335	2	12	100
2.4	250	3	1	4
3.4	946	4	8	16
4.8	670	5	7	4
5.1	400	6	4	4
6.3	380	7	3	16
7.5	450	8	5	9
7.8	500	9	6	9
17.5	1582	10	16	36
18.3	1216	11	9	4
22.5	1435	12	14	4
24.9	1445	13	15	4
25.8	1820	14	19	25
28.5	1246	15	10	25
33.4	1435	16	14	4
42.4	1800	17	18	1
45	1360	18	13	25
50.4	1256	19	11	64
54.8	1700	20	17	9
				364

Ryšys tarp Y bruožo ir faktoriaus X yra stiprus ir tiesioginis.

Spearmano rango koreliacijos koeficiento įvertinimas

Naudodami Studento lentelę randame T lentelę.
T lentelė = (18;0,05) = 1,734
Kadangi Tob > Ttabl, atmetame hipotezę, kad rango koreliacijos koeficientas lygus nuliui. Kitaip tariant, Spearmano rango koreliacijos koeficientas yra statistiškai reikšmingas.

Reitingo koreliacijos koeficiento intervalo įvertinimas (pasitikėjimo intervalas)
Pasitikėjimo intervalas Spearmano rango koreliacijos koeficientui: p(0,5431;0,9095).

2 pavyzdys. Pradiniai duomenys.

5	4
3	4
1	3
3	1
6	6
2	2

Kadangi matricoje yra susiję 1-osios eilės rangai (tas pats rango numeris), juos pertvarkysime. Laipsnių pertvarkymas vykdomas nekeičiant rango svarbos, tai yra, tarp rango skaičių turi būti palaikomi atitinkami ryšiai (daugiau nei, mažesni arba lygūs). Taip pat nerekomenduojama nustatyti rango virš 1 ir žemiau reikšmės lygus skaičiui parametrai (in tokiu atveju n = 6). Eilių pertvarkymas vykdomas lentelėje.

		Naujos eilės
1	1	1
2	2	2
3	3	3.5
4	3	3.5
5	5	5
6	6	6

Kadangi matricoje yra susietos 2-osios eilės eilės, jas suformatuosime iš naujo. Eilių pertvarkymas vykdomas lentelėje.

Sėdimų numeriai eilėje	Veiksnių išdėstymas pagal eksperto vertinimą	Naujos eilės
1	1	1
2	2	2
3	3	3
4	4	4.5
5	4	4.5
6	6	6

Reitingo matrica.

rangas X, d x	Y, d y reitingas	(d x – d y) 2
5	4.5	0.25
3.5	4.5	1
1	3	4
3.5	1	6.25
6	6	0
2	2	0
21	21	11.5

Kadangi tarp ypatybių x ir y reikšmių yra keletas identiškų, t.y. sudaromos susijusios eilės, tada šiuo atveju Spearmano koeficientas apskaičiuojamas taip:

Kur

j - jungčių skaičiai pagal charakteristikas x;
Ir j yra identiškų eilių skaičius j-asis raištis pagal x;
k - jungčių skaičiai pagal charakteristikas y;
In k – identiškų eilių skaičius k-oje jungiamojoje y.
A = [(2 3 -2)]/12 = 0,5
B = [(2 3 -2)]/12 = 0,5
D = A + B = 0,5 + 0,5 = 1

Ryšys tarp Y bruožo ir faktoriaus X yra vidutiniškas ir tiesioginis.

Spearman rango koreliacijos metodas leidžia nustatyti dviejų charakteristikų arba dviejų charakteristikų profilių (hierarchijų) koreliacijos artumą (stiprumą) ir kryptį.

Norint apskaičiuoti rango koreliaciją, reikia turėti dvi verčių eilutes,

kuriuos galima reitinguoti. Tokios verčių serijos gali būti:

1) du ženklai, matuojami toje pačioje tiriamųjų grupėje;

2) dvi individualios požymių hierarchijos, nustatytos dviejuose tiriamuosiuose, naudojant tą patį požymių rinkinį;

3) dvi grupinės charakteristikų hierarchijos,

4) individualios ir grupinės charakteristikų hierarchijos.

Pirma, kiekvienos charakteristikos rodikliai reitinguojami atskirai.

Paprastai žemesnei atributo reikšmei priskiriamas žemesnis rangas.

Pirmuoju atveju (dvi charakteristikos) reitinguojamos individualios pirmosios charakteristikos, gautos skirtingų subjektų, reikšmės, o po to - antrosios charakteristikos individualios reikšmės.

Jei dvi charakteristikos yra teigiamai susijusios, tada tiriamieji, kurių vieno iš jų reitingai yra žemi, kitoje yra žemi, o subjektai, kurių reitingai yra aukšti.

viena iš charakteristikų taip pat turės aukštus rangus dėl kitos charakteristikos. Norint apskaičiuoti rs, būtina nustatyti skirtumus (d) tarp rangų, gautų tam tikro tiriamojo pagal abi charakteristikas. Tada šie rodikliai d transformuojami tam tikru būdu ir atimami iš 1. Nei

Kuo mažesnis skirtumas tarp rangų, tuo didesnis rs, tuo arčiau +1.

Jei koreliacijos nėra, tada visi rangai bus sumaišyti ir nebus

jokio susirašinėjimo. Formulė sukurta taip, kad šiuo atveju rs bus artimas 0.

Esant neigiamai koreliacijai tarp žemų tiriamųjų rangų pagal vieną požymį

aukšti rangai kitu pagrindu atitiks, ir atvirkščiai. Kuo didesnis neatitikimas tarp tiriamųjų rangų pagal du kintamuosius, tuo rs artimesnis -1.

Antruoju atveju (du individualūs profiliai), individualūs

vertės, kurias gavo kiekvienas iš 2 tiriamųjų tam tikram (abiem identiškam) savybių rinkiniui. Pirmas reitingas bus suteiktas mažiausią reikšmę turinčiam objektui; antrasis rangas yra didesnės vertės požymis ir pan. Akivaizdu, kad visi požymiai turi būti matuojami tais pačiais vienetais, kitaip reitinguoti neįmanoma. Pavyzdžiui, Cattell Personality Inventory (16PF) rodiklių reitinguoti neįmanoma, jei jie išreikšti „neapdorotais“ taškais, nes skirtingų veiksnių verčių diapazonai skiriasi: nuo 0 iki 13, nuo 0 iki

20 ir nuo 0 iki 26. Negalime pasakyti, kuris veiksnys užims pirmąją vietą pagal sunkumą, kol nesukelsime visų reikšmių į vieną skalę (dažniausiai tai yra sienos skalė).

Jei atskiros dviejų dalykų hierarchijos yra pozityviai susijusios, tai bruožai, kurių viename iš jų yra žemi rangai, kitame bus žemi, ir atvirkščiai. Pavyzdžiui, jei vieno tiriamojo veiksnio E (dominavimo) reitingas yra žemiausias, tai kito tiriamojo veiksnys taip pat turėtų būti žemesnis, jei vieno subjekto faktorius C

(emocinis stabilumas) turi aukščiausią rangą, tada turi turėti ir kitas tiriamasis

šis veiksnys turi aukštą rangą ir kt.

Trečiuoju atveju (dviejų grupių profiliai) grupės vidutinės vertės, gautos 2 tiriamųjų grupėse, yra suskirstytos pagal tam tikrą charakteristikų rinkinį, identišką abiem grupėms. Toliau samprotavimo linija yra tokia pati kaip ir ankstesniais dviem atvejais.

4 atveju (individualūs ir grupiniai profiliai) individualios tiriamojo vertės ir grupės vidutinės reikšmės yra reitinguojamos atskirai pagal tą patį charakteristikų rinkinį, kuris paprastai gaunamas neįtraukiant šio individualaus dalyko - jis nedalyvauja grupės vidurkio profilyje, su kuriuo bus lyginamas individualus profilis. Rango koreliacija patikrins, ar nuoseklūs yra asmens ir grupės profiliai.

Visais keturiais atvejais gauto koreliacijos koeficiento reikšmė nustatoma pagal reitinguotų verčių skaičių N. Pirmuoju atveju šis skaičius sutaps su imties dydžiu n. Antruoju atveju stebėjimų skaičius bus elementų, sudarančių hierarchiją, skaičius. Trečiuoju ir ketvirtuoju atveju N taip pat yra palyginamų požymių skaičius, o ne tiriamųjų skaičius grupėse. Išsamūs paaiškinimai pateikti pavyzdžiuose. Jei absoliuti rs reikšmė pasiekia arba viršija kritinę reikšmę, koreliacija yra patikima.

Hipotezės.

Galimos dvi hipotezės. Pirmasis taikomas 1 atveju, antrasis – kitiems trims atvejams.

Pirmoji hipotezių versija

H0: Koreliacija tarp kintamųjų A ir B nesiskiria nuo nulio.

H1: Koreliacija tarp kintamųjų A ir B labai skiriasi nuo nulio.

Antroji hipotezių versija

H0: koreliacija tarp hierarchijų A ir B nesiskiria nuo nulio.

H1: koreliacija tarp hierarchijų A ir B labai skiriasi nuo nulio.

Rango koreliacijos koeficiento apribojimai

1. Kiekvienam kintamajam turi būti pateiktos ne mažiau kaip 5 pastabos. Mėginio viršutinė riba nustatoma pagal turimas kritinių verčių lenteles.

2. Spearman'o rango koreliacijos koeficientas rs su dideliu vienodų rangų skaičiumi vienam arba abiem lyginamiesiems kintamiesiems suteikia apytiksles reikšmes. Idealiu atveju abi susijusios eilutės turėtų atspindėti dvi skirtingų verčių sekas. Jei ši sąlyga neįvykdyta, būtina atlikti vienodų rangų koregavimą.

Spearmano rango koreliacijos koeficientas apskaičiuojamas pagal formulę:

Jei abiejose lyginamosiose rangų eilutėse yra tų pačių rangų grupių, prieš skaičiuojant rango koreliacijos koeficientą, reikia atlikti pataisymus tų pačių rangų Ta ir Tb:

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

kur a yra kiekvienos identiškų eilučių grupės A rangų serijoje tūris, b yra kiekvienos iš jų tūris

identiškų rangų grupės B rangų serijoje.

Norėdami apskaičiuoti empirinę rs reikšmę, naudokite formulę:

Spearmano rango koreliacijos koeficiento rs apskaičiavimas

1. Nustatykite, kurios dvi savybės ar dvi charakteristikų hierarchijos dalyvaus

palyginimas su kintamaisiais A ir B.

2. Suskirstykite kintamojo A reikšmes, 1 rangą priskirdami mažiausiai reikšmei pagal reitingavimo taisykles (žr. P.2.3). Įveskite eiles pirmajame lentelės stulpelyje pagal tiriamųjų skaičių arba charakteristikas.

3. Suskirstykite kintamojo B reikšmes pagal tas pačias taisykles. Antrame lentelės stulpelyje įveskite eiles pagal dalykų ar charakteristikų skaičius.

5. Palyginkite kiekvieną skirtumą kvadratu: d2. Įveskite šias reikšmes į ketvirtą lentelės stulpelį.

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

čia a yra kiekvienos A eilės identiškų eilučių grupės tūris; c – kiekvienos grupės tūris

identiškos B reitingų serijos vietos.

a) nesant identiškų rangų

rs  1 − 6 ⋅

b) esant identiškiems rangams

Σd 2  T  T

r  1 – 6 ⋅ a in,

čia Σd2 yra skirtumų tarp eilučių kvadratu suma; Ta ir TV – pataisos už tą patį

N – reitinge dalyvaujančių dalykų ar savybių skaičius.

9. Iš lentelės (žr. 4.3 priedą) nustatykite kritines rs reikšmes tam tikram N. Jei rs viršija kritinę reikšmę arba yra bent jai lygi, koreliacija žymiai skiriasi nuo 0.

4.1 pavyzdys Tiriamojoje grupėje nustatant alkoholio vartojimo reakcijos priklausomybės nuo akių motorinės reakcijos laipsnį, gauti duomenys prieš ir po alkoholio vartojimo. Ar tiriamojo reakcija priklauso nuo apsvaigimo būklės?

Eksperimento rezultatai:

Prieš: 16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. Po: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Suformuluokime hipotezes:

H0: koreliacija tarp reakcijos priklausomybės laipsnio prieš ir po alkoholio vartojimo nesiskiria nuo nulio.

H1: koreliacija tarp reakcijos priklausomybės laipsnio prieš ir po alkoholio vartojimo gerokai skiriasi nuo nulio.

4.1 lentelė. Spearmano rango koreliacijos koeficiento rs d2 apskaičiavimas lyginant okulomotorinės reakcijos rodiklius prieš ir po eksperimento (N=17)


	vertybes		vertybes

Kadangi turime pasikartojančius rangus, tokiu atveju taikysime formulę, pritaikytą identiškiems rangams:

Ta= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

Тb =((23-2)+(23-2)+(33-3))/12=3

Raskime Spearman koeficiento empirinę reikšmę:

rs = 1-6*((767,75+6+3)/(17*(172-1)))=0,05

Naudodamiesi lentele (4.3 priedas) randame koreliacijos koeficiento kritines reikšmes

0,48 (p ≤ 0,05)

0,62 (p ≤ 0,01)

Mes gauname

rs=0,05∠rcr(0,05)=0,48

Išvada: H1 hipotezė atmetama, o H0 priimta. Tie. laipsnio koreliacija

reakcijos priklausomybė prieš ir po alkoholio vartojimo nesiskiria nuo nulio.

yra kiekybinis statistinio reiškinių ryšio tyrimo įvertinimas, naudojamas neparametriniuose metoduose.

Rodiklis parodo, kaip stebėjimo metu gautų rangų skirtumų kvadratu suma skiriasi nuo ryšio nebuvimo atvejo.

Paslaugos paskirtis. Naudodami šį internetinį skaičiuotuvą galite:

Spearmano rango koreliacijos koeficiento apskaičiavimas;
koeficiento pasikliautinojo intervalo apskaičiavimas ir jo reikšmingumo įvertinimas;

Spearmano rango koreliacijos koeficientas nurodo bendravimo glaudumo vertinimo rodiklius. Kokybinė rango koreliacijos koeficiento, kaip ir kitų koreliacijos koeficientų, ryšio glaudumo charakteristika gali būti įvertinta naudojant Chaddock skalę.

Koeficiento apskaičiavimas susideda iš šių žingsnių:

Spearmano rango koreliacijos koeficiento savybės

Taikymo sritis. Rangų koreliacijos koeficientas naudojamas dviejų populiacijų bendravimo kokybei įvertinti. Be to, jo statistinis reikšmingumas naudojamas analizuojant heteroskedastiškumo duomenis.

Pavyzdys. Remiantis stebimų kintamųjų X ir Y imtimi:

sukurti reitingų lentelę;
Raskite Spearman rango koreliacijos koeficientą ir patikrinkite jo reikšmę 2a lygyje
įvertinti priklausomybės pobūdį

Sprendimas. Priskirkime Y ir faktoriaus X rangus.

X	Y	rangas X, d x	Y, d y reitingas
28	21	1	1
30	25	2	2
36	29	4	3
40	31	5	4
30	32	3	5
46	34	6	6
56	35	8	7
54	38	7	8
60	39	10	9
56	41	9	10
60	42	11	11
68	44	12	12
70	46	13	13
76	50	14	14

Reitingų matrica.

rangas X, d x	Y, d y reitingas	(d x – d y) 2
1	1	0
2	2	0
4	3	1
5	4	1
3	5	4
6	6	0
8	7	1
7	8	1
10	9	1
9	10	1
11	11	0
12	12	0
13	13	0
14	14	0
105	105	10

Matricos teisingumo patikrinimas remiantis kontrolinės sumos skaičiavimu:

Matricos stulpelių suma yra lygi viena kitai ir kontrolinei sumai, o tai reiškia, kad matrica sudaryta teisingai.
Naudodami formulę apskaičiuojame Spearman rango koreliacijos koeficientą.

Ryšys tarp Y bruožo ir faktoriaus X yra stiprus ir tiesioginis
Spearmano rango koreliacijos koeficiento reikšmė
Norint patikrinti nulinę hipotezę reikšmingumo lygyje α, bendras Spearmano rango koreliacijos koeficientas yra lygus nuliui pagal konkuruojančią hipotezę Hi. p ≠ 0, turime apskaičiuoti kritinį tašką:

čia n yra imties dydis; ρ – imties Spearman rango koreliacijos koeficientas: t(α, k) – dvipusės kritinės srities kritinis taškas, randamas iš Studento skirstinio kritinių taškų lentelės, pagal reikšmingumo lygį α ir skaičių. laisvės laipsnių k = n-2.
Jei |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp – nulinė hipotezė atmetama. Tarp kokybinių savybių yra reikšminga ranginė koreliacija.
Naudodami Stjudento lentelę randame t(α/2, k) = (0,1/2;12) = 1,782

Kadangi T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.