Koeficijent korelacije je jednak 1 korelaciji. Primjer pronalaženja koeficijenta korelacije. Istorijat razvoja korelacionog kriterijuma

Koeficijent korelacije je stepen veze između dvije varijable. Njegov proračun daje ideju da li postoji veza između dva skupa podataka. Za razliku od regresije, korelacija ne predviđa vrijednosti količina. Međutim, izračun koeficijenta je važna faza preliminarni Statistička analiza. Na primjer, utvrdili smo da je koeficijent korelacije između nivoa stranih direktnih investicija i stope rasta BDP-a visok. To nam daje ideju da je za osiguranje prosperiteta potrebno stvoriti povoljnu klimu posebno za strane poduzetnike. Na prvi pogled nije tako očigledan zaključak!

Korelacija i uzročnost

Možda ne postoji niti jedno područje statistike koje se tako čvrsto ustalilo u našim životima. Koeficijent korelacije se koristi u svim oblastima društvenog znanja. Njegova glavna opasnost je da se o njegovim visokim vrijednostima često spekuliše kako bi se ljudi uvjerili i natjerali da povjeruju u neke zaključke. Međutim, u stvari, jaka korelacija uopće ne ukazuje na uzročno-posljedičnu vezu između količina.

Koeficijent korelacije: Pirsonova i Spirmanova formula

Postoji nekoliko osnovnih indikatora koji karakterišu odnos između dve varijable. Istorijski gledano, prvi je Pearsonov koeficijent linearne korelacije. Uči se u školi. Razvili su ga K. Pearson i J. Yule na osnovu rada Fr. Galton. Ovaj koeficijent vam omogućava da vidite odnos između racionalni brojevi, koji se racionalno mijenjaju. Uvijek je veći od -1 i manji od 1. Negativan broj ukazuje na obrnuto proporcionalnu vezu. Ako je koeficijent jednaka nuli, tada nema veze između varijabli. Jednako pozitivnom broju - postoji direktno proporcionalna veza između količina koje se proučavaju. Spearmanov koeficijent korelacije ranga omogućava vam da pojednostavite proračune izgradnjom hijerarhije varijabilnih vrijednosti.

Odnosi između varijabli

Korelacija pomaže da se odgovori na dva pitanja. Prvo, da li je odnos između varijabli pozitivan ili negativan. Drugo, koliko je jaka ovisnost. Korelaciona analiza je moćan alat koji može pružiti ove važne informacije. Lako je uočiti da porodični prihodi i rashodi padaju i rastu proporcionalno. Ovaj odnos se smatra pozitivnim. Naprotiv, kada cijena proizvoda raste, potražnja za njim opada. Ovaj odnos se naziva negativnim. Vrijednosti koeficijenta korelacije kreću se između -1 i 1. Nula znači da ne postoji veza između vrijednosti koje se proučavaju. Što je dobijeni indikator bliži ekstremnim vrijednostima, to je veza jača (negativna ili pozitivna). Odsustvo zavisnosti je označeno koeficijentom od -0,1 do 0,1. Morate shvatiti da takva vrijednost samo ukazuje na odsustvo linearnog odnosa.

Karakteristike primjene

Upotreba oba indikatora uključuje određene pretpostavke. Prvo, prisustvo jake veze ne određuje činjenicu da jedna veličina određuje drugu. Možda postoji treća veličina koja definira svaku od njih. Drugo, visok Pearsonov koeficijent korelacije ne ukazuje na uzročno-posledičnu vezu između proučavanih varijabli. Treće, pokazuje isključivo linearna zavisnost. Korelacija se može koristiti za procjenu značajnih kvantitativnih podataka (npr. barometarski pritisak, temperatura zraka) umjesto kategorija kao što su spol ili omiljena boja.

Višestruki koeficijent korelacije

Pearson i Spearman su ispitivali odnos između dvije varijable. Ali šta učiniti ako ih ima tri ili čak više. Tu u pomoć dolazi koeficijent višestruke korelacije. Na primjer, na bruto nacionalni proizvod utiču ne samo direktne strane investicije, već i vladina monetarna i fiskalna politika, kao i nivo izvoza. Stopa rasta i obim BDP-a rezultat su interakcije brojnih faktora. Međutim, mora se shvatiti da je model višestruke korelacije zasnovan na brojnim pojednostavljenjima i pretpostavkama. Prvo, isključena je multikolinearnost između vrijednosti. Drugo, odnos između zavisne i varijabli koje utječu na nju smatra se linearnim.

Oblasti upotrebe korelacione i regresione analize

Ova metoda pronalaženja odnosa između veličina se široko koristi u statistici. Najčešće se pribjegava u tri glavna slučaja:

  1. Testirati uzročno-posljedične veze između vrijednosti dvije varijable. Kao rezultat toga, istraživač se nada da će otkriti linearnu vezu i izvesti formulu koja opisuje ove odnose između veličina. Njihove mjerne jedinice mogu biti različite.
  2. Za provjeru odnosa između količina. U ovom slučaju, niko ne određuje koja je varijabla zavisna varijabla. Može se ispostaviti da neki drugi faktor određuje vrijednost obje veličine.
  3. Da bi se izvela jednadžba. U ovom slučaju, možete jednostavno zamijeniti brojeve u njega i saznati vrijednosti nepoznate varijable.

Muškarac u potrazi za uzročno-posledičnom vezom

Svijest je osmišljena na način da svakako moramo objasniti događaje koji se dešavaju oko nas. Čovjek uvijek traži vezu između slike svijeta u kojem živi i informacija koje prima. Mozak često stvara red iz haosa. Lako može uočiti uzročno-posledičnu vezu tamo gde je nema. Naučnici moraju posebno naučiti da prevladaju ovu tendenciju. Sposobnost objektivne procjene odnosa između podataka je od suštinskog značaja u akademskoj karijeri.

Medijska pristrasnost

Hajde da razmotrimo kako se prisustvo korelacije može pogrešno protumačiti. Grupa britanskih studenata lošeg ponašanja upitana je da li njihovi roditelji puše. Zatim je test objavljen u novinama. Rezultat je pokazao snažnu korelaciju između pušenja roditelja i delinkvencije njihove djece. Profesor koji je vodio ovu studiju čak je predložio da se o tome stavi upozorenje na kutijama cigareta. Međutim, postoji niz problema s ovim zaključkom. Prvo, korelacija ne pokazuje koja je od veličina nezavisna. Stoga je sasvim moguće pretpostaviti da je štetna navika roditelja uzrokovana neposlušnošću djece. Drugo, ne može se sa sigurnošću reći da oba problema nisu nastala zbog nekog trećeg faktora. Na primjer, porodice sa niskim primanjima. Vrijedi napomenuti emocionalni aspekt početnih nalaza profesora koji je vodio studiju. Bio je vatreni protivnik pušenja. Stoga ne čudi što je na ovaj način tumačio rezultate svog istraživanja.

zaključci

Pogrešno tumačenje korelacije kao uzročno-posljedične veze između dvije varijable može uzrokovati sramotne greške u istraživanju. Problem je što leži u samoj srži ljudska svijest. Mnogi marketinški trikovi temelje se na ovoj osobini. Razumijevanje razlike između uzroka i posljedice i korelacije omogućava vam da racionalno analizirate informacije u oba Svakodnevni život, i u profesionalnoj karijeri.

NASTAVNI RAD

Tema: Korelaciona analiza

Uvod

1. Analiza korelacije

1.1 Koncept korelacije

1.2 Opća klasifikacija korelacija

1.3 Korelaciona polja i svrha njihove konstrukcije

1.4 Faze korelacione analize

1.5 Koeficijenti korelacije

1.6 Normalizovani Bravais-Pearson koeficijent korelacije

1.7 Spearmanov koeficijent korelacije ranga

1.8 Osnovna svojstva koeficijenata korelacije

1.9 Provjera značajnosti koeficijenata korelacije

1.10 Kritične vrijednosti koeficijenta korelacije para

2. Planiranje multifaktorskog eksperimenta

2.1 Stanje problema

2.2 Određivanje centra plana (osnovni nivo) i nivoa varijacije faktora

2.3 Izgradnja matrice planiranja

2.4 Provjera homogenosti disperzije i ekvivalencije mjerenja u različitim serijama

2.5 Koeficijenti regresijske jednačine

2.6 Varijanca reproduktivnosti

2.7 Provjera značaja koeficijenata regresijske jednačine

2.8 Provjera adekvatnosti jednačine regresije

Zaključak

Bibliografija

UVOD

Eksperimentalno planiranje je matematička i statistička disciplina koja proučava metode racionalne organizacije eksperimentalno istraživanje- od optimalnog izbora faktora koji se proučavaju i utvrđivanja stvarnog eksperimentalnog plana u skladu sa njegovom svrhom do metoda za analizu rezultata. Eksperimentalno planiranje započelo je radovima engleskog statističara R. Fišera (1935), koji je naglasio da racionalno eksperimentalno planiranje ne daje manje značajne dobitke u tačnosti procjena od optimalne obrade rezultata mjerenja. Šezdesetih godina 20. vijeka postojala je moderna teorija planiranje eksperimenta. Njene metode su usko povezane sa teorijom aproksimacije funkcija i matematičkim programiranjem. Izrađeni su optimalni planovi i proučavana su njihova svojstva za široku klasu modela.

Eksperimentalno planiranje je odabir eksperimentalnog plana koji ispunjava određene zahtjeve, skup radnji usmjerenih na razvoj strategije eksperimentiranja (od dobijanja a priori informacija do dobijanja izvodljivog matematičkog modela ili određivanja optimalnih uslova). Ovo je svrsishodna kontrola eksperimenta, sprovedena u uslovima nepotpunog poznavanja mehanizma fenomena koji se proučava.

U procesu mjerenja, naknadne obrade podataka, kao i formalizacije rezultata u obliku matematičkog modela, nastaju greške i gube se dio informacija sadržanih u originalnim podacima. Upotreba metoda eksperimentalnog planiranja omogućava određivanje greške matematičkog modela i procjenu njegove adekvatnosti. Ako se ispostavi da je tačnost modela nedovoljna, tada korištenje metoda eksperimentalnog planiranja omogućava modernizaciju matematički model uz dodatne eksperimente bez gubitka prethodnih informacija i uz minimalne troškove.

Svrha planiranja eksperimenta je pronaći takve uvjete i pravila za izvođenje eksperimenata pod kojima je moguće dobiti pouzdane i pouzdane informacije o objektu uz najmanju količinu rada, kao i predstaviti te informacije u kompaktnom i prikladnom obliku. sa kvantitativnom procjenom tačnosti.

Među glavnim metodama planiranja koje se koriste u različitim fazama studije su:

Planiranje skrining eksperimenta, čije je glavno značenje odabir iz čitavog skupa faktora grupe značajnih faktora koji su predmet daljeg detaljnog proučavanja;

Eksperimentalni dizajn za ANOVA, tj. izrada planova za objekte sa kvalitativnim faktorima;

Planiranje regresijskog eksperimenta koji vam omogućava da dobijete regresijski modeli(polinom i drugi);

Planiranje ekstremnog eksperimenta u kojem je glavni zadatak eksperimentalna optimizacija objekta istraživanja;

Planiranje prilikom proučavanja dinamičkih procesa itd.

Svrha izučavanja discipline je osposobljavanje studenata za proizvodno-tehničke aktivnosti u njihovoj specijalnosti korištenjem metoda teorije planiranja i savremenih informacione tehnologije.

Ciljevi discipline: studij savremenim metodama planiranje, organizovanje i optimizacija naučnih i industrijskih eksperimenata, izvođenje eksperimenata i obrada dobijenih rezultata.

1. ANALIZA KORELACIJE

1.1 Koncept korelacije

Istraživača često zanima kako dva ili velika količina varijable u jednom ili više uzoraka istraživanja. Na primjer, može li visina utjecati na težinu osobe ili krvni tlak može utjecati na kvalitetu proizvoda?

Ova vrsta zavisnosti između varijabli naziva se korelacija ili korelacija. Korelacija je konzistentna promjena dvije karakteristike, koja odražava činjenicu da je varijabilnost jedne karakteristike u skladu sa varijabilnosti druge.

Poznato je, na primjer, da u prosjeku postoji pozitivan odnos između visine ljudi i njihove težine, i to takav da što je visina veća, veća je i težina osobe. Međutim, postoje izuzeci od ovog pravila, kada relativno niski ljudi imaju prekomjernu težinu, i obrnuto, astenični ljudi visokog rasta imaju malu težinu. Razlog ovakvih izuzetaka je taj što je svaki biološki, fiziološki ili psihološki znak određen uticajem mnogih faktora: ekoloških, genetskih, društvenih, ekoloških itd.

Korelacijske veze su probabilističke promjene koje se mogu proučavati samo na reprezentativnim uzorcima korištenjem metoda matematičke statistike. Oba termina - korelacija i zavisnost od korelacije - često se koriste naizmjenično. Zavisnost podrazumeva uticaj, povezanost - bilo koje koordinisane promene koje se mogu objasniti stotinama razloga. Korelacijske veze se ne mogu smatrati dokazom uzročno-posljedične veze, one samo ukazuju na to da su promjene u jednoj osobini obično praćene određenim promjenama u drugoj.

Korelaciona zavisnost - To su promjene koje unose vrijednosti jedne karakteristike u vjerovatnoću pojave različitih vrijednosti druge karakteristike.

Zadatak korelacione analize svodi se na utvrđivanje pravca (pozitivnog ili negativnog) i oblika (linearnog, nelinearnog) odnosa između različitih karakteristika, merenje njegove bliskosti i, na kraju, proveru nivoa značajnosti dobijenih koeficijenata korelacije.

Korelacijske veze se razlikuju po obliku, smjeru i stupnju (snage) .

Oblik korelacijske veze može biti linearan ili krivolinijski. Na primjer, odnos između broja treninga na simulatoru i broja ispravno riješenih problema u kontrolnoj sesiji može biti jednostavan. Na primjer, odnos između nivoa motivacije i efektivnosti zadatka može biti krivolinijski (slika 1). Kako motivacija raste, prvo se povećava efikasnost izvršenja zadatka, a zatim se postiže optimalan nivo motivacije, koji odgovara maksimalna efikasnost dovršavanje zadatka; Dalje povećanje motivacije je praćeno smanjenjem efikasnosti.

Slika 1 – Odnos između efektivnosti rješavanja problema i snage motivacijskih tendencija

U smjeru, korelacijski odnos može biti pozitivan („direktan“) i negativan („inverzan“). Uz pozitivnu linearnu korelaciju, više vrijednosti jedne karakteristike odgovaraju višim vrijednostima druge, a niže vrijednosti jedne karakteristike odgovaraju niskim vrijednostima druge (slika 2). Uz negativnu korelaciju, odnosi su inverzni (slika 3). Sa pozitivnom korelacijom, koeficijent korelacije ima pozitivan predznak, sa negativnom korelacijom ima negativan predznak.

Slika 2 – Direktna korelacija

Slika 3 – Inverzna korelacija


Slika 4 – Nema korelacije

Stepen, jačina ili bliskost korelacije određuje se vrijednošću koeficijenta korelacije. Jačina veze ne zavisi od njenog pravca i određena je apsolutnom vrednošću koeficijenta korelacije.

1.2 Opća klasifikacija korelacija

Ovisno o koeficijentu korelacije razlikuju se sljedeće korelacije:

Jaka ili bliska sa koeficijentom korelacije r>0,70;

Prosjek (na 0,50

Umjereno (u 0.30

Slab (na 0,20

Veoma slaba (na r<0,19).

1.3 Korelaciona polja i svrha njihove konstrukcije

Korelacija se proučava na osnovu eksperimentalnih podataka, a to su izmjerene vrijednosti (x i, y i) dvije karakteristike. Ako ima malo eksperimentalnih podataka, onda je dvodimenzionalna empirijska raspodjela predstavljena kao dvostruki niz vrijednosti x i i y i. Istovremeno, korelaciona zavisnost između karakteristika može se opisati na različite načine. Korespondencija između argumenta i funkcije može se dati tabelom, formulom, grafikonom itd.

Korelaciona analiza, kao i druge statističke metode, temelji se na korištenju vjerojatnosnih modela koji opisuju ponašanje ispitivanih karakteristika u određenoj općoj populaciji iz koje se dobijaju eksperimentalne vrijednosti xi i y i. Prilikom proučavanja korelacije između kvantitativnih karakteristika, čije se vrijednosti mogu precizno izmjeriti u jedinicama metričke skale (metri, sekunde, kilogrami, itd.), vrlo često se usvaja dvodimenzionalni normalno raspoređeni model populacije. Takav model grafički prikazuje odnos između varijabli x i i y i u obliku geometrijske lokacije tačaka u sistemu pravokutnih koordinata. Ovaj grafički odnos se naziva i dijagram raspršenja ili korelacijsko polje.
Ovaj model dvodimenzionalne normalne distribucije (korelacijsko polje) nam omogućava da damo jasnu grafičku interpretaciju koeficijenta korelacije, jer distribucija ukupno zavisi od pet parametara: μ x, μ y – prosječne vrijednosti (matematička očekivanja); σ x ,σ y – standardne devijacije slučajnih varijabli X i Y i p – koeficijent korelacije, koji je mjera odnosa između slučajnih varijabli X i Y.
Ako je p = 0, tada se vrijednosti x i , y i dobivene iz dvodimenzionalne normalne populacije nalaze na grafu u koordinatama x, y unutar područja ograničenog krugom (slika 5, a). U ovom slučaju ne postoji korelacija između slučajnih varijabli X i Y i one se nazivaju nekoreliranim. Za dvodimenzionalnu normalnu distribuciju, nekorelacija istovremeno znači nezavisnost slučajnih varijabli X i Y.

» Statistika

Statistika i obrada podataka u psihologiji
(nastavak)

Korelaciona analiza

Prilikom studiranja korelacije pokušava utvrditi postoji li veza između dva indikatora u istom uzorku (na primjer, između visine i težine djece ili između nivoa IQ i školski uspjeh) ili između dva različita uzorka (na primjer, kada se porede parovi blizanaca), i ako taj odnos postoji, da li je povećanje jednog pokazatelja praćeno povećanjem (pozitivna korelacija) ili smanjenjem (negativna korelacija) drugi.

Drugim riječima, korelacijska analiza pomaže da se utvrdi da li je moguće predvidjeti moguće vrijednosti jednog indikatora, znajući vrijednost drugog.

Do sada, kada smo analizirali rezultate našeg iskustva u proučavanju efekata marihuane, namjerno smo zanemarivali takav pokazatelj kao što je vrijeme reakcije. U međuvremenu, bilo bi zanimljivo provjeriti postoji li veza između djelotvornosti reakcija i njihove brzine. To bi, na primjer, omogućilo da se tvrdi da što je osoba sporija, to će njene akcije biti tačnije i efikasnije i obrnuto.

U tu svrhu mogu se koristiti dvije različite metode: parametarska metoda izračunavanja Bravais-Pearsonovog koeficijenta (r) i izračunavanje Spearmanovog koeficijenta rang korelacije (r s), koji se primjenjuje na redne podatke, tj. je neparametarski. Međutim, hajde da prvo shvatimo šta je koeficijent korelacije.

Koeficijent korelacije

Koeficijent korelacije je vrijednost koja može varirati od +1 do -1. U slučaju potpune pozitivne korelacije, ovaj koeficijent je jednak plus 1, a u slučaju potpuno negativne korelacije je minus 1. Na grafu to odgovara pravoj liniji koja prolazi kroz točke presjeka vrijednosti svakog para podataka:

Ako se ove tačke ne postavljaju u pravu liniju, već formiraju „oblak“, koeficijent korelacije u apsolutnoj vrijednosti postaje manji od jedan i, kako se ovaj oblak zaokružuje, približava se nuli:

Ako je koeficijent korelacije 0, obje varijable su potpuno nezavisne jedna od druge.

U humanističkim naukama korelacija se smatra jakom ako je njen koeficijent veći od 0,60; ako prelazi 0,90, tada se korelacija smatra veoma jakom. Međutim, da bi se mogli izvući zaključci o odnosima između varijabli, veličina uzorka je od velike važnosti: što je uzorak veći, to je pouzdanija vrijednost dobijenog koeficijenta korelacije. Postoje tablice s kritičnim vrijednostima koeficijenta korelacije Bravais-Pearson i Spearman za različite brojeve stupnjeva slobode (jednako je broju parova minus 2, tj. n- 2). Samo ako su koeficijenti korelacije veći od ovih kritičnih vrijednosti mogu se smatrati pouzdanim. Dakle, da bi koeficijent korelacije od 0,70 bio pouzdan, u analizu se mora uzeti najmanje 8 parova podataka ( h =n-2=6) pri izračunavanju r (vidi tabelu 4 u dodatku) i 7 parova podataka (h = n-2= 5) prilikom izračunavanja r s (tabela 5 u prilogu).

Još jednom želim da naglasim da je suština ova dva koeficijenta nešto drugačija. Negativan koeficijent r ukazuje na to da učinak ima tendenciju da bude veći što je vrijeme reakcije kraće, dok je izračunavanje koeficijenta r ​​s zahtijevalo provjeru da li brži subjekti uvijek tačnije odgovaraju, a sporiji manje tačnije.

Bravais-Pearson koeficijent korelacije (r) - Ovo je parametarski indikator za čije se izračunavanje upoređuju prosječna i standardna devijacija rezultata dva mjerenja. U ovom slučaju koriste formulu (može izgledati drugačije za različite autore):

gdje je Σ XY- zbir proizvoda podataka iz svakog para;
n-broj parova;
X - prosjek za datu varijablu X;
Y - prosjek za datu varijablu Y
S x -
standardna devijacija za distribuciju X;
S y -
standardna devijacija za distribuciju at

Spearmanov koeficijent korelacije ranga ( r s ) - ovo je neparametarski indikator, uz pomoć kojeg pokušavaju identificirati odnos između rangova odgovarajućih veličina u dvije serije mjerenja.

Ovaj koeficijent je lakše izračunati, ali rezultati su manje tačni od korištenja r. To je zbog činjenice da se pri izračunavanju Spearmanovog koeficijenta koristi redoslijed podataka, a ne njihove kvantitativne karakteristike i intervali između klasa.

Činjenica je da kada se koriste Spearmanov koeficijent rang korelacije (r s), oni samo provjeravaju da li će rangiranje podataka za bilo koji uzorak biti isto kao i kod niza drugih podataka za ovaj uzorak, parno vezanih za prve (za na primjer, da li će oni biti isti „rangirani“ učenici kada polažu i psihologiju i matematiku, ili čak sa dva različita nastavnika psihologije?). Ako je koeficijent blizu +1, to znači da su oba niza praktično identična, a ako je ovaj koeficijent blizu -1, možemo govoriti o potpunom inverznom odnosu.

Koeficijent r s izračunato po formuli

Gdje d- razlika između rangova konjugiranih vrijednosti karakteristika (bez obzira na njegov znak) i - broj parova.

Obično se ovaj neparametarski test koristi u slučajevima kada je potrebno izvući neke zaključke ne toliko o tome intervalima između podataka, koliko o njima činovi, a takođe i kada su krive distribucije previše nagnute da bi se omogućilo korištenje parametarskih kriterija kao što je koeficijent r (u ovim slučajevima može biti potrebno pretvoriti kvantitativne podatke u redne podatke).

Sažetak

Dakle, pogledali smo različite parametarske i neparametarske statističke metode koje se koriste u psihologiji. Naš pregled je bio vrlo površan, a glavni zadatak mu je bio da čitatelju natjera da shvati da statistika nije toliko strašna kao što se čini i da zahtijeva uglavnom zdrav razum. Podsjećamo da su podaci o “iskustvu” koje smo ovdje obradili fiktivni i ne mogu poslužiti kao osnova za bilo kakve zaključke. Međutim, takav eksperiment bi zaista vrijedio provesti. Budući da je za ovaj eksperiment odabrana čisto klasična tehnika, ista statistička analiza mogla bi se koristiti u mnogim različitim eksperimentima. U svakom slučaju, čini nam se da smo zacrtali neke glavne pravce koji bi mogli biti korisni onima koji ne znaju odakle da krenu sa statističkom analizom dobijenih rezultata.

Književnost

  1. Godefroy J.Šta je psihologija. - M., 1992.
  2. Chatillon G., 1977. Statistique en Sciences humaines, Trois-Rivieres, Ed. SMG.
  3. Gilbert N.. 1978. Statistiques, Montreal, Ed. HRW.
  4. Moroney M. J., 1970. Comprendre la statistique, Verviers, Gerard et Cie.
  5. Siegel S., 1956. Non-parametric Statistic, New York, MacGraw-Hill Book Co.

Tables app

Bilješke 1) Za velike uzorke ili nivoe značajnosti manje od 0,05, trebalo bi da pogledate tabele u udžbenicima statistike.

2) Tabele vrijednosti za druge neparametarske kriterije mogu se naći u posebnim priručnicima (vidi bibliografiju).

Tabela 1. Vrijednosti kriterija t Studentski test
h 0,05
1 6,31
2 2,92
3 2,35
4 2,13
5 2,02
6 1,94
7 1,90
8 1,86
9 1,83
10 1,81
11 1,80
12 1,78
13 1,77
14 1,76
15 1,75
16 1,75
17 1,74
18 1,73
19 1,73
20 1,73
21 1,72
22 1,72
23 1,71
24 1,71
25 1,71
26 1,71
27 1,70
28 1,70
29 1,70
30 1,70
40 1,68
¥ 1,65
Tabela 2. Vrijednosti kriterija χ 2
h 0,05
1 3,84
2 5,99
3 7,81
4 9,49
5 11,1
6 12,6
7 14,1
8 15,5
9 16,9
10 18,3
Tabela 3. Značajne Z vrijednosti
R Z
0,05 1,64
0,01 2,33
Tabela 4. Pouzdane (kritične) r vrijednosti
h =(N-2) p= 0,05 (5%)
3 0,88
4 0,81
5 0,75
6 0,71
7 0,67
8 0,63
9 0,60
10 0,58
11 0.55
12 0,53
13 0,51
14 0,50
15 0,48
16 0,47
17 0,46
18 0,44
19 0,43
20 0,42
Tabela 5. Pouzdane (kritične) vrijednosti r s
h =(N-2) p = 0,05
2 1,000
3 0,900
4 0,829
5 0,714
6 0,643
7 0,600
8 0,564
10 0,506
12 0,456
14 0,425
16 0,399
18 0,377
20 0,359
22 0,343
24 0,329
26 0,317
28 0,306

Kada proučava javno zdravstvo i zdravstvenu zaštitu u naučne i praktične svrhe, istraživač često mora da izvrši statističku analizu odnosa između faktora i karakteristika performansi statističke populacije (uzročno-posledična veza) ili da utvrdi zavisnost paralelnih promena nekoliko karakteristika ove populacije. na nekoj trećoj vrijednosti (o njihovoj zajedničkoj stvari). Neophodno je biti u stanju proučiti karakteristike ove veze, odrediti njenu veličinu i smjer, kao i procijeniti njenu pouzdanost. U tu svrhu koriste se metode korelacije.

  1. Vrste ispoljavanja kvantitativnih odnosa između karakteristika
    • funkcionalna veza
    • korelacione veze
  2. Definicije funkcionalne i korelacijske veze

    Funkcionalna veza- ova vrsta odnosa između dvije karakteristike kada svaka vrijednost jedne od njih odgovara strogo definiranoj vrijednosti druge (površina kruga ovisi o polumjeru kruga, itd.). Funkcionalna povezanost je karakteristična za fizičke i matematičke procese.

    Korelacija- takav odnos u kojem svaka specifična vrijednost jedne karakteristike odgovara nekoliko vrijednosti druge karakteristike međusobno povezane s njom (odnos između visine i težine osobe; odnos između tjelesne temperature i brzine pulsa, itd.). Korelacija je tipična za medicinske i biološke procese.

  3. Praktični značaj uspostavljanja korelacione veze. Identifikacija uzročno-posljedičnih veza između faktorskih i rezultirajućih karakteristika (prilikom procjene fizičkog razvoja, utvrđivanja odnosa između uslova rada, uslova života i zdravstvenog stanja, prilikom utvrđivanja zavisnosti učestalosti oboljevanja od starosti, dužine radnog staža, prisutnost profesionalnih opasnosti itd.)

    Zavisnost paralelnih promjena nekoliko karakteristika od neke treće vrijednosti. Na primjer, pod utjecajem visoke temperature u radionici dolazi do promjena krvnog tlaka, viskoziteta krvi, brzine pulsa itd.

  4. Vrijednost koja karakterizira smjer i snagu odnosa između karakteristika. Koeficijent korelacije, koji u jednom broju daje predstavu o smjeru i snazi ​​veze između znakova (fenomena), granice njegovih fluktuacija od 0 do ± 1
  5. Metode prikazivanja korelacija
    • graf (grafikon raspršivanja)
    • koeficijent korelacije
  6. Smjer korelacije
    • ravno
    • obrnuto
  7. Jačina korelacije
    • jaka: ±0,7 do ±1
    • prosjek: ±0,3 do ±0,699
    • slaba: 0 do ±0,299
  8. Metode za određivanje koeficijenta korelacije i formule
    • metoda kvadrata (Pearsonova metoda)
    • metoda rangiranja (Spearman metoda)
  9. Metodološki zahtjevi za korištenje koeficijenta korelacije
    • mjerenje odnosa moguće je samo u kvalitativno homogenim populacijama (na primjer, mjerenje odnosa između visine i težine u populacijama homogenim po spolu i starosti)
    • proračun se može izvršiti korištenjem apsolutnih ili izvedenih vrijednosti
    • za izračunavanje koeficijenta korelacije koriste se negrupisani varijacioni nizovi (ovaj zahtjev vrijedi samo kada se koeficijent korelacije izračunava metodom kvadrata)
    • broj posmatranja najmanje 30
  10. Preporuke za korištenje metode korelacije rangova (Spearmanova metoda)
    • kada nema potrebe da se precizno utvrdi jačina veze, ali su dovoljni približni podaci
    • kada su karakteristike predstavljene ne samo kvantitativnim, već i atributivnim vrijednostima
    • kada distributivni niz karakteristika ima otvorene opcije (na primjer, radno iskustvo do 1 godine, itd.)
  11. Preporuke za korištenje metode kvadrata (Pearsonova metoda)
    • kada je potrebno tačno određivanje jačine veze između karakteristika
    • kada znakovi imaju samo kvantitativni izraz
  12. Metodologija i postupak za izračunavanje koeficijenta korelacije

    1) Metoda kvadrata

    2) Metod rangiranja

  13. Šema za procjenu korelacijske veze pomoću koeficijenta korelacije
  14. Proračun greške koeficijenta korelacije
  15. Procjena pouzdanosti koeficijenta korelacije dobivenog metodom rang korelacije i metodom kvadrata

    Metoda 1
    Pouzdanost se određuje formulom:

    Kriterijum t se vrednuje korišćenjem tabele t vrednosti, uzimajući u obzir broj stepena slobode (n - 2), gde je n broj uparenih opcija. Kriterijum t mora biti jednak ili veći od tabelarnog, što odgovara vjerovatnoći p ≥99%.

    Metoda 2
    Pouzdanost se procjenjuje korištenjem posebne tablice standardnih koeficijenata korelacije. U ovom slučaju, koeficijent korelacije se smatra pouzdanim kada je sa određenim brojem stupnjeva slobode (n - 2) jednak ili veći od tabelarnog, što odgovara stepenu predviđanja bez greške p ≥95% .

koristiti metodu kvadrata

vježba: izračunati koeficijent korelacije, odrediti smjer i jačinu veze između količine kalcija u vodi i tvrdoće vode, ako su poznati sljedeći podaci (tabela 1). Procijenite pouzdanost veze. Izvucite zaključak.

Tabela 1

Opravdanost izbora metode. Za rješavanje problema odabrana je metoda kvadrata (Pearson), jer svaki od znakova (tvrdoća vode i količina kalcijuma) ima numerički izraz; nema otvorene opcije.

Rješenje.
Redoslijed proračuna je opisan u tekstu, rezultati su prikazani u tabeli. Nakon što ste konstruisali niz uparenih uporedivih karakteristika, označite ih sa x (tvrdoća vode u stepenima) i sa y (količina kalcijuma u vodi u mg/l).

Tvrdoća vode
(u stepenima)
Količina kalcijuma u vodi
(u mg/l)
d x d y d x x d y d x 2 d y 2
4
8
11
27
34
37
28
56
77
191
241
262
-16
-12
-9
+7
+14
+16
-114
-86
-66
+48
+98
+120
1824
1032
594
336
1372
1920
256
144
81
49
196
256
12996
7396
4356
2304
9604
14400
M x =Σ x / n M y =Σ y / n Σ d x x d y =7078 Σ d x 2 =982 Σ d y 2 =51056
M x =120/6=20 M y =852/6=142
  1. Odredite prosječne vrijednosti M x u opciji reda "x" i M y u opciji reda "y" koristeći formule:
    M x = Σh/n (kolona 1) i
    M y = Σu/n (kolona 2)
  2. Pronađite odstupanje (d x i d y) svake opcije od izračunatog prosjeka u seriji “x” i u seriji “y”
    d x = x - M x (kolona 3) i d y = y - M y (kolona 4).
  3. Pronađite proizvod odstupanja d x x d y i zbrojite ih: Σ d x x d y (kolona 5)
  4. Kvadrirajte svako odstupanje d x i d y i zbrojite njihove vrijednosti duž "x" serije i serije "y": Σ d x 2 = 982 (kolona 6) i Σ d y 2 = 51056 (kolona 7).
  5. Odrediti proizvod Σ d x 2 x Σ d y 2 i izvući kvadratni korijen iz ovog proizvoda
  6. Rezultirajuće vrijednosti Σ (d x x d y) i √ (Σd x 2 x Σd y 2) zamijeniti u formulu za izračunavanje koeficijenta korelacije:
  7. Odredite pouzdanost koeficijenta korelacije:
    1. metoda. Odredite grešku koeficijenta korelacije (mr xy) i t kriterija koristeći formule:

    Kriterijum t = 14,1, što odgovara vjerovatnoći prognoze bez greške p > 99,9%.

    2. metoda. Pouzdanost koeficijenta korelacije procjenjuje se korištenjem tabele “Standardni koeficijenti korelacije” (vidi Dodatak 1). Sa brojem stepeni slobode (n - 2)=6 - 2=4, naš izračunati koeficijent korelacije r xu = + 0,99 je veći od tabelarnog (r tabela = + 0,917 pri p = 99%).

    Zaključak.Što je više kalcijuma u vodi, to je ona tvrđa (veza direktno, snažno i autentično: r xy = + 0,99, p > 99,9%).

    koristiti metodu rangiranja

    vježba: Metodom rangiranja utvrditi smjer i jačinu veze između godina radnog staža i učestalosti ozljeda ako se dobiju sljedeći podaci:

    Opravdanje za odabir metode: Za rješavanje problema može se odabrati samo metod korelacije ranga, jer Prvi red atributa "radno iskustvo u godinama" ima otvorene opcije (radno iskustvo do 1 godine i 7 ili više godina), što ne dozvoljava upotrebu preciznije metode - metode kvadrata - za uspostavljanje veze između upoređenih karakteristika.

    Rješenje. Redoslijed proračuna je prikazan u tekstu, rezultati su prikazani u tabeli. 2.

    tabela 2

    Radno iskustvo u godinama Broj povreda Redni brojevi (redovi) Razlika u rangu Razlika rangova na kvadrat
    X Y d(x-y) d 2
    Do 1 godine 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,25
    7 ili više 6 5 1 +4 16
    Σ d 2 = 38,5

    Standardni koeficijenti korelacije koji se smatraju pouzdanim (prema L.S. Kaminskyju)

    Broj stepeni slobode - 2 Nivo vjerovatnoće p (%)
    95% 98% 99%
    1 0,997 0,999 0,999
    2 0,950 0,980 0,990
    3 0,878 0,934 0,959
    4 0,811 0,882 0,917
    5 0,754 0,833 0,874
    6 0,707 0,789 0,834
    7 0,666 0,750 0,798
    8 0,632 0,716 0,765
    9 0,602 0,885 0,735
    10 0,576 0,858 0,708
    11 0,553 0,634 0,684
    12 0,532 0,612 0,661
    13 0,514 0,592 0,641
    14 0,497 0,574 0,623
    15 0,482 0,558 0,606
    16 0,468 0,542 0,590
    17 0,456 0,528 0,575
    18 0,444 0,516 0,561
    19 0,433 0,503 0,549
    20 0,423 0,492 0,537
    25 0,381 0,445 0,487
    30 0,349 0,409 0,449

    1. Vlasov V.V. Epidemiologija. - M.: GEOTAR-MED, 2004. - 464 str.
    2. Lisitsyn Yu.P. Javno zdravstvo i zdravstvena zaštita. Udžbenik za univerzitete. - M.: GEOTAR-MED, 2007. - 512 str.
    3. Medic V.A., Yuryev V.K. Tok predavanja o javnom zdravlju i zdravstvu: Dio 1. Javno zdravlje. - M.: Medicina, 2003. - 368 str.
    4. Minyaev V.A., Vishnyakov N.I. i dr. Socijalna medicina i organizacija zdravstvene zaštite (Priručnik u 2 toma). - Sankt Peterburg, 1998. -528 str.
    5. Kučerenko V.Z., Agarkov N.M. i dr. Organizacija socijalne higijene i zdravstvene zaštite (Tutorial) - Moskva, 2000. - 432 str.
    6. S. Glanz. Medicinska i biološka statistika. Prevod sa engleskog - M., Praktika, 1998. - 459 str.

Prilikom studiranja korelacije pokušava utvrditi postoji li veza između dva indikatora u istom uzorku (na primjer, između visine i težine djece ili između nivoa IQ i školski uspjeh) ili između dva različita uzorka (na primjer, kada se porede parovi blizanaca), i ako taj odnos postoji, da li je povećanje jednog pokazatelja praćeno povećanjem (pozitivna korelacija) ili smanjenjem (negativna korelacija) drugi.

Drugim riječima, korelacijska analiza pomaže da se utvrdi da li je moguće predvidjeti moguće vrijednosti jednog indikatora, znajući vrijednost drugog.

Do sada, kada smo analizirali rezultate našeg iskustva u proučavanju efekata marihuane, namjerno smo zanemarivali takav pokazatelj kao što je vrijeme reakcije. U međuvremenu, bilo bi zanimljivo provjeriti postoji li veza između djelotvornosti reakcija i njihove brzine. To bi, na primjer, omogućilo da se tvrdi da što je osoba sporija, to će njene akcije biti tačnije i efikasnije i obrnuto.

U tu svrhu mogu se koristiti dvije različite metode: parametarska metoda za izračunavanje Bravais-Pearsonovog koeficijenta (r) i izračunavanje koeficijenta korelacije Spearmanovog ranga (r s ), koji se odnosi na redne podatke, tj. nije parametarski. Međutim, hajde da prvo shvatimo šta je koeficijent korelacije.

Koeficijent korelacije

Koeficijent korelacije je vrijednost koja može varirati od -1 do 1. U slučaju potpune pozitivne korelacije ovaj koeficijent je plus 1, au slučaju potpuno negativne korelacije minus 1. Na grafikonu je ovo odgovara pravoj liniji koja prolazi kroz tačke presjeka vrijednosti svakog para podataka:

Varijabilna

Ako se ove tačke ne postavljaju u pravu liniju, već formiraju „oblak“, koeficijent korelacije u apsolutnoj vrijednosti postaje manji od jedan i, kako se ovaj oblak zaokružuje, približava se nuli:

Ako je koeficijent korelacije 0, obje varijable su potpuno nezavisne jedna od druge.

U humanističkim naukama korelacija se smatra jakom ako je njen koeficijent veći od 0,60; ako prelazi 0,90, tada se korelacija smatra veoma jakom. Međutim, da bi se mogli izvući zaključci o odnosima između varijabli, veličina uzorka je od velike važnosti: što je uzorak veći, to je pouzdanija vrijednost dobijenog koeficijenta korelacije. Postoje tablice s kritičnim vrijednostima koeficijenta korelacije Bravais-Pearson i Spearman za različite brojeve stupnjeva slobode (jednako je broju parova minus 2, tj. n-2). Samo ako su koeficijenti korelacije veći od ovih kritičnih vrijednosti mogu se smatrati pouzdanim. Dakle, da bi koeficijent korelacije od 0,70 bio pouzdan, u analizu se mora uzeti najmanje 8 parova podataka ( = P - 2 = 6) prilikom obračuna r(Tabela B.4) i 7 parova podataka (= n - 2 = 5) prilikom izračunavanja r s (Tabela 5 u Dodatku B. 5).

Bravais–Pearsonov koeficijent

Za izračunavanje ovog koeficijenta koristite sljedeću formulu (može izgledati drugačije za različite autore):

gdje je  XY - zbir proizvoda podataka iz svakog para;

n - broj parova;

- prosjek za datu varijablu X;

Prosjek za varijabilne podatke Y;

S X - x;

s Y - standardna devijacija za distribuciju u.

Sada možemo koristiti ovaj koeficijent da odredimo postoji li veza između vremena reakcije ispitanika i efikasnosti njihovih akcija. Uzmimo, na primjer, nivo pozadine kontrolne grupe.

n= 15  15,8  13,4 = 3175,8;

(n 1)S x S y = 14  3,07  2,29 = 98,42;

r =

Negativan koeficijent korelacije može značiti da što je duže vrijeme reakcije, to su performanse niže. Međutim, njegova vrijednost je premala da bismo mogli govoriti o pouzdanoj vezi između ove dvije varijable.

nXY=………

(n- 1)S X S Y = ……

Kakav zaključak se može izvući iz ovih rezultata? Ako mislite da postoji veza između varijabli, da li je direktna ili inverzna? Da li je pouzdan [vidi sto 4 (uz dodatak B. 5) sa kritičnim vrijednostima r]?

Spearmanov koeficijent korelacije rangar s

Ovaj koeficijent je lakše izračunati, ali su rezultati manje precizni nego kada se koristi r. To je zbog činjenice da se pri izračunavanju Spearmanovog koeficijenta koristi redoslijed podataka, a ne njihove kvantitativne karakteristike i intervali između klasa.

Poenta je da kada se koristi koeficijent korelacije ranga Spearman(r s ) oni samo provjeravaju da li će rangiranje podataka za bilo koji uzorak biti isto kao i kod niza drugih podataka za ovaj uzorak, u paru vezanih za prvi (na primjer, hoće li učenici biti jednako "rangirani" kada polažu i psihologiju i matematiku, ili čak sa dva različita nastavnika psihologije?). Ako je koeficijent blizu + 1, to znači da su oba niza praktično identična, a ako je ovaj koeficijent blizu - 1, možemo govoriti o potpunom inverznom odnosu.

Koeficijent r s izračunato po formuli

Gdje d- razlika između rangova vrijednosti konjugiranih karakteristika (bez obzira na njegov znak), i n-broj parova

Obično se ovaj neparametarski test koristi u slučajevima kada je potrebno izvući neke zaključke ne toliko o tome intervalima između podataka, koliko o njima činovi, kao i kada su krive distribucije previše asimetrične i ne dozvoljavaju korištenje parametarskih kriterija kao što je koeficijent r(u tim slučajevima može biti potrebno konvertovati kvantitativne podatke u redne podatke).

Budući da je to slučaj sa distribucijom vrijednosti efikasnosti i vremena reakcije u eksperimentalnoj grupi nakon izlaganja, možete ponoviti proračune koje ste već uradili za ovu grupu, samo sada ne za koeficijent r, i za indikator r s . Ovo će vam omogućiti da vidite koliko se to dvoje razlikuje*.

*To treba imati na umu

1) za broj pogodaka rang 1 odgovara najvećoj, a 15 najnižoj izvedbi, dok za vrijeme reakcije rang 1 odgovara najkraćem vremenu, a 15 najdužem;

2) ex aequo podaci dobijaju srednji rang.

Dakle, kao iu slučaju koeficijenta r, dobijen je pozitivan, iako nepouzdan rezultat. Koji od ova dva rezultata je vjerodostojniji: r =-0,48 ili r s = +0,24? Ovo pitanje se može postaviti samo ako su rezultati pouzdani.

Još jednom želim da naglasim da je suština ova dva koeficijenta nešto drugačija. Negativan koeficijent r ukazuje da je efikasnost često veća, što je vreme reakcije kraće, dok pri izračunavanju koeficijenta r s bilo je potrebno provjeriti da li brži subjekti uvijek tačnije odgovaraju, a sporiji manje tačnije.

Pošto je u eksperimentalnoj grupi nakon izlaganja dobijen koeficijent r s , jednak 0,24, sličan trend ovdje očigledno nije vidljiv. Pokušajte sami razumjeti podatke za kontrolnu grupu nakon intervencije, znajući da  d 2 = 122,5:

; Je li pouzdan?

Koji je vaš zaključak?……………………………………………………………………………………………………………………………

…………………………………………………………………………………………………………………….

Dakle, pogledali smo različite parametarske i neparametarske statističke metode koje se koriste u psihologiji. Naš pregled je bio vrlo površan, a glavni zadatak mu je bio da čitatelju natjera da shvati da statistika nije toliko strašna kao što se čini i da zahtijeva uglavnom zdrav razum. Podsjećamo da su podaci o “iskustvu” koje smo ovdje obradili fiktivni i ne mogu poslužiti kao osnova za bilo kakve zaključke. Međutim, takav eksperiment bi zaista vrijedio provesti. Budući da je za ovaj eksperiment odabrana čisto klasična tehnika, ista statistička analiza mogla bi se koristiti u mnogim različitim eksperimentima. U svakom slučaju, čini nam se da smo zacrtali neke glavne pravce koji bi mogli biti korisni onima koji ne znaju odakle da krenu sa statističkom analizom dobijenih rezultata.

Postoje tri glavne grane statistike: deskriptivna statistika, induktivna statistika i analiza korelacije.

mob_info