Korrelaatiotutkimus
korrelaatio tarkoittaa, että kahden tai useamman muuttujan välillä on yhteys (kuten jäätelön kulutus ja rikollisuus), mutta tämä suhde ei välttämättä merkitse syytä ja seurausta. Kun kaksi muuttujaa korreloidaan, se tarkoittaa yksinkertaisesti sitä, että kun yksi muuttuja muuttuu, myös toinen muuttuu. Voimme mitata korrelaatiota laskemalla tilaston, joka tunnetaan korrelaatiokertoimena. Korrelaatiokerroin on luku -1: stä +1: een, joka ilmaisee muuttujien välisen suhteen vahvuuden ja suunnan. Korrelaatiokerroin esitetään yleensä R-kirjaimella.
korrelaatiokertoimen lukuosuus kertoo suhteen vahvuuden. Mitä lähempänä luku on lukua 1 (oli se sitten negatiivinen tai positiivinen), sitä voimakkaammin muuttujat liittyvät toisiinsa, ja sitä ennustettavammin yhden muuttujan muutokset muuttuvat toisen muuttujan muuttuessa. Mitä lähempänä luku on Nollaa, sitä heikompi suhde ja sitä vähemmän ennustettavia muuttujien väliset suhteet ovat. Esimerkiksi korrelaatiokerroin 0,9 kertoo paljon voimakkaammasta suhteesta kuin korrelaatiokerroin 0,3. Jos muuttujat eivät liity toisiinsa lainkaan, korrelaatiokerroin on 0. Yllä oleva esimerkki jäätelöstä ja rikollisuudesta on esimerkki kahdesta muuttujasta, joilla ei voisi olettaa olevan mitään suhdetta toisiinsa.
korrelaatiokertoimen merkki—positiivinen tai negatiivinen—ilmaisee suhteen suunnan (Kuva 1). Positiivinen korrelaatio tarkoittaa sitä, että muuttujat liikkuvat samaan suuntaan. Toisin sanoen se tarkoittaa, että kun yksi muuttuja kasvaa, niin kasvaa myös toinen, ja päinvastoin, kun yksi muuttuja pienenee, niin myös toinen. Negatiivinen korrelaatio tarkoittaa sitä, että muuttujat liikkuvat vastakkaisiin suuntiin. Jos kaksi muuttujaa korreloi negatiivisesti, yhden muuttujan väheneminen liittyy toisen muuttujan kasvuun ja päinvastoin.
esimerkki jäätelö-ja rikosluvuista on positiivinen korrelaatio, koska molemmat muuttujat kasvavat, kun lämpötilat ovat lämpimämpiä. Muita esimerkkejä positiivisista korrelaatioista ovat yksilön pituuden ja painon suhde tai henkilön iän ja ryppyjen määrän suhde. Voisi olettaa, että jonkun päivällä esiintyvän väsymyksen ja edellisenä yönä nukkuneiden tuntien määrän välillä on negatiivinen korrelaatio: unen määrä vähenee väsymyksen tunteiden lisääntyessä. Reaalimaailman esimerkissä negatiivisesta korrelaatiosta Minnesotan yliopiston opiskelijatutkijat havaitsivat heikon negatiivisen korrelaation (r = -0,29) alle 5 tunnin yöunet saaneiden opiskelijoiden keskimääräisten viikkopäivien ja heidän keskiarvonsa (Lowry, Dean, & Manders, 2010) välillä. Muista, että negatiivinen korrelaatio ei ole sama kuin ei korrelaatiota. Todennäköisesti emme esimerkiksi löytäisi mitään korrelaatiota yöunien ja kengän koon välillä.
kuten aiemmin mainittiin, korrelaatioilla on ennustava arvo. Kuvittele, että olet suuren yliopiston hakukomiteassa. Käsiteltävänäsi on valtava määrä hakemuksia, mutta niihin mahtuu vain pieni osa hakijapoolista. Miten voisit päättää, kuka tulisi ottaa sisään? Voit yrittää korreloida nykyisen opiskelijoiden college GPA kanssa tulokset standardoituja testejä, kuten SAT tai ACT. Tarkkailemalla mitkä korrelaatiot olivat vahvimpia nykyisten opiskelijoiden, voit käyttää tätä tietoa ennustaa suhteellinen menestys niille opiskelijoille, jotka ovat hakeneet ottamista yliopistoon.
kuva 1. Scatterplots on graafinen näkemys korrelaatioiden voimakkuudesta ja suunnasta. Mitä vahvempi korrelaatio, sitä lähempänä datapisteet ovat suoraa viivaa. Näistä esimerkeistä näemme, että on (a) positiivinen korrelaatio painon ja pituuden välillä, (b) negatiivinen korrelaatio väsymyksen ja unituntien välillä ja (c) ei korrelaatiota kengän koon ja unituntien välillä.
kokeile sitä
korrelaatio ei viittaa syy-yhteyteen
Korrelaatiotutkimus on hyödyllinen, koska se mahdollistaa meille löytää vahvuus ja suunta suhteita, jotka ovat olemassa kahden muuttujan välillä. Korrelaatio on kuitenkin vähäistä, koska suhteen olemassaolon toteaminen ei kerro paljoakaan syystä ja seurauksesta. Vaikka muuttujat ovat joskus korreloivat, koska yksi aiheuttaa toisen, se voi myös olla, että jokin muu tekijä, sekoittava muuttuja, todella aiheuttaa systemaattisen liikkeen meidän muuttujia kiinnostavia. Edellä mainitussa jäätelö/rikosluku-esimerkissä lämpötila on hämmentävä muuttuja, joka voi selittää näiden kahden muuttujan välisen suhteen.
silloinkin, kun emme voi osoittaa selkeitä sekoittavia muuttujia, meidän ei pidä olettaa, että kahden muuttujan välinen korrelaatio merkitsee sitä, että yksi muuttuja aiheuttaa muutoksia toisessa. Tämä voi olla turhauttavaa, kun syy-seuraus-suhde näyttää selkeältä ja intuitiiviselta. Muistele keskustelujamme American Cancer Societyn tutkimuksista ja siitä, miten heidän tutkimushankkeensa olivat ensimmäisiä todisteita tupakoinnin ja syövän välisestä yhteydestä. Vaikuttaa järkevältä olettaa, että tupakointi aiheuttaa syöpää, mutta jos rajoittuisimme korrelaatiotutkimukseen, ylittäisimme rajamme tekemällä tämän olettamuksen.
valitettavasti ihmiset virheellisesti esittävät väitteitä syy-yhteydestä korrelaatioiden funktiona koko ajan. Tällaiset väitteet ovat erityisen yleisiä mainoksissa ja uutisissa. Esimerkiksi tuoreessa tutkimuksessa havaittiin, että säännöllisesti viljaa syövät ihmiset saavuttavat terveempiä painoja kuin ne, jotka syövät viljaa harvoin (Frantzen, Treviño, Echon, Garcia-Dominic, & DiMarco, 2013; Barton et al., 2005). Arvatkaa, miten viljayhtiöt raportoivat löydöstä. Onko syöminen viljan todella aiheuttaa yksilön ylläpitää terveellistä painoa, vai onko olemassa muita mahdollisia selityksiä, kuten joku terve paino on todennäköisemmin säännöllisesti syödä terveellistä aamiaista kuin joku, joka on ylipainoinen tai joku, joka välttää aterioita yrittää ruokavalio (kuva 2)? Vaikka korrelaatiotutkimus on korvaamatonta muuttujien välisten suhteiden tunnistamisessa, merkittävä rajoitus on kyvyttömyys määrittää syy-yhteys. Psykologit haluavat antaa lausuntoja syystä ja seurauksesta, mutta ainoa tapa tehdä se on tehdä koe, jossa vastataan tutkimuskysymykseen. Seuraavassa jaksossa kuvataan, miten tieteelliset kokeet sisältävät menetelmiä, jotka poistavat tai ohjaavat vaihtoehtoisia selityksiä, joiden avulla tutkijat voivat tutkia, miten muutokset yhdessä muuttujassa aiheuttavat muutoksia toisessa muuttujassa.
kokeile sitä
Katso tämä pätkä Freakonomiikasta esimerkkinä siitä, miten korrelaatio ei osoita syy-yhteyttä.
Illusoriset korrelaatiot
kiusaus antaa korrelaatiotutkimukseen perustuvia virheellisiä syy-seurausilmoituksia ei ole ainoa tapa tulkita tietoja väärin. Meillä on myös taipumus erehtyä kuvitteellisista korrelaatioista, erityisesti epäjärjestelmällisistä havainnoista. Illusorisia korrelaatioita eli vääriä korrelaatioita syntyy, kun ihmiset uskovat, että kahden asian välillä on suhteita, kun tällaista suhdetta ei ole. Yksi tunnettu kuvitteellinen korrelaatio on kuun vaiheiden oletettu vaikutus ihmisen käyttäytymiseen. Monet ihmiset vakuuttavat intohimoisesti, että ihmisen käyttäytymiseen vaikuttaa Kuun vaihe, ja erityisesti, että ihmiset käyttäytyvät oudosti, kun kuu on täysi (kuva 3).
ei ole kiistatonta, että kuu vaikuttaa voimakkaasti planeettaamme. Meren vuorovesi ja virtaus ovat tiukasti sidoksissa Kuun vetovoimiin. Siksi monien mielestä on loogista, että kuukin vaikuttaa meihin. Loppujen lopuksi kehomme koostuu suurelta osin vedestä. Lähes 40 tutkimuksen meta-analyysi osoitti kuitenkin johdonmukaisesti, että kuun ja käyttäytymisemme välistä suhdetta ei ole olemassa (Rotton & Kelly, 1985). Vaikka saatamme kiinnittää enemmän huomiota outoon käyttäytymiseen Kuun täyden vaiheen aikana, oudon käyttäytymisen nopeus pysyy vakiona koko kuun kiertokulun ajan.
miksi olemme niin taipuvaisia uskomaan tämänkaltaisiin kuvitteellisiin korrelaatioihin? Usein luemme tai kuulemme niistä ja yksinkertaisesti hyväksymme tiedon oikeaksi. Tai, meillä on aavistus siitä, miten jokin toimii, ja sitten etsiä todisteita tukemaan, että aavistus, huomiotta todisteita, jotka kertoisivat meille, että aavistus on väärä; tämä tunnetaan vahvistus bias. Muina aikoina löydämme harhaisia korrelaatioita, jotka perustuvat siihen tietoon, joka tulee helpoimmin mieleen, vaikka se tieto olisi ankarasti rajoitettua. Ja vaikka voimme luottaa siihen, että voimme käyttää näitä suhteita ymmärtääksemme ja ennustaaksemme paremmin ympärillämme olevaa maailmaa, kuvitteellisilla korrelaatioilla voi olla merkittäviä haittoja. Esimerkiksi tutkimus osoittaa, että näennäiset korrelaatiot—joissa tietyt käyttäytymismallit on virheellisesti liitetty tiettyihin ryhmiin—ovat mukana muodostamassa ennakkoluuloisia asenteita, jotka voivat lopulta johtaa syrjivään käyttäytymiseen (Fiedler, 2004).