korrelationsforskning
korrelation betyder, at der er et forhold mellem to eller flere variabler (såsom isforbrug og kriminalitet), men dette forhold indebærer ikke nødvendigvis årsag og virkning. Når to variabler er korreleret, betyder det simpelthen, at når den ene variabel ændres, gør den anden det også. Vi kan måle korrelation ved at beregne en statistik kendt som en korrelationskoefficient. En korrelationskoefficient er et tal fra -1 til +1, der angiver styrken og retningen af forholdet mellem variabler. Korrelationskoefficienten er normalt repræsenteret af bogstavet r.
taldelen af korrelationskoefficienten angiver styrken af forholdet. Jo tættere tallet er på 1 (det være sig negativt eller positivt), jo stærkere relaterede variablerne er, og de mere forudsigelige ændringer i en variabel vil være som den anden variabel ændres. Jo tættere tallet er på nul, jo svagere er forholdet, og jo mindre forudsigeligt bliver forholdet mellem variablerne. For eksempel indikerer en korrelationskoefficient på 0,9 et langt stærkere forhold end en korrelationskoefficient på 0,3. Hvis variablerne slet ikke er relateret til hinanden, er korrelationskoefficienten 0. Eksemplet ovenfor om is og kriminalitet er et eksempel på to variabler, som vi måske forventer ikke at have noget forhold til hinanden.
tegnet—positivt eller negativt—af korrelationskoefficienten angiver forholdets retning (Figur 1). En positiv korrelation betyder, at variablerne bevæger sig i samme retning. Sagt på en anden måde betyder det, at når den ene variabel stiger, gør den anden det, og omvendt, når den ene variabel falder, gør den anden det også. En negativ korrelation betyder, at variablerne bevæger sig i modsatte retninger. Hvis to variabler er negativt korreleret, er et fald i en variabel forbundet med en stigning i den anden og omvendt.
eksemplet på is og kriminalitet er en positiv sammenhæng, fordi begge variabler stiger, når temperaturen er varmere. Andre eksempler på positive sammenhænge er forholdet mellem en persons højde og vægt eller forholdet mellem en persons alder og antal rynker. Man kan forvente, at der findes en negativ sammenhæng mellem nogens træthed i løbet af dagen og antallet af timer, de sov den foregående nat: mængden af søvn falder, når træthedsfølelsen øges. I et virkeligt eksempel på negativ korrelation fandt studentforskere ved University of Minnesota en svag negativ korrelation (r = -0.29) mellem det gennemsnitlige antal dage om ugen, hvor eleverne fik færre end 5 timers søvn og deres GPA (Lavry, Dean, & Manders, 2010). Husk, at en negativ korrelation ikke er den samme som ingen korrelation. For eksempel ville vi sandsynligvis ikke finde nogen sammenhæng mellem timers søvn og skostørrelse.
som tidligere nævnt har korrelationer forudsigelig værdi. Forestil dig, at du er i optagelsesudvalget for et større universitet. Du står over for et stort antal ansøgninger, men du er i stand til at rumme kun en lille procentdel af ansøgeren pulje. Hvordan kan du beslutte, hvem der skal optages? Du kan prøve at korrelere dine nuværende studerendes college GPA med deres score på standardiserede tests som SAT eller ACT. Ved at observere, hvilke sammenhænge der var stærkest for dine nuværende studerende, kan du bruge disse oplysninger til at forudsige relativ succes for de studerende, der har ansøgt om optagelse på universitetet.
Figur 1. Scatterplots er et grafisk billede af styrken og retningen af korrelationer. Jo stærkere korrelationen er, desto tættere er datapunkterne på en lige linje. I disse eksempler ser vi, at der er (A) en positiv sammenhæng mellem vægt og højde, (b) en negativ sammenhæng mellem træthed og timers søvn, og (c) ingen sammenhæng mellem skostørrelse og timers søvn.
prøv det
korrelation angiver ikke årsagssammenhæng
korrelationsforskning er nyttig, fordi det giver os mulighed for at at opdage styrken og retningen af forhold, der findes mellem to variabler. Imidlertid, korrelation er begrænset, fordi etablering af eksistensen af et forhold fortæller os lidt om årsag og virkning. Mens variabler undertiden er korreleret, fordi den ene forårsager den anden, kan det også være, at en anden faktor, en forvirrende variabel, faktisk forårsager den systematiske bevægelse i vores variabler af interesse. I det tidligere nævnte is/kriminalitetseksempel er Temperatur en forvirrende variabel, der kan redegøre for forholdet mellem de to variabler.
selv når vi ikke kan pege på klare forvirrende variabler, bør vi ikke antage, at en sammenhæng mellem to variabler indebærer, at en variabel forårsager ændringer i en anden. Dette kan være frustrerende, når et årsag-og-virkning-forhold virker klart og intuitivt. Tænk tilbage på vores diskussion af den forskning, der blev udført af American Cancer Society, og hvordan deres forskningsprojekter var nogle af de første demonstrationer af forbindelsen mellem rygning og kræft. Det forekommer rimeligt at antage, at rygning forårsager kræft, men hvis vi var begrænset til korrelationsforskning, ville vi overskride vores grænser ved at antage denne antagelse.
desværre gør folk fejlagtigt krav på årsagssammenhæng som en funktion af korrelationer hele tiden. Sådanne påstande er især almindelige i reklamer og nyhedshistorier. For eksempel fandt nyere forskning, at folk, der spiser korn regelmæssigt, opnår sundere vægte end dem, der sjældent spiser korn (Frantsen, Trevi Prito, Echon, Garcia-Dominic, & DiMarco, 2013; Barton et al., 2005). Gæt hvordan kornvirksomhederne rapporterer dette fund. Får det at spise korn virkelig en person til at opretholde en sund vægt, eller er der andre mulige forklaringer, såsom at en person med en sund vægt er mere tilbøjelig til regelmæssigt at spise en sund morgenmad end en person, der er overvægtig eller en person, der undgår måltider i et forsøg på diæt (figur 2)? Mens korrelationsforskning er uvurderlig til at identificere forhold mellem variabler, en stor begrænsning er manglende evne til at etablere årsagssammenhæng. Psykologer ønsker at komme med udsagn om årsag og virkning, men den eneste måde at gøre det på er at gennemføre et eksperiment for at besvare et forskningsspørgsmål. Det næste afsnit beskriver, hvordan videnskabelige eksperimenter inkorporerer metoder, der eliminerer eller kontrollerer alternative forklaringer, som giver forskere mulighed for at undersøge, hvordan ændringer i en variabel forårsager ændringer i en anden variabel.
prøv det
se det
se dette klip fra Freakonomics for et eksempel på, hvordan korrelation ikke angiver årsagssammenhæng.
illusoriske korrelationer
fristelsen til at fremsætte fejlagtige årsag-og-effekt-udsagn baseret på korrelationsforskning er ikke den eneste måde, vi har tendens til at fortolke data forkert. Vi har også en tendens til at begå fejlen ved illusoriske korrelationer, især med usystematiske observationer. Illusoriske korrelationer, eller falske korrelationer, opstår, når folk tror, at der findes forhold mellem to ting, når der ikke findes et sådant forhold. En velkendt illusorisk korrelation er den formodede effekt, som månens faser har på menneskelig adfærd. Mange mennesker hævder lidenskabeligt, at menneskelig adfærd påvirkes af månens fase, og specifikt, at folk handler underligt, når månen er fuld (figur 3).