Maybaygiare.org

Blog Network

University of Virginia Library Research Data Services + Sciences

tässä viestissä pyritään esittelemään sovitteluanalyysin perusteet eikä selitetä tilastollisia yksityiskohtia. Lisätietoja, Katso artikkeleita lopussa tämän viestin.

Mitä on sovittelu?

sanotaan, että aiemmat tutkimukset ovat esittäneet, että korkeammat arvosanat ennustavat korkeampaa onnellisuutta: X (arvosanat) → Y (onnellisuus). (Tämä tutkimusesimerkki on tehty havainnollistamistarkoituksessa. Älä pidä sitä tieteellisenä lausuntona.)

mediat_ex1

mielestäni arvosanat eivät kuitenkaan ole todellinen syy onnellisuuden lisääntymiseen. Oletan, että hyvät arvosanat kohottavat itsetuntoa ja sitten korkea itsetunto lisää onnellisuutta: X (arvosanat) → m (itsetunto) → Y (onnellisuus).

sovittelu_ex2

Tämä on tyypillinen sovitteluanalyysin tapaus. Itsetunto on välittäjä, joka selittää arvosanojen (IV) ja onnellisuuden (dv) välisen suhteen taustalla olevan mekanismin.

miten analysoida sovittelun vaikutuksia?

ennen kuin aloitamme, muistakaa, että kuten mikään muu regressioanalyysi, sovitteluanalyysi ei merkitse syy-seuraussuhteita, ellei se perustu kokeelliseen suunnitteluun.

analysoimaan sovittelua:
1. Seuraa Baron & Kennyn askeleet
2. Käytä merkitsevyystestauksessa joko Sobelin testiä tai bootstrappingia.

Seuraavassa esitetään Baronin & Kenny (1986) ehdottamat sovitteluanalyysin perusaskeleet. Sovitteluanalyysi koostuu kolmesta regressiokokonaisuudesta: X → Y, X → M ja X + M → Y. tämä viesti näyttää esimerkkejä käyttäen R, mutta voit käyttää mitä tahansa tilastollisia ohjelmistoja. Ne ovat vain kolme regressioanalyysiä!

# Download data online. This is a simulated dataset for this post.myData <- read.csv('http://static.lib.virginia.edu/statlab/materials/data/mediationData.csv')

Vaihe 1.
mediat_step1

$$Y = b_{0} + b_{1}X + e$$

onko \(b_{1}\) merkittävä? Haluamme X: n vaikuttavan Y: hen.jos X: n ja Y: n välillä ei ole suhdetta, ei ole mitään soviteltavaa.

vaikka Baron ja Kenny alun perin ehdottivat tätä, tämä vaihe on kiistanalainen. Vaikka emme löytäisikään merkittävää yhteyttä X: n ja Y: n välillä, voisimme edetä seuraavaan vaiheeseen, jos meillä on hyvä teoreettinen tausta heidän suhteestaan. Lisätietoja: Shrout & Bolger (2002).

model.0 <- lm(Y ~ X, myData)summary(model.0)# Coefficients:# Estimate Std. Error t value Pr(>|t|) # (Intercept) 2.8572 0.6932 4.122 7.88e-05 ***# X 0.3961 0.1112 3.564 0.000567 ***### b1 = 0.3961, p < .001 # significant!

Vaihe 2.
mediat_step2

$$m = b_{0} + b_{2}X + e$$

onko \(b_{2}\) merkittävä? Haluamme X: n vaikuttavan M: ään. jos X: llä ja M: llä ei ole suhdetta, M on vain kolmas muuttuja, joka voi liittyä Y: hen tai olla liittymättä. sovittelu on järkevää vain, jos X vaikuttaa M: ään.

model.M <- lm(M ~ X, myData)summary(model.M)# Coefficients:# Estimate Std. Error t value Pr(>|t|) # (Intercept) 1.49952 0.58920 2.545 0.0125 * # X 0.56102 0.09448 5.938 4.39e-08 ***### b2 = 0.5610, p < .001 # significant!

Vaihe 3.
mediat_step3

$$Y = b_{0} + b_{4}x + b_{3}m + e$$

on \(b_{4}\) merkityksetön tai pienempi kuin ennen? Haluamme M: n vaikuttavan Y: hen, mutta X: n ei enää vaikuttavan Y: hen (tai X: n edelleen vaikuttavan Y: hen, mutta pienemmässä suuruusluokassa). Jos välittävä vaikutus on olemassa, X: n vaikutus Y: hen häviää (tai ainakin heikkenee), kun m lasketaan mukaan regressioon. X: n vaikutus Y: hen kulkee M: n kautta.

model.Y <- lm(Y ~ X + M, myData)summary(model.Y)# Coefficients:# Estimate Std. Error t value Pr(>|t|) # (Intercept) 1.9043 0.6055 3.145 0.0022 ** # X 0.0396 0.1096 0.361 0.7187 # M 0.6355 0.1005 6.321 7.92e-09 ***### b4 = 0.0396, p = 0.719 # the effect of X on Y disappeared!### b3 = 0.6355, p < 0.001

Jos X: n vaikutus Y: hen häviää kokonaan, M toimii täysin välittäjänä X: n ja Y: n välillä (täysi sovittelu). Jos X: n vaikutus Y: hen on edelleen olemassa, mutta pienemmässä suuruusluokassa, M toimii osittain välittäjänä X: n ja Y: n välillä (osittainen sovittelu). Esimerkki osoittaa täyden sovittelun, mutta silti täysi sovittelu tapahtuu harvoin käytännössä.

kun löydämme nämä suhteet, haluamme nähdä, onko tämä sovitteleva vaikutus tilastollisesti merkittävä (eri kuin nolla vai ei). Tätä varten on olemassa kaksi pääasiallista lähestymistapaa: Sobelin testi (Sobel, 1982) ja bootstrapping (Preacher & Hayes, 2004). R: ssä sobel()‘multilevel’ paketti Sobelin testiin ja mediate()‘mediation’ paketti bootstrappaukseen. Koska bootstrapping on erittäin suositeltavaa viime vuosina (vaikka Sobel testi oli laajalti käytetty ennen), näytän vain bootstrapping menetelmä tässä esimerkissä.

mediate() ottaa syötteeksi kaksi malliesinettä (X → M ja X + M → Y) ja on määriteltävä, mikä muuttuja on IV (käsittely) ja välittäjä (välittäjä). Bootstrappausta varten asetetaan boot = TRUE ja sims vähintään 500. Kun olet suorittanut sen, etsi ACME (keskimääräiset kausaaliset Sovitteluvaikutukset) tuloksista ja katso, onko se erilainen kuin nolla. mediate() katso Tingley, Yamamoto, Hirose, Keele, & Imai (2014).

library(mediation)results <- mediate(model.M, model.Y, treat='X', mediator='M', boot=TRUE, sims=500)summary(results)# Estimate 95% CI Lower 95% CI Upper p-value# ACME 0.3565 0.2155 0.5291 0.00# ADE 0.0396 -0.1761 0.2598 0.66# Total Effect 0.3961 0.1563 0.5794 0.00# Prop. Mediated 0.9000 0.5254 1.8820 0.00### ACME = 0.3565, 95% CI # significant!### ACME stands for Average Causal Mediation Effects### ADE stands for Average Direct Effects### Total Effect is a sum of a mediation (indirect) effect and a direct effect

huomaa, että yhteenvedon kokonaisvaikutus (0.3961) on \(b_{1}\) Ensimmäisessä vaiheessa: X: n kokonaisvaikutus Y: hen (ilman M: ää). Suora vaikutus (ADE, 0.0396) on \(b_{4}\) kolmannessa vaiheessa: X: n suora vaikutus Y: hen M: n välittävän (epäsuoran) vaikutuksen jälkeen. Lopuksi välivaikutus (ACME) on kokonaisvaikutus miinus suora vaikutus (\(b_{1} – b_{4}\), tai 0.3961 - 0.0396 = 0.3565), joka on tulo kertoimesta X toisessa vaiheessa ja kertoimesta M viimeisessä vaiheessa (\(b_{2} \times b_{3}\), tai 0.56102 * 0.6355 = 0.3565). Sovitteluanalyysin tavoitteena on saada tämä epäsuora vaikutus ja nähdä, onko se tilastollisesti merkittävä.

muuten, meidän ei tarvitse noudattaa kaikkia kolmea askelta, kuten Baron ja Kenny ehdottivat. Voisimme yksinkertaisesti suorittaa kaksi regressiota (X → M ja X + M → Y) ja testata sen merkitystä käyttämällä kahta mallia. Kuitenkin ehdotetut vaiheet auttavat sinua ymmärtämään, miten se toimii!

model.M <- lm(M ~ X, myData)model.Y <- lm(Y ~ X + M, myData)results <- mediate(model.M, model.Y, treat='X', mediator='M', boot=TRUE, sims=100)summary(results)

Sovitteluanalyysi ei rajoitu lineaariseen regressioon; Voimme käyttää logistista regressiota tai polynomiregressiota ja muuta. Lisäksi voimme lisätä muuttujia ja suhteita, esimerkiksi moderoitua sovittelua tai sovittelevaa kohtuutta. Jos mallisi on kuitenkin hyvin monimutkainen eikä sitä voida ilmaista pienenä regressiojoukkona, kannattaa sen sijaan harkita rakenteellisen yhtälön mallintamista.

yhteenvetona, tässä vuokaavio sovitteluanalyysiin!

mediation_flowchart

lisätietoja:

  • Baron, R. M., & Kenny, D. A. (1986). Moderaattori-välittäjä muuttuja ero sosiaalipsykologisessa tutkimuksessa: käsitteelliset, strategiset ja tilastolliset näkökohdat. Journal of Personality and Social Psychology, 5, 1173-1182.
  • Shrout, P. E., & Bolger, N. (2002). Sovittelu kokeellisissa ja ei-kokeellisissa tutkimuksissa: uudet menettelyt ja suositukset. Psykologiset Menetelmät, 7, 422-445.
  • Tingley, D., Yamamoto, T., Hirose, K., Keele, L., & Imai, K. (2014). Sovittelu: R paketti syy sovitteluanalyysi.

Jos sinulla on kysymyksiä tai tarkennuksia tähän artikkeliin, ota yhteyttä UVA-kirjasto Statlabiin: [email protected]

Katso UVA-kirjaston Statlabin artikkelikokoelma kokonaisuudessaan.

Bommae Kim
Statistical Consulting Associate
Virginian yliopiston kirjasto
April 18, 2016 (julkaistu)
July 12, 2016 (kirjoitusvirheet vuokaaviossa korjattu)

Vastaa

Sähköpostiosoitettasi ei julkaista.