Maybaygiare.org

Blog Network

University of Virginia Library Research Data Services + Sciences

detta inlägg avser att introducera grunderna för medlingsanalys och förklarar inte statistiska detaljer. För mer information, se artiklarna i slutet av detta inlägg.

vad är medling?

låt oss säga att tidigare studier har antytt att högre betyg förutsäger högre lycka: X (betyg) bisexuell Y (lycka). (Detta forskningsexempel består av illustrationsändamål. Se det inte som ett vetenskapligt uttalande.)

mediation_ex1

Jag tror dock att betyg inte är den verkliga anledningen till att lycka ökar. Jag antar att bra betyg ökar ens självkänsla och då ökar hög självkänsla ens lycka: X (betyg) bisexuell m (självkänsla) bisexuell Y (lycka).

mediation_ex2

detta är ett typiskt fall av medlingsanalys. Självkänsla är en medlare som förklarar den underliggande mekanismen för förhållandet mellan Betyg (IV) och lycka (DV).

hur analyserar man medlingseffekter?

innan vi börjar, kom ihåg att, som någon annan regressionsanalys, innebär medlingsanalys inte orsakssamband om det inte är baserat på experimentell design.

för att analysera medling:
1. Följ Baron & Kennys steg
2. Använd antingen Sobel-testet eller bootstrapping för signifikanstestning.

följande visar de grundläggande stegen för medlingsanalys som föreslagits av Baron & Kenny (1986). En medlingsanalys består av tre uppsättningar regression: X megapixlar y, x megapixlar M, och X + M megapixlar Y. detta inlägg kommer att visa exempel med hjälp av R, men du kan använda någon statistisk programvara. Det är bara tre regressionsanalyser!

# Download data online. This is a simulated dataset for this post.myData <- read.csv('http://static.lib.virginia.edu/statlab/materials/data/mediationData.csv')

Steg 1.
mediation_step1

$ $ Y = b_{0} + b_{1}X + E$ $

är\ (b_{1}\) signifikant? Vi vill att X ska påverka Y. om det inte finns något samband mellan X och Y finns det inget att medla.

Även om detta är vad Baron och Kenny ursprungligen föreslog, är detta steg kontroversiellt. Även om vi inte hittar en signifikant koppling mellan X och Y, kan vi gå vidare till nästa steg om vi har en bra teoretisk bakgrund om deras förhållande. Se Shrout & Bolger (2002) för detaljer.

model.0 <- lm(Y ~ X, myData)summary(model.0)# Coefficients:# Estimate Std. Error t value Pr(>|t|) # (Intercept) 2.8572 0.6932 4.122 7.88e-05 ***# X 0.3961 0.1112 3.564 0.000567 ***### b1 = 0.3961, p < .001 # significant!

steg 2.
mediation_step2

$ $ M = b_{0} + b_{2}X + E$ $

är\ (b_{2}\) signifikant? Vi vill att X ska påverka M. Om X och M inte har något samband är M bara en tredje variabel som kanske eller inte kan associeras med Y. en medling är endast meningsfull om X påverkar M.

model.M <- lm(M ~ X, myData)summary(model.M)# Coefficients:# Estimate Std. Error t value Pr(>|t|) # (Intercept) 1.49952 0.58920 2.545 0.0125 * # X 0.56102 0.09448 5.938 4.39e-08 ***### b2 = 0.5610, p < .001 # significant!

steg 3.
mediation_step3

$$Y = b_{0} + b_{4}X + b_{3}M + E$$

är \(b_{4}\) icke-signifikant eller mindre än tidigare? Vi vill att M ska påverka Y, Men X påverkar inte längre Y (eller X påverkar fortfarande Y men i mindre storlek). Om en medlingseffekt existerar kommer effekten av X på Y att försvinna (eller åtminstone försvagas) när M ingår i regressionen. Effekten av X på Y går genom M.

model.Y <- lm(Y ~ X + M, myData)summary(model.Y)# Coefficients:# Estimate Std. Error t value Pr(>|t|) # (Intercept) 1.9043 0.6055 3.145 0.0022 ** # X 0.0396 0.1096 0.361 0.7187 # M 0.6355 0.1005 6.321 7.92e-09 ***### b4 = 0.0396, p = 0.719 # the effect of X on Y disappeared!### b3 = 0.6355, p < 0.001

om effekten av X på Y helt försvinner, förmedlar M fullständigt mellan X och Y (full medling). Om effekten av X på Y fortfarande existerar, men i en mindre storlek, medierar M delvis mellan X och Y (partiell medling). Exemplet visar en fullständig medling, men en fullständig medling sker sällan i praktiken.

När vi hittar dessa relationer vill vi se om denna medlingseffekt är statistiskt signifikant (skiljer sig från noll eller inte). För att göra det finns det två huvudmetoder: Sobel-testet (Sobel, 1982) och bootstrapping (Preacher & Hayes, 2004). I R kan du använda sobel() I ‘multilevel’ paket för Sobel-testet och mediate() I ‘mediation’ paket för bootstrapping. Eftersom bootstrapping rekommenderas starkt de senaste åren (Även om Sobel-testet användes allmänt tidigare), visar jag bara bootstrapping-metoden i det här exemplet.

mediate() tar två modellobjekt som inmatning (X msk M och X + M msk Y) och vi måste ange vilken variabel som är en IV (behandling) och en medlare (medlare). För bootstrapping, Ställ in boot = TRUE och sims till åtminstone 500. Efter att ha kört det, leta efter ACME (Average Causal Mediation Effects) i resultaten och se om det skiljer sig från noll. För detaljer om mediate(), se Tingley, Yamamoto, Hirose, Keele, & Imai (2014).

library(mediation)results <- mediate(model.M, model.Y, treat='X', mediator='M', boot=TRUE, sims=500)summary(results)# Estimate 95% CI Lower 95% CI Upper p-value# ACME 0.3565 0.2155 0.5291 0.00# ADE 0.0396 -0.1761 0.2598 0.66# Total Effect 0.3961 0.1563 0.5794 0.00# Prop. Mediated 0.9000 0.5254 1.8820 0.00### ACME = 0.3565, 95% CI # significant!### ACME stands for Average Causal Mediation Effects### ADE stands for Average Direct Effects### Total Effect is a sum of a mediation (indirect) effect and a direct effect

Observera att den totala effekten i sammanfattningen (0.3961) är \(b_{1}\) i det första steget: en total effekt av X på Y (utan M). Den direkta effekten (ade, 0.0396) är \(b_{4}\) i det tredje steget: en direkt effekt av X på Y efter att ha tagit hänsyn till en medling (indirekt) effekt av M. Slutligen är medlingseffekten (ACME) den totala effekten minus den direkta effekten (\(b_{1} – b_{4}\) eller 0.3961 - 0.0396 = 0.3565), vilket motsvarar en produkt med en koefficient på X i det andra steget och en koefficient på M i det sista steget (\(b_{2} \gånger b_{3}\) eller 0.56102 * 0.6355 = 0.3565). Målet med medlingsanalys är att få denna indirekta effekt och se om den är statistiskt signifikant.

förresten, vi behöver inte följa alla tre steg som Baron och Kenny föreslog. Vi kunde helt enkelt köra två regressioner (X megapixlar M och X + M megapixlar Y) och testa dess betydelse med hjälp av de två modellerna. De föreslagna stegen hjälper dig dock att förstå hur det fungerar!

model.M <- lm(M ~ X, myData)model.Y <- lm(Y ~ X + M, myData)results <- mediate(model.M, model.Y, treat='X', mediator='M', boot=TRUE, sims=100)summary(results)

Medlingsanalys är inte begränsad till linjär regression; vi kan använda logistisk regression eller polynomregression och mer. Vi kan också lägga till fler variabler och relationer, till exempel modererad medling eller medierad moderering. Men om din modell är väldigt komplex och inte kan uttryckas som en liten uppsättning regressioner, kanske du vill överväga strukturell ekvationsmodellering istället.

för att sammanfatta, här är ett flödesschema för medlingsanalys!

mediation_flowchart

För mer information:

  • Baron, RM, & Kenny, Da (1986). Moderator-medlaren variabel skillnad i socialpsykologisk forskning: konceptuella, strategiska och statistiska överväganden. Journal of Personality and Social Psychology, 5, 1173-1182.
  • Shrout, P. E., & Bolger, N. (2002). Medling i experimentella och icke-experimentella studier: nya förfaranden och rekommendationer. Psykologiska Metoder, 7, 422-445.
  • Tingley, D., Yamamoto, T., Hirose, K., Keele, L., & Imai, K. (2014). Medling: r paket för kausal medling analys.

För frågor eller förtydliganden angående denna artikel, kontakta Uva Library StatLab: [email protected]

visa hela samlingen av UVA Library StatLab artiklar.

Bommae Kim
Statistical Consulting Associate
University of Virginia Library
April 18, 2016 (publicerad)
juli 12, 2016 (stavfel i flödesschema korrigeras)

Lämna ett svar

Din e-postadress kommer inte publiceras.