Liebe Mitglieder,
ich verzweifle gerade ein wenig an der Statistik meiner Arbeit und hoffe ihr könnt mir vllt weiterhelfen.
Meine Forschungshypothese ist folgende: Ob Hochsensibilität als Mediator zwischen Stress und Depressionen fungiert.
Hierfür arbeite ich mit dem Programm R und dem Paket Lavaan, um eine Pfadanalyse mit Mediator zu modellieren und die Mediation zu Bootstrappen.
Es gibt einen Depressionsscore, einen Stressscore und 7 Unterskalen der Hochsensibilität (alle quasi metrisch).
Mein Code sieht wie folgt aus:
mod1 <- 'depr ~ stress + hoch.1
hoch.1 ~ stress'
mod1.fit <- sem(mod1, data= data)
summary(mod1.fit, standardized=TRUE, rsquare=TRUE)
mediation (x= data$stress,
mediator= data$hoch.1,
dv= data$depr,
bootstrap = TRUE, B= 1000)
semPaths(mod1.fit, whatLabels = "est")
Das Ganze dann eben 7 mal für die verschiedenen Skalen. Also 7 Modelle insgesamt.
Meine Frage hierzu ist, was ich alles beachten und vorher testen muss?
Ich habe in einem anderen Beitrag gelesen, dass ich folgende Vorannahmen bei dieser Methode testen muss:
Multi-normalverteilung der *Variablen*, lineare Effekte und ein hohes N (weil ML nur "approximativ unverzerrt" (Zitat von Holgonaut).
Wie kann man die Multinormalverteilung der Variablen und die linearen Effekte messen? Speziell in R? Und was mache ich, wenn die Annahmen verletzt sind?
Außerdem frage ich mich, wieso keine Multikollinearität und Homoskedastizität getestet werden muss?
Zur Multivariatennormalverteilung hab ich bis jetzt nur gefunden, dass man folgenden Code nur für die *endogenen Variablen* (warum nicht auch die exogene?) nutzt:
mvn(data ,mvnTest = "mardia", univariateTest = "SW", multivariatePlot = "qq")
Zudem hab ich Folgendes geprüft:
- Linearität mit Streudiagrammen (Wobei ich diese sehr schwer lesen kann)
- Ausreißer mit Leveragewerten und studentisierten Residuen (Wobei ich mich hier frage, ob dies wichtig ist?)
Ich bedanke mich schonmal bei Allen, die ein bisschen Licht ins Dunkeln bringen können!
LG