Hallo!
Ich habe schon einiges gerechnet für meine Masterarbeit. Ich habe meine Rechnungen hier präsentiert:
1. Design:
375 VPN, Fragebogenstudie: Alle Rechnungen in R
Preliminary analyses:
VIF, Kolmogorov-Smirnov und Shapiro-Wilk (Normalverteilung) -> keine Normalverteilung
-> Schiefe und Kurtosis betrachtet
1. Hypothese: lineare Regression
- Mit Kontrollvariablen (2): Multiple Regression einmal ohne und einmal mit Interaktionstherm.
o Ich berichte: standardisierte Betas, p values, R², und f²
o Teste auf Heteroskedastizität (Beusch-Pagan Test)
Keine Homoskedastizität ->Standard errors -> nur kleine Unterschiede -> gleicher Effekt in gleicher Richtung -> Rechnung dennoch robust
o Outliers: standardized residuals +/- 2 -> 14 fallen raus-> aber Effekt nur stärker und gleiche Richtung ->ich lasse sie drin (Beusch-Pagan test bleibt signifikant, outliers waren nicht der Grund)
o Multiple Regression mit Interaktionstherm: signifikante Interaktion -> um genauer zu sehen wie wird Alter gruppiert in alt, mittelalt und jung -> stärkerer Effekt bei Alten -> Tukey’s HSD test als post hoc analyse -> Unterschied zwischen jung und alt signifikant
2. Hypothese: Mediation
o Nach Baron und Kenny (mediate method mit bootstrapping 1.000 resampling simulations)
1. Lineare Regression (Pfad a) -> significant -> berichte beta, p, R² und f²
2. Multiple Regression (Pfad b + c) -> significant -> berichte beta, p, R² und f² für beide Pfade
3. Mediate mit Bootstrapping (mediate(pfad_a_1, pfad_b_c_1, treat = "CFC_skala", mediator = "efficacy_skala", boot = TRUE))
-> Berichte ACME (indirekter Effekt) und ADE (direkter Effekt) -> beide signifikant (partial mediation)
4. Die a priori Stichprobenumfangsplanung hatte 414 ergeben, teste jetzt die power. Die Effekte hier sind viel größer als erwartet, habe eine power von (> 0.97)
3. Und 4. Hypothesen: Moderationen
- Multiple Regressionen mit Interaktionsthermen
-> Nicht signifkant, berichte beta und p
4. Explorative Analysen
1. Zwei multiple Regressionen einmal mit 3 und einmal mit 4 Prädiktoren
- Berichte F für modelle, p und R²
- Beide Modelle signifikant
- Alle Prädiktoren signigikant (beta und p berichtet)
Dann ANOVA um Modelle zu vergleichen: Likelihood Ratio Test
- Signifikanter Unterschied (berichte F und p)
- Überprüfe Normalverteilung der Residuen (Shapiro-Wilk Test) und Homoskedastizität (Beusch-Pagan test) Voraussetzungen sind erfüllt
2. SEM:
- X was treated as an exogenous variable, predicting the endogenous variables A and B.. A, B and X were modeled as predictors of the endogenous outcome Y.
o Mit R
# Regressionspfade
Model_expo <- […]
fit1 <- sem(model_expo1, data = data)
# summary Model
summary(fit1, fit.measures = TRUE, standardized = TRUE,rsquare = TRUE )
o Berichte beta und p; CFI, RMSEA, SRMR, chi², AIC, BIC, R²
-
- X was modeled as an exogenous predictor of A, B, and Y. C was included as an additional predictor of Y (additionally to A and B.)
o Same procedure
- X was modeled as an exogenous predictor of A, B, and Y. C was included as an additional predictor of Y (additionally to A and B.) C was also a predictor of A.
o Same procedure
o Aber: Pfad A ~ C nicht signifikant (selber Pfad (Pfad a) aus Hypothese 2)!!!
- Da jetzt A nicht nur aus C sondern auch aus X vorhergesagt werden und der Pfad für A nicht mehr signifikant ist wird eine Mediation angenommen!:
o SEM
model_labeled <- '
# Regressions with labeled paths
X ~ a*C
A ~ b*X
B~ X
Y ~ c*A + d*X + e*B+ f*C
# Indirect effect: C → X → A→ Y
indirect := a * b * c
# Total effect: direct (f) + indirect
total := f + (a * b * c)
'
fit_labeled <- sem(model_labeled, data = data, se = "bootstrap", bootstrap = 1000)
summary(fit_labeled, standardized = TRUE, fit.measures = TRUE, rsquare = TRUE)
Berichte betas, p, CFO, REMSEA, SRMR, chi², R³, AIC, BIC
Fragen:
1. Brauche ich beide Tests für die Normalverteilungsprüfung? (Kolmogrov- Smirnov und Shapiro-Wilk)
2. Ist es üblich Schiefe und Kurtosis zu berichten , wenn die Normalverteilung verletzt ist?
3.Ist es üblich, wenn keine Homoskedastizität vorliegt standard errors zu verwenden und wie groß darf der Unterschied sein, dass es dennoch robust ist?
4. Mediation: Sind 1000 resampling simulations genug? Reicht es auch, wenn ich die Ergebnisse der Pfade berichte und indirekten und direkten Effekt? Ich habe keine spezifische Methode sondern den R mediate Befehl genutzt.
5. Mediation: Kann eine power von >0.97 sein? und ist es denn okay, dass meine stichprobe so groß ist.. hätte ich größere Effekte angenommen hätte ja auch eine kleinere gereicht..
6.Vergleich zweier Modelle (Regressionsmodelle) mit ANOVA: darf ich das machen? in einem Modell ist ja ein Prädiktor weniger...
7. SEM: Reicht es die Pfade und Modindices zu berichten? bzw. auch welche Variablen endogen und exogen sind oder muss ich noch mehr berichten? Ich habe ja auch da keine spezifische Methode sondern nutze die passenden R-Befehle.
So einige Fragen und viele Rechnungen. Ich freue mich sooo sehr, wenn jemand mit drüber schaut... DANKE!!!!