Hallo zusammen,
ich sitze derzeit an der Präregistrierung einer Studie, in der der Einfluss von direkten Naturerfahrungen im Kindergarten auf das Umweltverhalten und Umweltbewusstsein im Erwachsenenalter untersucht werden soll.
Da es sich um ein sehr komplexes Design mit einigen Besonderheiten handelt, benötige ich dringend Hilfe bei der Planung der Auswertung und würde mich darüber sehr freuen! Im Folgenden stelle ich zunächst kurz das Design dar:
Es handelt sich um eine längsschnittliche Untersuchung.
Die UVs sind "die Zeit in wilder und gepflegter Natur im Kindergarten" (UV1) sowie die "Zeit in wilder Natur im Kindergarten" (UV2). Sie werden am Ende der Kindergartenzeit erhoben.
Die AVs sind das allgemeine Umweltbewusstsein (AV1), das Umweltverhalten (AV2) und das auswirkungsstarke Umweltverhalten (AV3) - jeweils erhoben mit 18 Jahren. Zusätzlich wird am Ende der Kindergartenzeit der Mediator des Zusammenhangs erhoben, die Naturverbundenheit (Connectedness to Nature) (M).
Dadurch, dass Waldkindergärten und normale Regelkindergärten inkludiert werden, soll Variation in den direkten Naturerfahrungen entstehen, d.h. Kinder sammeln in unterschiedlichem Ausmaß und vermutlich je nachdem, ob sie in einen Waldkindergarten oder Regelkindergarten gehen, mehr oder weniger Zeit in wilder Natur bzw. gepflegter Natur. Das bedeutet, dass keine randomisierte Zuordnung der Kinder zu den Kindergärten erfolgt.
Es soll sich über das längsschnittliche Design Kausalität angenähert werden. Abstriche sind diesbezüglich jedoch durch die fehlende Randomisierung und Kontrollgruppe zu machen. Dies soll wiederum ausgeglichen werden durch den Einschluss relevanter Kontrollvariablen (weiter unten dargestellt).
Die Hypothesen lauten:
H1: Je mehr Zeit Kinder während des Kindergartens in der Natur ("wilde" und "gepflegte") verbringen, desto stärker ist das Umweltbewusstsein mit 18 Jahren ausgeprägt.
H2: Je mehr Zeit Kinder während des Kindergartens in der "wilden" Natur verbringen, desto stärker ist das Umweltverhalten mit 18 Jahren ausgeprägt.
H3: Der Zusammenhang von Naturerfahrungen in der „wilden Natur“ und Umweltverhalten wird durch Connectedness to Nature vermittelt.
H4: Es gibt einen schwachen Zusammenhang zwischen Naturerfahrungen in der "wilden Natur" und auswirkungsstarkem Umweltverhalten (gemessen über den CO2 Fußabdruck).
Meine Ideen zur Auswertung sind:
Es liegt ja eine hierarchisch geschachtelte Datenstruktur vor. Die Kinder können Gruppen (L2) und Kindergärten (L3) zugeordnet werden. Folglich scheint eine Mehrebenenanalyse sinnvoll, d.h. zunächst die Berechnung der Intraclass-Correlation bezogen auf alle Hypothesen, um zu berücksichtigen, dass es erklärende Varianz auf der L2- und L3-Ebene geben kann.
Nun bin ich aber darüber gestolpert, dass es das Ziel der Mehrebenenanalyse ist, "durch Einführung von L2-Variablen (und cross-level Interaktionen) die Between-Varianz auf null zu bringen" (Urban, 2022). Es gibt aber nur L1-Prädiktoren, nämlich die Zeit in wilder bzw. wilder und gepflegter Natur, und keine L2- oder L3-Prädiktoren.
Es gibt zwar Kontrollvariablen über die gesamte Zeitspanne der Studie, die eingeschlossen werden sollen, aber das ist ja etwas anderes und man könnte diese auch nicht nach L2 oder L3 kategorisieren, da sie auch Faktoren repräsentieren, die außerhalb der Kindergartenzeit und damit der Cluster-Struktur gemessen werden. Folgende Kontrollvariablen sollen inkludiert werden:
Individual-Kontrollvariablen:
o Zeit, die Kinder außerhalb des Kindergartens in der Natur (wilde und gepflegte) verbringen
o Leben auf dem Land vs. Stadt
o Zeit, die Kinder im Schulalter in der Natur verbringen (außerhalb der Kindergartenzeit)
o Umweltlehre in der Schule (außerhalb der Kindergartenzeit)
o Sozioökonomischer Status der Eltern
o Umweltbewusstsein der Eltern
o Geschlecht
Kindergarten- bzw. Gruppen-Kontrollvariablen:
o Umweltbewusstsein der Pädagog:innen
Jetzt ist meine Frage: Macht hier trotzdem eine Mehrebenenanalyse Sinn, da es ja keine L2-oder L3-Prädiktoren gibt?
Worin liegt dann der Vorteil der Mehrebenenanalyse? Darin, dass man verschiedene theoretisch denkbare Modelle (also random intercept und random coefficient) unter Aufnahme des jew. Prädiktors und der Kontrollvariablen auf besten "fit" hin testen kann (über AIC, BIC)?
Sofern die Mehrebenenanalyse wirklich sinnvoll ist, habe ich folgende spezifischere Fragen dazu bzw. bräuchte eine kurze Absicherung, ob meine Überlegungen korrekt sind:
- Ich würde die Analyse in R durchführen mit "lme4" oder gibt es bessere/einfachere Alternativen?
- Ist es korrekt, dass random intercept und random coefficient denkbar sind oder gibt es noch andere Möglichkeiten, die zu testen sind und in der Präregistrierung genannt werden müssen?
- Wie müssten die Kontrollvariablen aufgenommen werden? Blockweise als erstes und danach der Prädiktor?
- Welche Maximum-Likelihood-Schätzung der Parameter sollte verwendet werden? Es gibt robuste und restricted ML-Methoden und mir ist nicht klar, welche ich einsetzen sollte.
- in der Literatur steht z.B., dass der Anteil der “Between-Varianz” mindestens 10% von der Gesamtvarianz der AV betragen sollte, damit eine Mehrebenenanalyse sinnvoll ist (Urban, 2022). Man bekommt ja zwei ICC-Werte, einmal für L2-Varianz und einmal für L3-Varianz. D.h. beide Werte sollten dann über 10% liegen?
- Es gibt auch Literatur, in der beschrieben ist, dass auch ICCs von 0,05 oder noch niedriger für eine Mehrebenenanalyse in Frage kommen (Cook et al., 1997). Wovon hängt die Entscheidung für die Grenze (10% oder 5%) ab?
-Für die kategorialen Kontrollvariablen “Wohnort (ländliche Umgebung vs. städtische Umgebung), Umweltlehre & Geschlecht wird eine Dummy-Kodierung vorgenommen?
- Es werden alle Prädiktoren vorab zentriert?
- Es muss bezüglich des alpha-Niveaus eine Bonferroni-Korrektur vorgenommen werden, da die Datensätze für die Hypothesentestungen teils mehrfach eingesetzt werden?
- H1, H2, und H4 werden einseitig getestet und H3 zweiseitig?
- Da ja auch für die Mediationshypothese eine Mehrebenenanalyse durchgeführt werden müsste und ich beim Recherchieren kaum etwas über das Vorgehen einer Mediationsanalyse im Rahmen einer Mehrebenenanalyse gefunden habe, würde ich mich hier besonders über Tipps zum Vorgehen freuen. Das Process Makro funktioniert z.B. nicht oder? Müsste man dann alle Pfade einzeln testen?
Über Antworten oder Ideen zu meinen Fragen oder auch prinzipiell Hinweise dazu, was ich unbedingt im Teil "Auswertung" der Präregistrierung schreiben sollte, würde ich mich angesichts des komplexen Designs sehr, sehr freuen!
Viele Grüße