Liebe Community,
ich habe eine Frage zur Methodik meines Designs. Ich möchte herausfinden, ob meine beiden Videos (zwei verschiedene Lehrinhalte: Musiktheorie (MT) und Musikgeschichte (MG)) mit sogenannten "Jump Cuts" (JC) (Schnittechnik in der Videobearbeitung) einen Effekt auf das Lernen haben. Dazu verwende ich einen Wissenstest (Pre, Post, Delayed Post nach einer Woche), und 3 Fragebögen zu: Kognitive Belastung (KB), Intrinsische Motivation (IM) und Leistungsemotion (LE). Die beiden Lehrinhalte werden auch variert, um mögliche Reihenfolgeneffekte zu kompensieren. Zwei Lehrinhalte wurden ausgewählt, damit Effekte nicht nur von der Thematik abhängig sind. Alle Teilnehmenden durchlaufen immer zwei Videos wie folgt.
Dadurch entstehen vier mögliche Gruppierungen:
1.: MT mit JC danach MG ohne JC
2.: MT ohne JC danach MG mit JC
3.: MG mit JC danach MT ohne JC
4.: MG ohne JC danach MT mit JC
Die Reihenfolge der Messzeiten:
Pretest zu beiden Themen -> Video 1 -> Fragebögen (KB, IM, LE) & Postest -> Video 2 -> Fragebögen (KB, IM, LE) & Postest -> nach einer Woche delayed Posttest.
Sehe ich das richtig, dass ich zwei UVs habe: Lehrinhalt mit JC und ohne JC UND Reihenfolge.
Sehe ich das richtig, dass ich vier AVs habe: KB, IM, LE, Wissenstest (mit Messwiederholung). Leistungsemotionen sind auch wieder aus 5 Subskalen erstellt (Freude, Langeweile, Nervosität, etc.) Daher bin ich mir hier auch nicht sicher, ob jedes einzelne Subset als eigene AV gilt.
Zur Hypothese: Ich werde den Wissenstest zweiseitig testen, da die Theorie sich uneinig ist. Für die Emotionen und intrinsische Motivation gibt es jedoch eine gerichtete Hypothese (JC > ohne JC)
Welches Verfahren würdet ihr mir empfehlen? MANOVA? Mehrfaktorielle Anova mit Messwiederholung? Spannend werden auch mögliche Interaktionseffekte...
Vielen Dank und ich freue mich auf eine Antwort!
Liebe Grüße
I<3Statistik
p.S.: Nachdem ich hier im Forum ein bisschen rumgestöbert habe einige Ergänzungen:
Die Fragebögen bestehen aus 7-stufigen Ratingskalen (trifft gar nicht zu - trifft zu). Ich bin mir hier mit Summenscores nicht ganz sicher, ging bisher davon aus, dass nur der Mittelwert eine Rolle spielt.
Die Wissenstests bestehen aus jeweils 10 Multiple-Choice-Fragen zur Thematik (Insgesamt 30 Fragen, da Pre, Post und DelayedPost)
Stichprobe wird wahrscheinlich 200 sein, pro Gruppe 50+, je nachdem was für ein Verfahren ich letzendlich brauche und dann damit meine Poweranalyse durchführe. (Erste Poweranalyse wurde durchgeführt mit einer ANOVA, mittlere Effektstärke. Es kamen ca. 100 heraus, aber da wir mit 50% Dropout rechnen wegen des DelayedPost gehen wir von insgesamt n = 200 aus.)