Liebe Community,
ich bin etwas verzweifelt und hoffe, ihr könnt mir helfen.
Ich habe für meine erste Publikation in der Psychologie longitudinale Daten zum Alkoholkonsum von Schülern in Kontroll und Interventionsgruppe erhoben, um eine Initiative zur Alkoholprävention zu evaluieren.
Ich habe dazu die Klassen einer Stufe und eines gleichen Leistungsniveaus miteinander verglichen (natürlichen von vielen Schulen, aber immer jeweils auf der gleichen Schule, in der gleichen Stufe die Kontroll/Interventionsgruppe; sample: 1600 Schüler). Welche Klasse Interventions- und welche Kontrollklasse sein durfte, wollten die Lehrer bestimmen, daher konnte ich nicht selber randomisieren.
Nachdem ich jetzt die Baselinedaten und die Daten des zweiten Messzeitpunktes (drei Monate nach der Baseline) erhoben habe, ist mir aufgefallen, dass es in der Baseline signifikante Unterschiede beim Trinkverhalten bei den Jugendlichen gibt (das Trinkverhalten ist der primäre Endpunkt).
Begründen kann ich das sehr einfach: Die Lehrer haben sich nicht an die Anforderung "gleiches Leistungsniveau" 100% gehalten, sondern haben bewusst die schwierigeren Problemklassen der Intervention zugeteilt (wo in der Baseline signifikant mehr konsumiert wird).
Mein Problem ist nun nur: Wie werte ich jetzt die Daten aus, wenn die Gruppen in der Baseline nicht in Bezug auf Trinkverhalten vergleichbar sind?
Ich habe einen signifikanten Effekt der Intervention gemessen: Es haben viel mehr in der Interventionsgruppe ihren Alkoholkonsum drei Monate danach reduziert als in der Kontrollgruppe (fünf mal so viele nach den deskriptiven Daten).
In der Baseline trinken allerdings in der Interventionsgruppe auch bereits doppelt soviele, also kann man damit zumindest einen Teil des Effekts begründet werden. Wie rechnet man den tatsächlichen Effekt nun sauber aus?
Kann man mit diesen Unterschieden in der Baseline überhaupt einigermaßen zuverlässig die Effekte auswerten?
Vielen Dank für eure Hilfe!
Jens