Hallo zusammen,
ich schreibe gerade an meiner Masterarbeit und finde leider im Moment keine eindeutige Antwort auf meine Frage.
Zunächst einmal zum Verständnis: Ich habe Daten von einer Interventionsstudie, bei der Kinder Psychotherapie erhalten haben. Nun möchte ich prüfen, ob die Therapie der Kinder sich positiv auf die psychische Befindlichkeit (erhoben mit 2 Fragebögen) und die Partnerschaft der Eltern (erhoben mit einem Fragebogen) auswirkt. Ich habe also also als 3 AV's die Gesamtwerte der Fragebögen, für die ich jeweils eine multiple lineare Regression rechnen möchte. Die Gesamtwerte liegen getrennt für Mutter und Vater vor, sodass ich die Modelle jeweils für Mutter und Vater getrennt berechnen werde. Als UV's wollte ich 4 Maße für Therapieerfolg verwenden, die allerdings vermutlich auch miteinander korreliert sind. Meine Betreuerin sagte aber, ich solle zunächst alle Variablen im Modell benutzen. Meine Stichprobengröße ist n = 75, wobei aufgrund fehlender Werte je nach Maß das n auf ca n=60 sinken kann (ich benutze den paarweisen Fallausschluss, damit meine Stichprobe nicht zu klein wird).
Mein erstes großes Problem ist, dass ich zahlreiche Kontrollvariablen testen möchte, aber nicht genau weiß, wie ich das bei dem kleinen n anstellen soll. Ich möchte bei mindestens 10 Beobachtungen pro Prädiktor bleiben.
Die Kontrollvariablen sind: Alter Mutter bzw. Vater, Alter Kind, Geschlecht Kind, Therapiebedingung (nominalskaliert, 2 Abstufungen), Komorbidität vorhanden je für Mutter- und Kinderurteil (nominalskaliert ja/nein), Migrationshintergrund vorhanden (ja/nein), Schweregrad der Primärdiagnose je für Mutter- und Kinderurteil (nominalskaliert, 5 Abstufungen von nicht mehr vorhanden bis schwer --> eventuell auch metrisch verwendbar?) Familienstand Eltern (nominalskaliert, 5 Abstufungen, jedoch nur 3 dieser Abstufungen im Datensatz vorhanden), Lebensmittelpunkt des Kindes (nominalskaliert, 5 Abstufungen, jedoch nur 4 dieser Abstufungen im Datensatz vorhanden).
Einige Variablen müsste ich auch noch Dummy-kodieren, sodass ich auf noch mehr Kontrollvariablen komme. Könnte ich den Schweregrad der Primärdiagnose auch nicht kodieren und in der Regression als "metrische Variable" verwenden?
Macht es Sinn, einige Variablen, wie z.B. solche, für die ich separat Mutter- und Kinderurteil habe, schon vorher zu kombinieren, z.B. indem ich die Werte addiere?
Wie gehe ich jetzt am besten mit den Kontrollvariablen um? Alle Werte zusammen kann ich ja aufgrund der Stichprobengröße nicht in ein Modell packen. Meine erste Idee war, separat MLRen für die Kontrollvariablen zu berechnen und nur die signifikanten Variablen in mein eigentliches Modell zu integrieren. Allerdings berechnet die MLR ja für jeden Prädiktor den Einfluss auf die AV in Abhängigkeit vom restlichen Modell, das hier dann ja nur aus Kontrollvariablen besteht, sodass mir diese Methode nicht so ideal erscheint. Zumal ich so viele Prädiktoren habe, dass ich trotzdem mehrere MLRen rechnen müsste.
Meine zweite Idee war, einfach die Korrelationen der Kontrollvariablen mit der AV anzuschauen. Die Frage wäre hier, ab welchem Kriterium man dann eine Korrelation als hoch genug einschätzen würde, sodass man die Kontrollvariable ins Regressionsmodell aufnimmt. Sollte man einen bestimmten Cutoff festlegen (z.B. ab einer Korrelation >.3) oder auf die Signifikanzen schauen? Und macht diese Methode überhaupt Sinn? Denn immerhin überprüfe ich so ja nur den Zusammenhang der Kontrollvariable mit der AV, nicht aber mit meinen eigentlichen Prädiktoren, die ich testen möchte.
Ansonsten fällt mir nur noch ein, direkt die Modelle mit meinen eigentlichen Prädiktoren zu berechnen und dem Modell jeweils immer 1-2 Kontrollvariablen hinzuzufügen und zu schauen, ob diese dann innerhalb des Modells einen signifikanten Einfluss haben. Das erscheint mir im Moment am plausibelsten. Muss ich dann eigentlich eine Bonferroni-Korrektur durchführen?
Ich hoffe, ihr versteht annähernd mein Problem und meinen Datensatz. Ich werde das Ganze auch nochmal mit meiner Betreuerin durchsprechen und nochmal besprechen, ob überhaupt so wahnsinnig viele Kontrollvariablen sinnvoll/notwendig sind. Ich freue mich aber trotzdem über eure Hilfen