Viele Kontrollvar. & kleine Stichprobe (multiple lineare R.)

Alle Verfahren der Regressionanalyse.

Viele Kontrollvar. & kleine Stichprobe (multiple lineare R.)

Beitragvon steffi_89 » So 29. Jun 2014, 11:29

Hallo zusammen,

ich schreibe gerade an meiner Masterarbeit und finde leider im Moment keine eindeutige Antwort auf meine Frage.

Zunächst einmal zum Verständnis: Ich habe Daten von einer Interventionsstudie, bei der Kinder Psychotherapie erhalten haben. Nun möchte ich prüfen, ob die Therapie der Kinder sich positiv auf die psychische Befindlichkeit (erhoben mit 2 Fragebögen) und die Partnerschaft der Eltern (erhoben mit einem Fragebogen) auswirkt. Ich habe also also als 3 AV's die Gesamtwerte der Fragebögen, für die ich jeweils eine multiple lineare Regression rechnen möchte. Die Gesamtwerte liegen getrennt für Mutter und Vater vor, sodass ich die Modelle jeweils für Mutter und Vater getrennt berechnen werde. Als UV's wollte ich 4 Maße für Therapieerfolg verwenden, die allerdings vermutlich auch miteinander korreliert sind. Meine Betreuerin sagte aber, ich solle zunächst alle Variablen im Modell benutzen. Meine Stichprobengröße ist n = 75, wobei aufgrund fehlender Werte je nach Maß das n auf ca n=60 sinken kann (ich benutze den paarweisen Fallausschluss, damit meine Stichprobe nicht zu klein wird).

Mein erstes großes Problem ist, dass ich zahlreiche Kontrollvariablen testen möchte, aber nicht genau weiß, wie ich das bei dem kleinen n anstellen soll. Ich möchte bei mindestens 10 Beobachtungen pro Prädiktor bleiben.
Die Kontrollvariablen sind: Alter Mutter bzw. Vater, Alter Kind, Geschlecht Kind, Therapiebedingung (nominalskaliert, 2 Abstufungen), Komorbidität vorhanden je für Mutter- und Kinderurteil (nominalskaliert ja/nein), Migrationshintergrund vorhanden (ja/nein), Schweregrad der Primärdiagnose je für Mutter- und Kinderurteil (nominalskaliert, 5 Abstufungen von nicht mehr vorhanden bis schwer --> eventuell auch metrisch verwendbar?) Familienstand Eltern (nominalskaliert, 5 Abstufungen, jedoch nur 3 dieser Abstufungen im Datensatz vorhanden), Lebensmittelpunkt des Kindes (nominalskaliert, 5 Abstufungen, jedoch nur 4 dieser Abstufungen im Datensatz vorhanden).

Einige Variablen müsste ich auch noch Dummy-kodieren, sodass ich auf noch mehr Kontrollvariablen komme. Könnte ich den Schweregrad der Primärdiagnose auch nicht kodieren und in der Regression als "metrische Variable" verwenden?

Macht es Sinn, einige Variablen, wie z.B. solche, für die ich separat Mutter- und Kinderurteil habe, schon vorher zu kombinieren, z.B. indem ich die Werte addiere?

Wie gehe ich jetzt am besten mit den Kontrollvariablen um? Alle Werte zusammen kann ich ja aufgrund der Stichprobengröße nicht in ein Modell packen. Meine erste Idee war, separat MLRen für die Kontrollvariablen zu berechnen und nur die signifikanten Variablen in mein eigentliches Modell zu integrieren. Allerdings berechnet die MLR ja für jeden Prädiktor den Einfluss auf die AV in Abhängigkeit vom restlichen Modell, das hier dann ja nur aus Kontrollvariablen besteht, sodass mir diese Methode nicht so ideal erscheint. Zumal ich so viele Prädiktoren habe, dass ich trotzdem mehrere MLRen rechnen müsste.

Meine zweite Idee war, einfach die Korrelationen der Kontrollvariablen mit der AV anzuschauen. Die Frage wäre hier, ab welchem Kriterium man dann eine Korrelation als hoch genug einschätzen würde, sodass man die Kontrollvariable ins Regressionsmodell aufnimmt. Sollte man einen bestimmten Cutoff festlegen (z.B. ab einer Korrelation >.3) oder auf die Signifikanzen schauen? Und macht diese Methode überhaupt Sinn? Denn immerhin überprüfe ich so ja nur den Zusammenhang der Kontrollvariable mit der AV, nicht aber mit meinen eigentlichen Prädiktoren, die ich testen möchte.

Ansonsten fällt mir nur noch ein, direkt die Modelle mit meinen eigentlichen Prädiktoren zu berechnen und dem Modell jeweils immer 1-2 Kontrollvariablen hinzuzufügen und zu schauen, ob diese dann innerhalb des Modells einen signifikanten Einfluss haben. Das erscheint mir im Moment am plausibelsten. Muss ich dann eigentlich eine Bonferroni-Korrektur durchführen?

Ich hoffe, ihr versteht annähernd mein Problem und meinen Datensatz. Ich werde das Ganze auch nochmal mit meiner Betreuerin durchsprechen und nochmal besprechen, ob überhaupt so wahnsinnig viele Kontrollvariablen sinnvoll/notwendig sind. Ich freue mich aber trotzdem über eure Hilfen :)
steffi_89
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: So 29. Jun 2014, 10:42
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Viele Kontrollvar. & kleine Stichprobe (multiple lineare

Beitragvon strukturmarionette » So 29. Jun 2014, 13:37

Hi,

das allererste und wichtigst ist m.E eine möglichst korrekte Spezifikation des Modells.

Kann denn bei Dir diese Trennung zwischen UV(s) und AV(s) stimmig sein, weil 'Therapierfolg' vs. 'ps. Befindlichkeit' doch sehr sehr ähnlich sind?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

folgende User möchten sich bei strukturmarionette bedanken:
steffi_89

Re: Viele Kontrollvar. & kleine Stichprobe (multiple lineare

Beitragvon PonderStibbons » So 29. Jun 2014, 14:40

Mein erstes großes Problem ist, dass ich zahlreiche Kontrollvariablen testen möchte

Nicht ganz klar, worauf Du hinaus willst. Geht es nun tatsächlich nur
darum, den Einfluss konfundierter Faktoren zu kontrollieren? Oder
willst Du zusätzliche Hypothesen testen?
Nun möchte ich prüfen, ob die Therapie der Kinder sich positiv auf die psychische Befindlichkeit (erhoben mit 2 Fragebögen) und die Partnerschaft der Eltern (erhoben mit einem Fragebogen) auswirkt.

Hast Du denn eine Kontrollgruppe oder wenigstens
prä-post-Messungen?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
steffi_89

Re: Viele Kontrollvar. & kleine Stichprobe (multiple lineare

Beitragvon steffi_89 » Mo 30. Jun 2014, 11:49

strukturmarionette hat geschrieben:Hi,

das allererste und wichtigst ist m.E eine möglichst korrekte Spezifikation des Modells.

Kann denn bei Dir diese Trennung zwischen UV(s) und AV(s) stimmig sein, weil 'Therapierfolg' vs. 'ps. Befindlichkeit' doch sehr sehr ähnlich sind?

Gruß


Es handelt sich um den Therapieerfolg des Kindes und die psychische Befindlichkeit der Eltern (Die Eltern selber wurden nicht behandelt). Deshalb denke ich schon, dass meine AV/UV-Trennung okay ist, oder? :)

PonderStibbons hat geschrieben:
Mein erstes großes Problem ist, dass ich zahlreiche Kontrollvariablen testen möchte

Nicht ganz klar, worauf Du hinaus willst. Geht es nun tatsächlich nur
darum, den Einfluss konfundierter Faktoren zu kontrollieren? Oder
willst Du zusätzliche Hypothesen testen?
Nun möchte ich prüfen, ob die Therapie der Kinder sich positiv auf die psychische Befindlichkeit (erhoben mit 2 Fragebögen) und die Partnerschaft der Eltern (erhoben mit einem Fragebogen) auswirkt.

Hast Du denn eine Kontrollgruppe oder wenigstens
prä-post-Messungen?

Mit freundlichen Grüßen

P.
[/quote]

Ich möchte nur ausschließen, dass diese zahlreichen Kontrollariablen einen konfundierenden Einfluss haben. Anschließend würde ich nur die signifikanten Kontrollvariablen in mein endgültiges Modell aufnehmen und dann meine Hypothese testen, ob Therapieerfolg des Kindes mit der psychischen Befindlichkeit der Eltern zusammenhängt. Ich habe prä-post-Daten und arbeite daher mit den prä-post-Differenzwerten der jeweiligen Fragebögen.

Viele Grüße!
steffi_89
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: So 29. Jun 2014, 10:42
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Viele Kontrollvar. & kleine Stichprobe (multiple lineare

Beitragvon steffi_89 » Di 1. Jul 2014, 17:48

Hat jemand Tipps, wie ich am besten vorgehen sollte? Würde mich über Hilfe wirklich freuen!

LG!
steffi_89
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: So 29. Jun 2014, 10:42
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Viele Kontrollvar. & kleine Stichprobe (multiple lineare

Beitragvon strukturmarionette » Di 1. Jul 2014, 18:26

Hi,

Es handelt sich um den Therapieerfolg des Kindes und die psychische Befindlichkeit der Eltern (Die Eltern selber wurden nicht behandelt). Deshalb denke ich schon, dass meine AV/UV-Trennung okay ist, oder?


So ist das nachvollziehbar, denke ich.

Wenn dann allerdings bei n =10 etwas 15 Kontrollvars einbezogen würden, machte Inferenzstatistik kaum Sinn.
Auch sind bei nur N =10 (und dann zusätzlich Teilstichprobenn daraus) 19 Variablen problematisch.

Ansonsten wären möglich:
- Je Abhäniger AV Eine Multiple Lineare Regressionen
- Je AV Eine Hierarchische Lineare Multiple Regressionen für die zu kontrollierenden UV-Vars

Meine Betreuerin sagte aber, ich solle zunächst alle Variablen im Modell benutzen.


- Damit würde ich auch anfangen

ob überhaupt so wahnsinnig viele Kontrollvariablen sinnvoll/notwendig sind

- Nein

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Viele Kontrollvar. & kleine Stichprobe (multiple lineare

Beitragvon PonderStibbons » Mi 2. Jul 2014, 09:44

Das Problem des massiven overfittings und der dadurch fraglichen
Generalisierbarkeit durch derart viele Prädiktoren, bei lediglich
n=60, lässt sich auch durch Vorauswahl nach statistischen Kriterien
nicht beseitigen, weil das eben auch nur das Modell innerhalb der
gegebenen Stichprobe optimiert. Naheliegend wäre meines Erachtens
a) Kombination von Prädiktoren, falls sinnvoll möglich (Bildung eines
Index o.ä.) und/oder b) Auswahl nur weniger "Kontrollvariablen" nach
inhaltlichen Überlegungen und/oder basierend auf Ergebnissen von
Referenzstudien.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste