Fragen zur binär logistischen Regression

Alle Verfahren der Regressionanalyse.

Fragen zur binär logistischen Regression

Beitragvon cathea533 » Sa 9. Mär 2024, 18:31

Hallo,

ich möchte in einer Studie untersuchen, welche Faktoren einen Einfluss aus das Auftreten postoperativer Komplikationen haben. Mein Plan war, zunächst durch bivariate Analysen nach signifikanten Zusammenhängen zu suchen und die signifikanten Variablen als unabhängige Variablen in eine binär logistische Regression aufzunehmen (Abhängige Variable "Auftreten von Komplikationen ja/nein"). Die Stichprobe enthält 100 Patienten. Ich habe zunächst mittels Chi-Quadrat- sowie Mann-Whitney-U-Tests nach signifikanten Zusammenhängen geschaut. Nur für die Variablen Alter (metrisch) und Vorerkrankungen (dichotom) ergaben sich ein signifikaner Zusammenhang, andere Variablen bei denen ich einen Zusammenhang vermutet hätte (OP-Verfahren, OP-Dauer, Geschlecht, Verletzungsausmaß), zeigten keine signifikanten Zusammenhang.
Wenn ich Alter und Vorerkankungen in die Regression aufnehme (Methode Einschluss) zeigt sich das Modell als ganzes signifikant (p < 0,05), die Regressionskoeffizienten beide nicht (p= 0,312 und p= 0,119). Wenn ich jeweils nur eine UV aufnehme, sind beide jeweils signifikant. Wenn ich noch weitere UV aufnehme, die in den bivariaten Analysen nicht signifikant waren, bleibt das Modell teilweise noch signifikant, aber keiner der Regressionskoeffizienten.
Ich benutze SPSS

Nun ergeben sich bei mir ein paar Fragen:
1.) Macht es Sinn, Variablen in die Regression mit aufzunehmen, die in den bivariaten Analysen keine signifikanten Ergebnisse erbrachten? Ich würde denken, weiß aber nicht ob man das als Argument nutzen kann.
2.) Die Gruppengrößen der abhängigen Variablen unterscheiden sich sehr (22 Patienten haben Komplikationen, 78 haben keine). Wäre das ein Argument gegen die Durchführung einer Regression?
3.) Ich vermute eine Multikollinearität zwischen einigen Variablen, da sich in den bivariaten Analysen gezeigt hat, dass z.B. alte Leute signifikant mehr Vorerkankungen haben. Kann das ein Grund sein, warum die Regressionskoeffizienten nicht mehr signifikant werden, wenn beide in der Regression sind?

Ich hoffe, ich habe mich einimaßen verständlich ausgedrückt und freue mich über Tipps und Anregungen.
Vielen Dank!
cathea533
Einmal-Poster
Einmal-Poster
 
Beiträge: 1
Registriert: Sa 9. Mär 2024, 17:45
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Fragen zur binär logistischen Regression

Beitragvon PonderStibbons » Sa 9. Mär 2024, 19:57

Mein Plan war, zunächst durch bivariate Analysen nach signifikanten Zusammenhängen zu suchen und die signifikanten Variablen als unabhängige Variablen in eine binär logistische Regression aufzunehmen (Abhängige Variable "Auftreten von Komplikationen ja/nein").

Ein (anscheinend unausrottbarer) Kardinalfehler. Das abschließend gerechnete Modell hat keine
Ahnung davon, dass die einbezogenen Prädiktoren aus einer größeren Zahl anhand eines
statistischen Kriteriums aussortiert wurden. Demenentsprechend liefert die multiple Regression
falsche p-Werte,, eine unrealistische Vorhersageleistung und ein überangepasstes und nicht
generalisierbares Modell.

Zudem können auch "nicht-signifikante" Variablen in einem multiplen Regressionmodell von
Bedeutung sein.
Die Stichprobe enthält 100 Patienten.

Insbesondere relevant ist die Angabe, wie sich die 100 auf die beiden Ergebniskategorien verteilen.
Die statistischen Möglichkeiten bemessen sich vor allem an der Fallzahl in der kleineren Ergebniskategorie.
1.) Macht es Sinn, Variablen in die Regression mit aufzunehmen, die in den bivariaten Analysen keine signifikanten Ergebnisse erbrachten? Ich würde denken, weiß aber nicht ob man das als Argument nutzen kann.

Es ergibt Sinn ein Modell aufzustellen, das theoretisch bzw. praktisch begründet und relevant ist. Vorab-Testerei hingegen
ist ein No-Go (s.o.).
2.) Die Gruppengrößen der abhängigen Variablen unterscheiden sich sehr (22 Patienten haben Komplikationen, 78 haben keine). Wäre das ein Argument gegen die Durchführung einer Regression?

Nach den gängigen Orientierungsgrößen erlaubt das ein logistisches Regressionsmodell mit 2 oder 3 Prädiktoren.

Bei so einer Datenlage könnte man sich eventuell auf die Darstellung der bivariaten Beziehungen beschränken,
wie in dem "Vorabtestung"-Schritt bereits geschehen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Fragen zur binär logistischen Regression

Beitragvon bele » Sa 9. Mär 2024, 20:02

Hallo,

cathea533 hat geschrieben:Wenn ich Alter und Vorerkankungen in die Regression aufnehme (Methode Einschluss) zeigt sich das Modell als ganzes signifikant (p < 0,05), die Regressionskoeffizienten beide nicht (p= 0,312 und p= 0,119).


Wahrscheinlich sind Alter und Vorerkrankungen miteinander korrelliert. Das wäre zu erwarten und das würde mühelos erklären, warum das Modell sich nicht entscheiden kann, von welchem Prädiktor die wesentliche Information kommt.

cathea533 hat geschrieben:Nun ergeben sich bei mir ein paar Fragen:
1.) Macht es Sinn, Variablen in die Regression mit aufzunehmen, die in den bivariaten Analysen keine signifikanten Ergebnisse erbrachten? Ich würde denken, weiß aber nicht ob man das als Argument nutzen kann.


Ja. Variablen können in einem multiplen Modell durchaus hilfreich sein, auch wenn sie bivariat nicht signifikant werden.

2.) Die Gruppengrößen der abhängigen Variablen unterscheiden sich sehr (22 Patienten haben Komplikationen, 78 haben keine). Wäre das ein Argument gegen die Durchführung einer Regression?


Nein, aber für Überlegungen zur Power des Modells ist die kleinere der beiden Gruppen relevant, nicht die größere. Weitere Patienten mit Komplikationen würden sehr viel mehr helfen als weitere Patienten ohne Komplikationen.
Wenn wir zum Beispiel annehmen, dass Du nur zwei verschiedene OP-Verfahren untersuchst, dann hast Du gerade mal 22 Komplikationen aus denen Du schließen willst, welches von zwei Verfahren häufiger Komplikationen macht. Kann man sich schon vorstellen, dass das vielleicht etwas knapp ist.

3.) Ich vermute eine Multikollinearität zwischen einigen Variablen, da sich in den bivariaten Analysen gezeigt hat, dass z.B. alte Leute signifikant mehr Vorerkankungen haben. Kann das ein Grund sein, warum die Regressionskoeffizienten nicht mehr signifikant werden, wenn beide in der Regression sind?


Hatte ich oben schon geschrieben, bevor ich das hier gesehen habe. Klare Antwort: Ja!

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5920
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1401 mal in 1387 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron