Guten Tag,
ich werte momentan Daten einer retrospektiven Analyse aus. Es gibt 2 Gruppen mit insgesamt 521 Patienten, welche in unterschiedlichen Abständen operiert wurden und ich möchte Prädiktoren für die In-Hospital-Mortalität ausfindig machen. Es stehen ungefähr 60 präopertive Variablen zur Auswahl, welche ich ungern alle in die logistische Regressionsanalyse reinpacken möchte. Ich nutze SPSS Version 23.
Nun komme ich nicht ganz unvorbereitet: ich habe die letzten 2 vollen Tage damit zugetragen jedes Youtube-Video zu Regressionsanalysen anzuschauen, aber was mir immernoch nicht ganz klar wird:
- wie wähle ich (statistisch, nicht nach klinischer Relevanz) meine Variablen aus?
Ich bislang alle klinisch relevant erscheinenden Variablen mittels bivariater Korrelation mit der Mortalität getestet. Bei hoher Signifikanz (p<0,05) habe ich die Variable ausgewählt und nun einzeln der logistischten Regression zugeführt.
Bsp: Niereninsuffizienz korrelliert mit Mortalität -> logistische Regression
Und nur wenn da jetzt signifikante Odds-Ratios rauskommen, sollte ich die Variable in der multivariaten logistischen Regression verwenden?
Eine weiter Frage: bei kategorialen Variablen in der log. Reg.: Bsp: Niereninsuffizienz (Antworten: Nein/Stadium1/Stadium2 ...bis 5 jeweils mit 0, 1, 2, ... 5 codiert)
- wenn ich diese einfüge und bei SPSS unter "kategoriale Variablen" anwähle, welchen Wert setze ich als Referenz?
Ich würde mich wirklich sehr über Antworten freuen!
Viele Grüße Lukas