ich habe zwei Fragen zur logistischen Regression, die vielleicht auch etwas blöd sind, sich mir aber aus der mir vorliegenden Literatur nicht erschließen bzw. zu denen ich insgesamt nur sehr wenige Anhaltspunkte finden kann. Ich weiß, dass die logistische Regression nur dann sinnvoll geschätzt werden kann, wenn in einer Kreuztabelle aus AV und UV alle Zellen ausreichend besetzt sind.
Meine Fragen hierzu lauten:
1) Gilt das nur für die AV mit jeweils einer UV, oder muss bei einer multiplen Regression jede nur erdenkliche Kombination aus AV, UV1, ..., UVn empirisch gegeben sein?
2) Was mache ich, wenn bei meinen intervallskalierten UV (Skalen aus 4-7 Items), die ja recht viele Ausprägungen haben können, welche gerade in den sehr hohen bzw. sehr niedrigen Werten nicht immer in beiden Gruppen der AV empirisch gegeben sind (geschweige denn für jede erdenkliche Kombination mit allen anderen UV)? Sollte ich in dem Fall lieber einen Informationsverlust in Kauf nehmen und die Skalen umkodieren (z.B. Mediansplit)?
Ich bedanke mich im Voraus!
Viele Grüße
Schaumgummiball
