Hallo!
Ich bin gerade dabei, logistische Regressionen für dichotome abhängige Variablen zu berechnen. Manche der abhängigen Variablen sind dabei extrem ungleich verteilt. Die schlimmste Variable hat nur 60 mal 1 als Ausprägung (bei N = 2954), das heißt nur 2 % der Fälle sind 1. Unabhängige Variablen habe ich 13 im Modell. Vier sind kategoriale Variablen, ich habe in den Kreuztabellen nirgends 0-Häufigkeiten, das niedrigste sind 6 bzw. 8 als Ausprägungen. Ist das problematisch bzw. kann das problematisch werden? Gibt es Faustregeln, wie die maximale Verteilung sein soll? Gibt es dazu vielleicht irgendwo etwas nachzulesen?
Vielen Dank und liebe Grüße!