Verteilung d. abh. Variable (dichotom) bei logistischer Reg.

Alle Verfahren der Regressionanalyse.

Verteilung d. abh. Variable (dichotom) bei logistischer Reg.

Beitragvon bleichmittel » Mi 6. Mär 2013, 01:38

Hallo!

Ich bin gerade dabei, logistische Regressionen für dichotome abhängige Variablen zu berechnen. Manche der abhängigen Variablen sind dabei extrem ungleich verteilt. Die schlimmste Variable hat nur 60 mal 1 als Ausprägung (bei N = 2954), das heißt nur 2 % der Fälle sind 1. Unabhängige Variablen habe ich 13 im Modell. Vier sind kategoriale Variablen, ich habe in den Kreuztabellen nirgends 0-Häufigkeiten, das niedrigste sind 6 bzw. 8 als Ausprägungen. Ist das problematisch bzw. kann das problematisch werden? Gibt es Faustregeln, wie die maximale Verteilung sein soll? Gibt es dazu vielleicht irgendwo etwas nachzulesen?

Vielen Dank und liebe Grüße!
bleichmittel
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Fr 30. Nov 2012, 13:01
Danke gegeben: 7
Danke bekommen: 0 mal in 0 Post

Re: Verteilung d. abh. Variable (dichotom) bei logistischer

Beitragvon PonderStibbons » Mi 6. Mär 2013, 10:31

Die verbreitete Faustregel ist pro Prädiktor 10 events
(=Zahl der Fälle in der geringer besetzten Kategorie).
Gibt es dazu vielleicht irgendwo etwas nachzulesen?

http://tinyurl.com/d6fgeta

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
bleichmittel

Re: Verteilung d. abh. Variable (dichotom) bei logistischer

Beitragvon bleichmittel » Mi 6. Mär 2013, 15:10

Spitze! Danke. Ich gehe mal davon aus, dass man bei Dummy-Variablen von ordinalen/nominalen Variablen die Dummies gezählt werden (und nicht die zu Grunde liegende Variable) - damit hätte ich 16 Variablen. Muss mir das jetzt näher anschaun, ich möchte aber eigentlich auch die unabhängigen Variablen nicht reduzieren, weil sie alle ihre theoretische Berechtigung haben und auch das Nicht-Vorhandensein von signifikanten Effekten interessant für mich ist.

Jedenfalls: Danke! Genau wonach ich gesucht habe!
bleichmittel
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Fr 30. Nov 2012, 13:01
Danke gegeben: 7
Danke bekommen: 0 mal in 0 Post

Re: Verteilung d. abh. Variable (dichotom) bei logistischer

Beitragvon PonderStibbons » Mi 6. Mär 2013, 15:47

Du willst mit 16 Variablen 60 Fälle vorhersagen?
Die Ergebnisse aus solchen Veranstaltungen
sind in der Regel fraglich und instabil (nicht
generalisierbar, nicht übertragbar)

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 9 Gäste