Binär-logistische Regression – Stichprobengröße diskutieren

Alle Verfahren der Regressionanalyse.

Binär-logistische Regression – Stichprobengröße diskutieren

Beitragvon AnneK » Fr 9. Aug 2013, 21:45

Hallo die Runde,

ich habe mehrere binär-logistische Regressionen mit einem bzw. zwei Prädiktoren und verschiedenen dichotomen Kriterien (0, 1) gerechnet.

Die Stichproben unter den zwei Ausprägungen des Kriteriums ist sehr ungleich verteilt.
--> N ist für "0" immer größer als für "1" (also z. B. für 0 habe ich 45 Werte, für 1 habe ich 11 Werte)
--> Viele Werte, vor allem für "1", liegen bei N < 25 --> Backhaus (2000) empfiehlt für jede Ausprägung mindestens 25 Werte, da die Maximum-Likelihood-Schätzungen die notwendigen Verteilungseigenschaften nur bei großen Stichprobenumfänge aufweisen

Nun soll ich das in meiner Arbeit methodenkritisch diskutieren. :shock: Was kann man dazu sagen? Heißt das, dass ich womöglich deutlichere Effekte gefunden hätte, wenn die Bedingung der größeren Stichprobe erfüllt worden wäre? Hat das was mit der Robustheit des Verfahrens zu tun?

Danke SEHR für Hinweise!! :)

Gruß
Anne
AnneK
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mo 5. Aug 2013, 11:11
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Binär-logistische Regression – Stichprobengröße diskutie

Beitragvon daniel » Fr 9. Aug 2013, 22:40

Was kann man dazu sagen?
[...]
Hat das was mit der Robustheit des Verfahrens zu tun?


Maximum-Likelihood Schätzer sind Konsistent und Effizient -- allerdings beruht das Verfahren alleine auf Asymptotik. Backhaus mag mit seinen 25 Fällen pro Kategrie eine nette Dauemnregel aufgestellt haben, aber ich denke bei einem gesamt N von weniger als 200 (es gibt Quellen, die 500 nennen) würde ich die Ergebnisse mit Vorsicht interpretieren.

Heißt das, dass ich womöglich deutlichere Effekte gefunden hätte, wenn die Bedingung der größeren Stichprobe erfüllt worden wäre?


Ich weiß nicht, was Du mit "deutlich" meinst. Du könntest unter Umständen kompett andere Ergebnisse bekommen, wenn die Stichprobe größer wäre. Im besten Fall wären die Punktschätzer gleich und die Standardfehler kleiner. Leider kannst Du das vermutlich nicht prüfen.

Mein Ratschlag: Schätze zusätzlich zu den binären logistischen Regressionen lineare Wahrscheinlichkeitsmodelle (LPM) und vergleiche die Ergebnisse.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 7 Gäste

cron