Hallo zusammen,
ich habe folgendes Problem. Ich habe ein Sample von n=200.000 mit einer binär abhängingen Variable. Da ich nur 512 Einsen habe und der Rest sind Nullen wollte ich die reLogit Methode von King und Zeng (2001) anwenden. Es gibt ja zwei Möglichkeiten: Prior correction und Weighting. Jetzt ist mir gestern aufgefallen, wenn ich allerdings das ganze Sample benutze, dann sind tau und y quer ja gleich, und die Korrektur Terme kürzen sich raus. Jetzt sitze ich gerade auf dem Schlauch, warum ich überhaupt eine Rare Events Reregression benutzen soll. Die Autoren argumentieren mit einem bias in Finite Samples. Doch was ist ein Finite Sample genau, ich konnte in der Literatur keine befriedigende Erklärung finden.
Ich arbeite mit R und wenn ich den glm Befehl auf alle 200.000 Beobachtungen laufen lasse, habe ich Recht schnell ein Ergebnis. Ist dieses Ergebnis denn nun auch aussagekräftig? Wie ich das verstehe eignet sich reLogit doch nur für Choice-Based Samples. Und da ich meine Daten einfach bekommen habe, könnte ich doch auch einfach alle Daten in die Analyse reinschmeißen ohne einen Bias zu korrigeren!? Oder übersehe ich da gerade was.
Wie schon gesagt: eine kurze Erklärung über Finite Samples könnte mir evtl. schon weiterhelfen.
LG
Sush