Hallo zusammen!
Ich stehe zur Zeit vor folgendem Problem:
Habe Daten aus einer Befragung danach, wie viele Sitze ein Individuum in verschiedenen Aufsichtsräten innehat. Das ganze wurde kategorial erfasst, also entweder 0, 1, 2, 3, 4, oder >4 Sitze in Aufsichtsräten.
Ich wollte jetzt eigentlich messen, wie sich die Anzahl der Sitze eines Individuums auf eine abhängige Dummy-Variable auswirkt (binäre logistische Regression).
Nun macht mir blöderweise die letzte Kategorie einen Strich durch die Rechnung. Am liebsten wäre es mir, wenn ich zeigen könnte, das mehr Sitze = höhere Wahrscheinlichkeit für Dummy-Variable = 1 bedeutet. Im Moment bin ich jetzt so vorgegangen, dass ich die Kategorie >4 einfach zu "5" umcodiert habe.
Darf man das so machen? Hätte vllt auch jemand diesbezüglich einen Literatur-Tipp, da das Teil einer Master-Arbeit ist und ich das gerne zitieren würde, sofern das überhaupt koscher ist.
Beste Grüße und vielen Dank