Kategorien abschneiden und als metrische Variablen nutzen?

Fragen, die sich auf kein spezielles Verfahren beziehen.

Kategorien abschneiden und als metrische Variablen nutzen?

Beitragvon narcotik » Fr 17. Nov 2017, 12:32

Hallo zusammen!

Ich stehe zur Zeit vor folgendem Problem:

Habe Daten aus einer Befragung danach, wie viele Sitze ein Individuum in verschiedenen Aufsichtsräten innehat. Das ganze wurde kategorial erfasst, also entweder 0, 1, 2, 3, 4, oder >4 Sitze in Aufsichtsräten.

Ich wollte jetzt eigentlich messen, wie sich die Anzahl der Sitze eines Individuums auf eine abhängige Dummy-Variable auswirkt (binäre logistische Regression).

Nun macht mir blöderweise die letzte Kategorie einen Strich durch die Rechnung. Am liebsten wäre es mir, wenn ich zeigen könnte, das mehr Sitze = höhere Wahrscheinlichkeit für Dummy-Variable = 1 bedeutet. Im Moment bin ich jetzt so vorgegangen, dass ich die Kategorie >4 einfach zu "5" umcodiert habe.

Darf man das so machen? Hätte vllt auch jemand diesbezüglich einen Literatur-Tipp, da das Teil einer Master-Arbeit ist und ich das gerne zitieren würde, sofern das überhaupt koscher ist.

Beste Grüße und vielen Dank
narcotik
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: So 2. Dez 2012, 12:16
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Kategorien abschneiden und als metrische Variablen nutze

Beitragvon bele » Fr 17. Nov 2017, 12:43

1. Was spricht gegen Verfahren, die mit ordinalem Skalenniveau funktionieren, wie etwa eine einfache Spearman-Korrelation ?
2. Wie stark ist die Kategorie 5 besetzt? Kommt sie häufig vor, oder sind das Ausnahmen? Gibt es Informationen/begründete Annahmen darüber, ob in dieser Kategorie die meisten nur 5 oder 6 Aufsichtsratssitze haben oder ob viele auch 20 oder 30 haben?
3. Wieviele Individuen hast Du insgesamt, wieviele davon in welchen Kategorien?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5920
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1401 mal in 1387 Posts

Re: Kategorien abschneiden und als metrische Variablen nutze

Beitragvon narcotik » Fr 17. Nov 2017, 13:01

Hallo Bernhard, vielen Dank für deine zügige Antwort!

zu 1.) da ich das ganze gerne in einem relativ umfangreichen Modell zeigen wollte, mit der Interpretation "Erhöhung um einen Sitz bedeutet Erhöhung der Erfolgswahrscheinlichkeit um x%", daher denke ich dass die einfache Spearman-Korrelation eher wegfällt.

zu 2.) Die Kategorie ist blöderweise die am stärksten besetzte:
>4 194
0 153
1 62
2 102
3 87
4 66

Allerdings dürfte nur in Ausnahmefällen mehr als 5 Sitze da sein. Vorangegangene Studien haben ermittelt, dass die meisten 4-5 Sitze haben, also extreme Ausreißer wie 20 sind gar nicht möglich.

zu 3.) insgesamt sinds 664, verteilung s.o.

Danke nochmals!
narcotik
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: So 2. Dez 2012, 12:16
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Kategorien abschneiden und als metrische Variablen nutze

Beitragvon bele » Fr 17. Nov 2017, 14:27

Statistik ist ja die Kunst, auch aus messfehlerbehafteten Daten noch Schlüsse zu ziehen und Statistik ist die Anwendung perfekter mathematischer Modelle auf eine nicht-perfekte Welt. Wenn die Randgruppe 5 bis nahezu vollständig aus 5 besteht, dann kann man sich natürlich überlegen, ob man mit dem Fehler leben kann, der entsteht, wenn man ">=5" mit 5 gleichsetzt.

Ansonsten sind Deine anderen Gruppen so gut besetzt, dass man auch überlegen kann, die Gruppe fünf wegfallen zu lassen und nur mit Gruppe 0 bis 4 zu rechnen.

Man kann auch beide Modelle rechnen und schauen, ob ungefähr das gleiche herauskommt. Wenn das Gleiche herauskommt, dann hilft das bei der Argumentation für eines der beiden Vorgehen. Wenn wirklich erheblich unterschiedliches herauskommt, dann hat man Erklärungsbedarf.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5920
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1401 mal in 1387 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste