Dichotomisierung, eta

Fragen, die sich auf kein spezielles Verfahren beziehen.

Dichotomisierung, eta

Beitragvon rofl92 » Fr 7. Apr 2017, 19:09

Hallo,

ich schreibe momentan eine Arbeit zum Zusammenhang zwischen Fernsehkonsum und Lebenszufriedenheit (LZF). Die Analysen wollte ich mit Kreuztabellen und eta durchführen. Die Variable Fernsehkonsum ist ordinal, LZF metrisch. Also wäre der erste Schritt, ein eta zwischen Fernsehkonsum und LZF zu rechnen. Dazu wollte ich Fernsehkonsum dichotomisieren. Als nächstes wollte ich den Zusammenhang auf intervenierende Varaiblen überprüfen, ob diese den Zusammenhang erklären können. Dazu habe ich sechs Kontrollvariablen, die manchmal ordinal, manchmal metrisch sind. Diese wollte ich ebenfalls alle dichotomisieren. Eine davon hat 5 Ausprägungen. Diese kann ich also nicht dichotomisieren. Entweder ich lasse sie so, oder ich lasse sie ganz weg. Bei den anderen kommen bei einer Dichotomisierung teilweise zweifelhafte Verteilungen von etwa 80:20 oder noch weniger heraus. Unterteilungen in 3 Kategorien machen auch keinen Sinn. Also bleibt mir eigentlich nur, entweder alle Variablen so zu lassen wie sie sind (mal ordinal, mal metrisch) oder alle (bis auf die abhängige Variable LZF) zu dichotomisieren, auch wenn die Verteilungen nicht optimal sind. Bei Eta können die unabhängigen Variablen ja theoretisch jedes Messniveau haben.

Was würdet ihr mir raten? Oder ist das sowieso ein Problem, wenn die berechneten Zusammenhänge über eta auf einer unterschiedlichen Anzahl von Kategorien pro Variable basieren? Also mal odinal, mal metrisch, mal mit 4, mal mit 6, mal mit 11 Ausprägungen. Müssen diese nicht einheitlich sein? Wenn alle bis auf LZF dichotom wären, wäre es halt einheitlich.

How satisfied with life as a whole
Kumulative Prozente
Extremely dissatisfied 0,7
1 1,5
2 2,6
3 5,1
4 8,4
5 15,6
6 21,5
7 38,4
8 67,5
9 87,1
Extremely satisfied 100,0


TV watching, total time on average weekday
Kumulative Prozente
No time at all 5,8
Less than 0,5 hour 12,7
0,5 hour to 1 hour 28,6
More than 1 hour, up to 1,5 hours 44,6
More than 1,5 hours, up to 2 hours 62,5
More than 2 hours, up to 2,5 hours 77,1
More than 2,5 hours, up to 3 hours 88,8
More than 3 hours 100,0


Allowed to decide how daily work is organised
Kumulative Prozente
I have/had no influence 9,1
1 10,6
2 14,0
3 16,8
4 18,6
5 25,9
6 30,6
7 41,9
8 60,8
9 72,1
I have/had complete control 100,0


Most people can be trusted or you can't be too careful
Kumulative Prozente
You can't be too careful 3,6
1 5,5
2 11,0
3 22,7
4 32,1
5 56,4
6 69,4
7 86,8
8 96,7
9 98,7
Most people can be trusted 100,0


Important to be rich, have money and expensive things
Kumulative Prozente
Very much like me 1,4
Like me 7,0
Somewhat like me 22,6
A little like me 43,4
Not like me 82,4
Not like me at all 100,0


Feeling about household's income nowadays
Kumulative Prozente
Living comfortably on present income 42,0
Coping on present income 90,4
Difficult on present income 97,7
Very difficult on present income 100,0


Feeling of safety of walking alone in local area after dark
Kumulative Prozente
Very safe 27,9
Safe 80,3
Unsafe 96,8
Very unsafe 100,0


Take part in social activities compared to others of same age
Kumulative Prozente
Much less than most 7,5
Less than most 39,2
About the same 80,8
More than most 97,7
Much more than most 100,0



Liebe Grüße
Melanie
rofl92
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 7. Apr 2017, 13:14
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Dichotomisierung, eta

Beitragvon PonderStibbons » Fr 7. Apr 2017, 21:53

Die Variable Fernsehkonsum ist ordinal, LZF metrisch. Also wäre der erste Schritt, ein eta zwischen Fernsehkonsum und LZF zu rechnen.

Wozu? Das kannst Du mit einer Spearman-Rangkorrelation analysieren. Eine ordinale Variable sollte man nicht runterstufen zu ener kategorialen, das vernichtet Informationen.
Dazu wollte ich Fernsehkonsum dichotomisieren.

Oje, wieso das denn? Das vernichtet noch mehr Informationen und führt im schlimmsten Fall zu irreführenden Ergebnissen. Man sollte praktisch niemals dichotomisieren.

Als nächstes wollte ich den Zusammenhang auf intervenierende Variablen überprüfen, ob diese den Zusammenhang erklären können.

Wie groß ist denn Deine Stichprobe?

Inhaltlich finde ich Deine intervenierenden (? - meinst Du damit konfundierte Variablen/Kontrollvariablen? oder tatsächlich Mediatorvariablen?) etwas schwer nachvollziehbar.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Dichotomisierung, eta

Beitragvon rofl92 » Sa 8. Apr 2017, 12:39

Die Kontrollvariablen sollten eigentlich den Zusammenhang zwischen Fernsehkonsum und LZF erklären. Also sollte nach Kontrolle die erklärte Varianz eigentlich ein bisschen geringer werden. Diese sind auch in ihrer Verwendung durch die Literatur abgesichert. 3000 Fälle habe ich. Die Analyse mit eta habe ich mit dem Dozenten so abgesprochen. Die Frage ist, wie ich das ganze recodiere oder ob ich die Variablen alle so lassen soll. Mit jeweils 2 Ausprägungen ist die Darstellung halt möglichst einfach. Meinen Berechnungen zufolge kommt sowieso in keinem der Zusammenhänge egal wie die Variablen angeordnet sind ein Zusammenhang heraus (eta-Werte zu gering). Das ist aber in Ordnung so --> Falsifikation.
rofl92
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 7. Apr 2017, 13:14
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Dichotomisierung, eta

Beitragvon PonderStibbons » Sa 8. Apr 2017, 15:33

Die Kontrollvariablen sollten eigentlich den Zusammenhang zwischen Fernsehkonsum und LZF erklären.

Als Mediatoren? Oder doch als konfundierte Variablen?
Meinen Berechnungen zufolge kommt sowieso in keinem der Zusammenhänge egal wie die Variablen angeordnet sind ein Zusammenhang heraus (eta-Werte zu gering).

Mit n=3000 kannst Du getrost das gängige Verfahren anwenden, aus einer ordinalen
Variable mit k Stufen eine Reihe von dummy-Variaben zu machen (Anzahl k-1).
Das ist aber in Ordnung so --> Falsifikation.

Bei n=3000 würde ich bei durchgehend nichtsignifikanten Ergebnissen mal schauen,
ob da nicht markante Fehler vorliegen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Dichotomisierung, eta

Beitragvon rofl92 » Sa 8. Apr 2017, 16:37

Also die Kontrollvariablen sind dann Mediatoren :)

Die Unterteilung von Fernsehkonsum in zwei Kategorien (Wenig- und Vielseher) oder drei Kategorien (Nicht,- Wenig- und Vielseher) ist eigentlich gängig (kommt aus der Kultivierungsforschung von George Gerbner).

Ich habe das halt so im Studium gelernt, dass man normalerweise Partialtabellen für die Drittvariablen erstellt und diese dazu in 2 Kategorien aufteilt. Nur machen mich die ungleichen Verteilungen von z. B. 80:20 stutzig, wobei dass bei 3000 Fällen ja immer noch 600 Fälle für die kleinere Kategorie wären.

Eine andere Frage bezieht sich auf die entsprechenden Analysen mit eta. Einen Signifikanzwert auf Basis des F-Tests bekomme ich mit SPSS ja nur mit einer ANOVA. Da weiß ich dann aber auch nicht, wie ich das mit den Kontrollvariablen mache. Ich kann ja da nur eine unabhängige Variable auswählen. Oder kann ich vorher den Datensatz jeweils mit sort cases by/split file by pro Kontrollvariable splitten, um den Signifikanzwert mit der ANOVA zu bekommen. Sonst müsste ich es ja händisch machen. Ein anderer Weg mit SPSS fällt mir nicht ein.

Danke für deine Hilfe,
Melanie
rofl92
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 7. Apr 2017, 13:14
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Dichotomisierung, eta

Beitragvon PonderStibbons » Sa 8. Apr 2017, 17:43

Also die Kontrollvariablen sind dann Mediatoren :)

Mediatoranalysen sind allerdings anders angelegt, als einfach nur zusätzliche Prädiktoren in die Regression einzubeziehen.
Die Unterteilung von Fernsehkonsum in zwei Kategorien (Wenig- und Vielseher) oder drei Kategorien (Nicht,- Wenig- und Vielseher) ist eigentlich gängig (kommt aus der Kultivierungsforschung von George Gerbner).

Gängig heißt ja nicht zwingend sinnvoll. Aber wenn das gängig ist, stellt sich die Frage, wieso das nicht von vornherein so erhoben wurde, statt dass man eine andere Variable beliebig (und überflüssigerweise) zurechtschnitzt.
Eine andere Frage bezieht sich auf die entsprechenden Analysen mit eta.

Eta ist an sich ein Effekstärkemaß, keine Analyse.
Einen Signifikanzwert auf Basis des F-Tests bekomme ich mit SPSS ja nur mit einer ANOVA. Da weiß ich dann aber auch nicht, wie ich das mit den Kontrollvariablen mache.

Ich dachte, das wären Mediatoren?
Ich kann ja da nur eine unabhängige Variable auswählen. Oder kann ich vorher den Datensatz jeweils mit sort cases by/split file by pro Kontrollvariable splitten, um den Signifikanzwert mit der ANOVA zu bekommen. Sonst müsste ich es ja händisch machen. Ein anderer Weg mit SPSS fällt mir nicht ein.

Nüchtern und ohne bös sein zu wollen festgestellt, hast Du komplett keine Ahnung von Statistik, schreibst aber eine auf statistischen Analysen beruhende Arbeit? Gibt es denn da als Aushilfe keine Beratung? NB, Andy Fields "Discovering Statistics using SPSS" soll für Anfänger recht gut sein.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 12 Gäste

cron