Hallo,
Die erste erforderliche Überlegung betrifft Deine Annahmen über die Skalenniveaus.
- Die erstbeidengenannten sind nicht nominalskaliert.
Ja, Bildungsniveau könnte auch ordinalskaliert sein. Aber Wenn ich mittels Clusteranalyse drei Kundentypen identifiziert habe, wieso sind die dann nicht nominalskaliert?
- Bei den beiden zweitgenannten scheint das Intervallskalenniveau künstlich kaputt gemacht zu sein.
Ja, da gebe ich dir grundsätzlich Recht. Aber es ist praktisch nicht möglich im Rahmen einer Befragung nach dem exakten Einkommen und dem exakten Alter zu fragen, ohne dabei sehr viele Ausfälle zu erhalten. Daher muss es ordinalskaliert sein.
Ich weiß zwar, dass ich bei der Verwendung von Assoziationsmaßen für nominale Daten, die ich für ordinale Daten anwende Informationen verschenke, aber für die Quantifizierung von mehr oder weniger offensichtlichen höchst signifikanten Zusammenhängen müsste das doch OK sein. Oder etwa nicht?
Außerdem noch eine Frage: Meine Kreuztabelle erhält ein Cramer V von etwa 0,217. Wie ist das nun zu werten?
Laut mir vorliegender Literatur existieren
"Für die Bewertung der Stärke eines durch Phi und Cramers V gemessenen Zusammenhangs [...] keine allgemeingültigen Regeln. Erfahrungsgemäß können bei Verwendung von Individualdaten mit großen Stichproben bivariate Assoziationen, die vom Betrag her kleiner als 0,1 sind, generell als schwach bezeichnet werden. Beträge zwischen 0,1 und 0,3 können als mäßig starke Beziehungen gelten, während Koeffizienten, die einen Betrag von 0,3 übersteigen, als starke Zusammenhänge eingestuft werden." (Maier und Rattinger 2000: 50)
Aber ist alles über 0,3 als starken Zusammenhang zu werten sinnvoll, wenn die Skala von 0 bis 1 reicht?