Richtung einer Korrelation auf nominaler Skala

Bivariate Korrelation, partielle Korrelation und Rangkorrelation.

Richtung einer Korrelation auf nominaler Skala

Beitragvon nils » Di 4. Feb 2014, 22:01

Hallo, ich sags lieber gleich vorweg: ich bin ein ziemlicher Neuling was Statistik angeht. Für meine Abschlussarbeit muss ich eine Online-Umfrage mit SPSS 21 auswerten.

Nun ist es so, dass die meisten Daten ordinal bzw. teilweise auch nominal skaliert sind.
Ich möchte auf Korrelationen zwischen den Fragen prüfen. Für den ordinal skalierten Teil der Daten komme ich gut zurecht.

Nun möchte ich jedoch auch prüfen ob einige Antworten der Fragen der Umfrage mit nominal skalierten Daten korrelieren.

Mein Ansatz:
1) Prüfen auf signifikanz des Zusammenhangs: Chi-Quadrat-Test
2) Prüfen der Stärke der Korrelation durch Phi, Cramer-V
3) Prüfen der Richtung der Korrelation -->negativ oder positiver Zusammenhang = ???? Ist das überhaupt möglich?

Obwohl ich schon viel herumgesucht habe, finde ich einfach nirgends ein Maß für die Richtung der Korrelation von nominalen Daten. Manchmal lese ich etwas von lamda als Richtungsmaß, dann wieder lese ich, dass lambda nur Werte von 0-1 annehmen kann und daher doch keine RIchtung anzeigt. Gelegentlich lese ich auch in seriösen Texten wie Büchern dass die Leute Spearman's rho verwenden um Zusammenhänge zwischen nominalen Daten zu prüfen. Laut meinen Informationen, sollte dies jedoch ein Verstoß darstellen, da Spearman's rho mindestens ordinal skalierte Daten benötigt. Kann man das echt machen bzw. wird das gemacht?

Hier nochmal DIE Frage auf die ich dringend eine Antwort suche (und ein kleines Beispiel):
Wie erkenne ich ob eine Korrelation positiv oder negativ ist, wenn ich mit (teilweise) [b]nominalen Daten arbeite? [/b]

Beispiel:

Variable A) Frage 1: Wie gut kennen Sie sich mit XY aus?
A1=sehr gut --> Ausprägung 1
A2= mittel --> Ausprägung 2
A3= schlecht --> Ausprägung 3

Variable B)Geschlecht
A1=männlich --> Ausprägung 0
A2= weiblich --> Ausprägung 1

Chi-Quadrat, sagt mir es besteht ein signifikanter Zusammenhang zwischen Variable A und B (p=0,01), Cramer-V und Phi sagen mir der Zusammenhang sei schwach (0,125). Wie finde ich heraus ob der Zusammenhang lautet "Männer gaben eher an sich sehr gut auszukennen" oder "Frauen gaben eher an sich sehr gut auszukennen"?
nils
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Di 4. Feb 2014, 21:39
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Richtung einer Korrelation auf nominaler Skala

Beitragvon PonderStibbons » Mi 5. Feb 2014, 09:49

1) Prüfen auf signifikanz des Zusammenhangs: Chi-Quadrat-Test
2) Prüfen der Stärke der Korrelation durch Phi, Cramer-V

Das ist dich zweimal dasselbe. Oder meinst Du unter b) mit "Prüfen"
einfach nur "Berechnen eines Korrelationskoeffizienten"?
3) Prüfen der Richtung der Korrelation -->negativ oder positiver Zusammenhang = ???? Ist das überhaupt möglich?

Welchen Sinn sollte das haben? Kategorien haben doch keine Richtung.
Laut meinen Informationen, sollte dies jedoch ein Verstoß darstellen, da Spearman's rho mindestens ordinal skalierte Daten benötigt. Kann man das echt machen bzw. wird das gemacht?

Nein.
Variable A) Frage 1: Wie gut kennen Sie sich mit XY aus?
A1=sehr gut --> Ausprägung 1
A2= mittel --> Ausprägung 2
A3= schlecht --> Ausprägung 3
Variable B)Geschlecht
A1=männlich --> Ausprägung 0
A2= weiblich --> Ausprägung 1

Da ist ein U-Test angebracht. Die Behandlung der ordinalen Variable A
als kategorial wäre Informationsverschwendung.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Richtung einer Korrelation auf nominaler Skala

Beitragvon nils » Mi 5. Feb 2014, 10:35

Hallo und danke für die schnelle antwort (ich weiss das wirklich zu schätzen).
Das ist doch zweimal dasselbe. Oder meinst Du unter b) mit "Prüfen"
einfach nur "Berechnen eines Korrelationskoeffizienten"?

Also laut meinen Informationen sagt der Chi-Quadrat-Test nur etwas über die Signifikanz und nicht über die Stärke einer Korrelation aus.
Daher habe ich phi bzw cramer berechnet um zu sehen ob es sich um eine starke, mittelstarke, schwache usw. korrelation handelt

3) Prüfen der Richtung der Korrelation -->negativ oder positiver Zusammenhang = ???? Ist das überhaupt möglich?

Welchen Sinn sollte das haben? Kategorien haben doch keine Richtung.

Ich weiss nicht genau was jetzt mit kategorien gemeint ist. meinst du die ausprägungen der nominalen variable (geschlecht)? Ich habe ja ausprägungen für diese nominale variable vergeben, sowas wie männlich=0, weiblich=1. damit müsste es doch eigentlich möglich sein zu berechnen, ob jetzt höhere werte in der geschlechtsvariable (z.b. 1=weiblich, weil höher als 0=männlich) mit höheren ausprägungen in der Varibale" wie gut kennen sie sich aus" (z.B. 3=schlecht) korrelieren oder? dann wäre das doch ein positiver zusammenhang, dachte ich zumindest. wie gesagt ich kenne mich nicht so gut aus.


Aber,ich sehe worauf du hinaus willst: ich habe anscheinend ungepaarte daten vorliegen (was auch immer das nun wieder heissen mag) und daher nutzte ich wohl generell den falschen test und hätte informationsverlust, richtig? habe mir ein video zum mann-whitney-U-test auf youtube angeschaut und stelle fest dass selbst das im video gewählte beispiel beinahe meinem entspricht. (der vollständigkeit halber hier der link: http://www.youtube.com/watch?v=7iTvv3m9d_g)
dennoch auch hier die frage: stelle ich damit nicht lediglich fest OB ein signifikanter zusammenhang besteht?? Ich weiss dann doch immer noch nicht, welcher zusammenhang das ist, oder? Das ist das was ich vorher mit Richtung meinte. Ich wüsste dann halt noch gerne, ob sich jetzt die männer in meinem beispiel besser informiert fühlen oder die frauen. das konnte man bei spearman doch so nett am vorzeichen ablesen.
nils
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Di 4. Feb 2014, 21:39
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Richtung einer Korrelation auf nominaler Skala

Beitragvon PonderStibbons » Mi 5. Feb 2014, 11:11

Also laut meinen Informationen sagt der Chi-Quadrat-Test nur etwas über die Signifikanz und nicht über die Stärke einer Korrelation aus.

Ja, die in der Stichprobe, mit dem Stichprobenfehler behaftet.
Du hast nicht beschrieben, welchem Zweck das im Kontext Deiner
Studie dient.
dann wäre das doch ein positiver zusammenhang, dachte ich zumindest.

Nur, weil Du zur leichteren Behandlung die Geschlechter
mit Ziffern codierst, wird doch aus einer kategorialen Skala
keine numerische. Wenn statt m=0 und w=1 mit m=1 und w=2

EDIT: Gemeint war: m=1 und w=0

codiert würde, würde aus dem "postiven" ein "negativer"
Zusammenhang. Das ist doch willkürlich und sinnlos.
ich habe anscheinend ungepaarte daten vorliegen (was auch immer das nun wieder heissen mag) und daher nutzte ich wohl generell den falschen test und hätte informationsverlust, richtig?

Nein, es geht nicht um gepaart/ungepaart, sondern um das Skalennivau.
groß-größer-am größten ist ein ordinales Niveau, rot-blond-braun ist
kategorial, unabhängig davon, dass man beide Skalen mit 1/2/3 codieren
könnte.
stelle ich damit nicht lediglich fest OB ein signifikanter zusammenhang besteht?

Du kannst sehen, ob Männer oder Frauen die höheren Rangsummen haben.
Cramers V und dergleichen wäre unpassend, weil es die Informationen nicht
ausschöpft. Wie gesagt weiß ich aber nicht, wozu die zusätzliche Ausgabe
verschiedener Korrelationskoeffizienten hier groß dienen soll. Man kann sich, um
zu erkennen, worin Zusammenhänge bestehen, doch einfach die Deskriptivstatistiken
ansehen (z.B. Kreuztabellen mit Prozentangaben).

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Richtung einer Korrelation auf nominaler Skala

Beitragvon nils » Mi 5. Feb 2014, 11:26

Man kann sich, um zu erkennen, worin Zusammenhänge bestehen, doch einfach die Deskriptivstatistiken
ansehen (z.B. Kreuztabellen mit Prozentangaben).

ja, das habe ich bereits gemacht, ich dachte nur, ich müsste das auch irgendwie statistisch nachweisen.

Nur, weil Du zur leichteren Behandlung die Geschlechter
mit Ziffern codierst, wird doch aus einer kategorialen Skala
keine numerische. Wenn statt m=0 und w=1 mit m=1 und w=2
codiert würde, würde aus dem "postiven" ein "negativer"
Zusammenhang. Das ist doch willkürlich und sinnlos.

hmm, das stimmt. hatte mich schon gewundert, warum sich in den ergebnissen nichts ändert, als ich die skala mal testweise verdreht hatte. hätte ich auch echt selbst drauf kommen können.

also nochmal für ganz blonde (mich): ich führe den mann-whitney-u-test durch, stelle fest ob der unterschied signifikant ist und schaue dann in die kreuztabelle und mehr optionen habe ich nicht, korrekt?

eine kleine abschließende frage noch: wozu benutzt man denn den chi-quadrat-test überhaupt noch? für den fall, dass ich bei ZWEI nominal skalierte variablen auf korrelation prüfen möchte? Sorry, wenn ich immer wieder frage und mir ist klar, dass das für dich ziemlich einfacher kram ist, aber ich habe mich noch nie zuvor mit diesen ganzen tests beschäftigt und kenne daher wohl auch nur eine (sehr) kleine teilmenge von dem was es insgesamt gibt. Ich will mich auch nicht davor drücken das nachzuschlagen, aber ich weiss nie wo ich anfangen soll. die eine quelle sagt das, die nächste wieder etwas anderes. ich verstehe zum beispiel gar nicht richtig, was du damit
Ja, die in der Stichprobe, mit dem Stichprobenfehler behaftet.
Du hast nicht beschrieben, welchem Zweck das im Kontext Deiner
Studie dient.

genau sagst. Ist meine Stichprobe nicht meine Umfrage und die Grundgesamtheit alle Menschen auf die ich das beziehen (verallgemeinern) möchte? Wieso ist es dann (abgesehen von der ungenauigkeit wegen dem zuvor erwähnten informationsverlust) nicht gut chi-quadrat zu verwenden?

Danke für deine geduld
nils
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Di 4. Feb 2014, 21:39
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Richtung einer Korrelation auf nominaler Skala

Beitragvon nils » Mi 5. Feb 2014, 11:56

Nachtrag: wenn man m=0 und w=1 auf m=1 und w=2 verändert (wie du schriebst), müsste der zusammenhang doch gleich bleiben. meinst du nicht auf m=2 und w=1?
So wie hier?
frage 1 (ordinal) werte hoch (sehr gut) + positiver zusammenhang (bei m=2 und w=1) = sehr gut korreliert mit m
frage 1 (ordinal) werte hoch (sehr gut) + negativer zusammenhang (bei m=2 und w=1) = sehr gut korrliert mit w
frage 1 (ordinal) werte hoch (sehr gut) + positiver zusammenhang (bei m=0 und w=1) = sehr gut korrliert mit w
frage 1 (ordinal) werte hoch (sehr gut) + negativer zusammenhang (bei m=0 und w=1) = sehr gut korrliert mit m
nils
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Di 4. Feb 2014, 21:39
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Richtung einer Korrelation auf nominaler Skala

Beitragvon PonderStibbons » Mi 5. Feb 2014, 13:22

Ja, es geht um eine Umkehrung. Ich habe den Fehler berichtigt.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Richtung einer Korrelation auf nominaler Skala

Beitragvon PonderStibbons » Mi 5. Feb 2014, 13:33

also nochmal für ganz blonde (mich): ich führe den mann-whitney-u-test durch, stelle fest ob der unterschied signifikant ist und schaue dann in die kreuztabelle und mehr optionen habe ich nicht, korrekt?

Du hast auch mehr Optionen, aber das würde z.B. das Auffinden und berechnen
des Rang-biserialen Koeffizienten in SPSS erfordern. Oder man vergleicht die beiden
Gruppen anhand ihrer Mediane, was bei 3 Stufen aber irreführend sein könnte.
eine kleine abschließende frage noch: wozu benutzt man denn den chi-quadrat-test überhaupt noch? für den fall, dass ich bei ZWEI nominal skalierte variablen auf korrelation prüfen möchte?

Chi-Quadrat ist die gängige Analysemethode für den Zusammenhang zweier
kategorialer Merkmale. Die darauf basierenden Korrelationsmaße wie Phi
oder Cramers V werden zumindest meiner Erfahrung nach höchst selten benötigt.
Aber das hängt vom Einzelfall ab.
Ist meine Stichprobe nicht meine Umfrage und die Grundgesamtheit alle Menschen auf die ich das beziehen (verallgemeinern) möchte? Wieso ist es dann (abgesehen von der ungenauigkeit wegen dem zuvor erwähnten informationsverlust) nicht gut chi-quadrat zu verwenden?

Ich habe nicht ausgesagt, dass das nicht gut ist. Der Test überprüft,
ob die Nullhypothese anhand der Stichprobendaten verworfen
werden kann. Eine zusätzliche Betrachtung von Zusammenhangsmaßen
wie z.B. Phi vernachlässigt häufig, dass das Stichproben-Phi nur
sehr begrenzt repräsentativ ist für das eigentlich gesuchte Populations-Phi,
außer die Stichprobe ist sehr groß und der Stichprobenfehler damit sehr
klein. Aber wenn Deine Abnehmer diese Zusammenhangsmaße hochschätzen,
kannst Du Sie ja dazunehmen.

Mit freundlichen Grüßen

P
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts


Zurück zu Korrelationen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste

cron