Welchen Korrelationskoeffizienten sollte ich verwenden?

Bivariate Korrelation, partielle Korrelation und Rangkorrelation.

Welchen Korrelationskoeffizienten sollte ich verwenden?

Beitragvon Oedipa » So 9. Mär 2014, 12:33

Hallo liebe Leute,

ich arbeite seit etwas mehr als drei Jahren an einem sprachwissenschaftlichen Projekt und jetzt bin ich gerade dabei, Korrelationen zu berechnen. Jedoch bin ich total verunsichert, was den Korrelationskoeffizienten angeht. Je mehr ich mich in das Thema einlese, umso verwirrter werde ich. Ich war sogar schon bei einer Methodenberatung an der Uni, aber auch dort konnte mir nicht geholfen werden. Bekannte und Kollegen habe ich auch schon gefragt, aber auch hier konnte mir keiner genau sagen, was zu tun ist. Leider musste ich nie einen Statistikkurs belegen, sowas wurde in meinem Studiengang gar nicht angeboten, daher muss ich mir alles anlesen, doch mir fehlt an manchen Stellen einfach das mathematische Verständnis und ich habe keine Ahnung von den allgemeinen Konventionen.

Die Daten: Ich habe Daten erhoben durch Sprachleistungstests (in insgesamt 5 Sprachen), bei denen man eine Punktzahl von 0-100 bekommen kann (je mehr Punkte, umso besser). Diese Werte habe ich als metrische Skalen bei SPSS eingegeben. Dann haben meine Probanden Texte verfasst. Ich habe Fehler und Textzeichen gezählt und einen Fehlerquotienten berechnet. Auch diese Werte stellen eine Variable dar (Werte wie 0 oder 2,6). Dann habe ich durch einen Fragebogen Angaben zum Gebrauch einer Sprache erhoben, und zwar mit Hilfe einer Likertskala von 1-4. Diese Werte habe als eine Variable bei SPSS eingegeben, die ordinalskaliert ist. Schließlich habe ich noch eine Variable, die die Jahre des schulischen Fremdsprachenunterrichts angibt (Werte wie 6 oder 8).

Keine Variable ist normalverteilt. Bei den Fehlerquotienten liegt eher eine Poisson-Verteilung mit Überdispersion vor.

Die Stichprobe: Insgesamt habe ich 70 Fälle, die in drei Subgruppen aufgeteilt sind, allerdings würde ich die Korrelationen immer pro Gruppe berechnen wollen, das heißt, entweder für 26 oder für 18 Fälle. Also für ganz kleine Stichproben.

Mein Problem: Ich habe verschiedene Skalenniveaus und ich weiß, dass ich mit ordinalskalierten Variablen entweder Spearmans rho oder Kendalls tau als Korrelationskoeffizient nehmen sollte (da viele Bindungen vorliegen, berechnet SPSS schon immer automatisch Kendalls tau-b). Die Ergebnisse sind relativ ähnlich, Spearman hat etwas höhere Werte. Ich habe dann - einfach so um mal zu schauen - die Variablen mit den Ergebnissen der Sprachleistungstests miteinander korreliert und die Koeffizienten für Pearson, Spearman und Kendall berechnen lassen. Bei Pearson gibt es zwei signifikante Korrelationen, bei den anderen jeweils 4. Ob 2 oder 4 Korrelationen vorliegen, ist inhaltlich sehr sehr wichtig und ich möchte auf keinen Fall einen Fehler machen, indem ich mich - unwissend wie ich bin - einfach für einen Koeffizienten entscheide.

Meine Fragen: Welchen Korrelationskoeffizienten sollte ich für metrische Variablen nehmen, auch wenn sie nicht normalverteilt sind und wenn 'nur' 26 bzw. 18 Fälle berechnet werden. Eigentlich würde man doch für derartige Variablen die Pearson-Korrelation durchführen, oder? Aber würde man das auch machen, wenn keine Normalverteilung vorliegt? Dürfte ich auch z.B. Kendalls tau mit diesen Variablen berechnen oder müssen die Werte dafür ordinalskaliert sein und würde ich dann irgendwelche Informationsverluste haben? Mit meinen Daten müsste ich wahrscheinlich nur nonparametrische Verfahren anwenden...
Also generell wäre ich sehr froh, wenn mir einer erklären könnte, ob es 'legal' wäre, wenn ich alle oben aufgezählten Variablen miteinander korrelieren wollte und dafür Kendalls tau berechnen würde. Oder muss man mal Pearson, mal Kendalls tau verwenden?

Ich hoffe, ich konnte mein Problem einigermaßen verständlich schildern. Ich habe auch schon ganz viel recherchiert und ich habe auch Tabellen vorliegen, aus denen man ablesen kann, wann welche Korrelation anzuwenden ist. Aber das mit der Normalverteilung als Voraussetzung für Pearson ist ja bei mir nie gegeben und außerdem irritieren und verunsichern mich die unterschiedlichen Ergebnisse.

Ich wäre euch unglaublich dankbar, wenn einer mir helfen könnte, denn seit 4 Wochen sitze ich an diesem Problem und schaffe sonst nichts anderes.

Herzliche Grüße - Oedipa
Oedipa
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Sa 8. Mär 2014, 18:47
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Welchen Korrelationskoeffizienten sollte ich verwenden?

Beitragvon strukturmarionette » Mo 10. Mär 2014, 02:07

Hi,

Die Stichprobe: Insgesamt habe ich 70 Fälle, die in drei Subgruppen aufgeteilt sind, allerdings würde ich die Korrelationen immer pro Gruppe berechnen wollen, das heißt, entweder für 26 oder für 18 Fälle. Also für ganz kleine Stichproben.


- Wie laute(n) denn deine Fragestellung(en)? - Ganz konkret?

Aber das mit der Normalverteilung als Voraussetzung für Pearson ist ja bei mir nie gegeben und außerdem irritieren und verunsichern mich die unterschiedlichen Ergebnisse.


Diese Voraussetzung exitiert doch gar nicht. Wie kommst Du darauf? Googlo?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4354
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 587 mal in 584 Posts

Re: Welchen Korrelationskoeffizienten sollte ich verwenden?

Beitragvon Oedipa » Mo 10. Mär 2014, 13:20

Hallo und vielen Dank für die schnelle Rückmeldung!

Also das mit der Normalverteilung und der Pearson-Korrelation habe ich in ganz vielen Büchern gelesen. Hier einige der Quellen: Bühner und Ziegler (2009: 605); Bühl (2012: 420); Duller (2008: 266); http://de.wikipedia.org/wiki/Korrelationskoeffizient; http://medistat.de/statistikberatung-gl ... ch_Pearson. Ich hab diese Info noch in ganz vielen anderen Büchern und anderen Uni-Skripten gelesen, aber die hab ich grad nicht vorliegen. Außerdem wurde mir das auch in der Methodenberatung an der Uni gesagt.

Nachdem man diese Info in so vielen Büchern gefunden hat, wundert man sich als Laie dann immer genauso, wenn einer sagt, dass die Info Quatsch ist :D. Aber keine Sorge: Ich habe das in der Zwischenzeit recherchiert und bin auf folgenden Link gestoßen: http://www.uni-graz.at/ilona.papousek/t ... s/faq.html

Die Voraussetzung einer Normalverteilung gilt anscheinend nur für die Signifikanzprüfung und nicht für die konkrete Berechnung des Korrelationskoeffizienten.

Meine Fragestellungen:
1. Gibt es einen Zusammenhang zwischen den Sprachleistungen in Sprache X und in Sprache Y?
2. Gibt es einen Zusammenhang zwischen dem Fehlerquotienten und den Sprachleistungen in Sprache X.
3. Gibt es einen Zusammenhang zwischen dem Fehlerquotienten und der Anzahl der Jahre des schulischen Fremdsprachenunterrichts?
4. Gibt es einen Zusammenhang zwischen dem schriftlichen und mündlichen Fehlerquotienten?

Das wären die Fragen, die ich mittels Korrelationen beantworten wollen würde. Ich würde die Korrelationen aber nicht immer für alle 70 Fälle berechnen wollen, sondern immer pro Gruppe.

Danke nochmal für die Antwort!

Sonnige Grüße! Oedipa
Oedipa
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Sa 8. Mär 2014, 18:47
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Welchen Korrelationskoeffizienten sollte ich verwenden?

Beitragvon PonderStibbons » Mo 10. Mär 2014, 13:38

Einleuchtend wäre Pearson allenfalls bei Thema 1. Kleine Stichproben,
fragwürdige Erfüllung der Verteilungsvoraussetzungen für einen
zuverlässigen Signifikanztest, das legt aber auch dort eine Verwendung
von Spearman nahe.

Mit freunbdlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Welchen Korrelationskoeffizienten sollte ich verwenden?

Beitragvon Oedipa » Mi 12. Mär 2014, 13:50

Vielen Dank für die Antwort.

Beste Grüße - Oedipa
Oedipa
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Sa 8. Mär 2014, 18:47
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Korrelationen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste