Hallo liebe Leute,
ich arbeite seit etwas mehr als drei Jahren an einem sprachwissenschaftlichen Projekt und jetzt bin ich gerade dabei, Korrelationen zu berechnen. Jedoch bin ich total verunsichert, was den Korrelationskoeffizienten angeht. Je mehr ich mich in das Thema einlese, umso verwirrter werde ich. Ich war sogar schon bei einer Methodenberatung an der Uni, aber auch dort konnte mir nicht geholfen werden. Bekannte und Kollegen habe ich auch schon gefragt, aber auch hier konnte mir keiner genau sagen, was zu tun ist. Leider musste ich nie einen Statistikkurs belegen, sowas wurde in meinem Studiengang gar nicht angeboten, daher muss ich mir alles anlesen, doch mir fehlt an manchen Stellen einfach das mathematische Verständnis und ich habe keine Ahnung von den allgemeinen Konventionen.
Die Daten: Ich habe Daten erhoben durch Sprachleistungstests (in insgesamt 5 Sprachen), bei denen man eine Punktzahl von 0-100 bekommen kann (je mehr Punkte, umso besser). Diese Werte habe ich als metrische Skalen bei SPSS eingegeben. Dann haben meine Probanden Texte verfasst. Ich habe Fehler und Textzeichen gezählt und einen Fehlerquotienten berechnet. Auch diese Werte stellen eine Variable dar (Werte wie 0 oder 2,6). Dann habe ich durch einen Fragebogen Angaben zum Gebrauch einer Sprache erhoben, und zwar mit Hilfe einer Likertskala von 1-4. Diese Werte habe als eine Variable bei SPSS eingegeben, die ordinalskaliert ist. Schließlich habe ich noch eine Variable, die die Jahre des schulischen Fremdsprachenunterrichts angibt (Werte wie 6 oder 8).
Keine Variable ist normalverteilt. Bei den Fehlerquotienten liegt eher eine Poisson-Verteilung mit Überdispersion vor.
Die Stichprobe: Insgesamt habe ich 70 Fälle, die in drei Subgruppen aufgeteilt sind, allerdings würde ich die Korrelationen immer pro Gruppe berechnen wollen, das heißt, entweder für 26 oder für 18 Fälle. Also für ganz kleine Stichproben.
Mein Problem: Ich habe verschiedene Skalenniveaus und ich weiß, dass ich mit ordinalskalierten Variablen entweder Spearmans rho oder Kendalls tau als Korrelationskoeffizient nehmen sollte (da viele Bindungen vorliegen, berechnet SPSS schon immer automatisch Kendalls tau-b). Die Ergebnisse sind relativ ähnlich, Spearman hat etwas höhere Werte. Ich habe dann - einfach so um mal zu schauen - die Variablen mit den Ergebnissen der Sprachleistungstests miteinander korreliert und die Koeffizienten für Pearson, Spearman und Kendall berechnen lassen. Bei Pearson gibt es zwei signifikante Korrelationen, bei den anderen jeweils 4. Ob 2 oder 4 Korrelationen vorliegen, ist inhaltlich sehr sehr wichtig und ich möchte auf keinen Fall einen Fehler machen, indem ich mich - unwissend wie ich bin - einfach für einen Koeffizienten entscheide.
Meine Fragen: Welchen Korrelationskoeffizienten sollte ich für metrische Variablen nehmen, auch wenn sie nicht normalverteilt sind und wenn 'nur' 26 bzw. 18 Fälle berechnet werden. Eigentlich würde man doch für derartige Variablen die Pearson-Korrelation durchführen, oder? Aber würde man das auch machen, wenn keine Normalverteilung vorliegt? Dürfte ich auch z.B. Kendalls tau mit diesen Variablen berechnen oder müssen die Werte dafür ordinalskaliert sein und würde ich dann irgendwelche Informationsverluste haben? Mit meinen Daten müsste ich wahrscheinlich nur nonparametrische Verfahren anwenden...
Also generell wäre ich sehr froh, wenn mir einer erklären könnte, ob es 'legal' wäre, wenn ich alle oben aufgezählten Variablen miteinander korrelieren wollte und dafür Kendalls tau berechnen würde. Oder muss man mal Pearson, mal Kendalls tau verwenden?
Ich hoffe, ich konnte mein Problem einigermaßen verständlich schildern. Ich habe auch schon ganz viel recherchiert und ich habe auch Tabellen vorliegen, aus denen man ablesen kann, wann welche Korrelation anzuwenden ist. Aber das mit der Normalverteilung als Voraussetzung für Pearson ist ja bei mir nie gegeben und außerdem irritieren und verunsichern mich die unterschiedlichen Ergebnisse.
Ich wäre euch unglaublich dankbar, wenn einer mir helfen könnte, denn seit 4 Wochen sitze ich an diesem Problem und schaffe sonst nichts anderes.
Herzliche Grüße - Oedipa