Hallo an alle,
ich bin kein Statistiker und stehe gerade vor einem Problem bei meiner Abschlussarbeit. Ich arbeite mit R.
Ich versuche gerade für ein Forum herauszufinden, ob es einen Zusammenhang zwischen dem Aufruf von Forenseiten und Änderungen von Forenartikel vorliegt. Ich habe also so gesehen zwei Spalten, einmal Anzahl der Änderungen einer Forumsseite und zum Anderen den Aufruf einer Forumsseite. Es handelt sich dabei auch nicht um eine Stichprobe, sondern ich arbeite mit der gesamten Datenmenge. Ich habe nun einen Korrelationskoeffizienten (nach Pearson) von etwa 0,14 errechnet, was relativ schwach ist und somit besagt, dass kaum ein linearer Zusammenhang vorliegt.
Jedoch bin ich mir gerade nicht sicher, ob ich Pearson überhaupt anwenden darf. Zwar liegt für beide Spalten eine Intervallskalierung vor, jedoch sind sie denke ich nicht normalverteilt.
Habe mir R den Shapiro Test durchgeführt und dabei einen Wert von 2,26e -16 raus. Jetzt meine Fragen:
1. Muss eine normalverteilung für Pearson nur vorliegen wenn mit einer Stichprobe gearbeitet wird oder prinzipiell immer?
2. Wie viel aussagekraft hat der berechnete Korrelationskoeffiezent denn nun noch? Kann man das noch verwenden oder sollte man es wegschmeißen?
3. Wenn Pearson für diesen Fall nicht geeignet ist, welche Methode der Korrelationsberechnung sollte ich denn stattdessen wählen?
Wäre für jede Hilfe sehr dankbar.
Beste Grüße
danielo