Hallo miteinander,
ich bin meiner Seminararbeit auf ein statistisches Problem gestoßen, bei dessen Lösung ich mir nicht 100% sicher bin.
Meine bisherige Recherche - auch in diesem Forum - konnte die Frage nicht abschließend lösen, daher wollte ich um eure Hilfe bitten.
Folgende Problematik:
Es wurde die Häufigkeit von bestimmten Begriffen in Texten analysiert, jeweils mit von einem Autor (insgesamt über 200) aber zu unterschiedlichem Zeitpunkt.
Die Daten lassen sich zuordnen, somit sollte eine gepaarte Stichprobe (erste Stichprobe bezieht sich auf den ersten Zeitpunkt, die zweite auf den zweiten Zeitpunkt) vorliegen.
Die Stichproben selbst sind offensichtlich nicht normalverteilt, dazu habe ich auch bereits einen Shapiro-Wilk Test (mittels Stata) herangezogen, der die Normalverteilungshypothese ablehnt.
Nun wird in einem Paper zu diesem Thema angeregt, dass es sich bei der Art von Analyse bei den Stichproben um eine Poisson-Verteilung handeln könnte.
Mir ist das intuitiv zwar nicht ganz geläufig, aber natürlich handelt es sich auch hier um eine Zählmethodik (nämlich von Wörtern).
Das eigentliche Problem ist nun, dass die Differenzen zwischen den Stichproben scheinbar normalverteilt sind. Den Test dazu habe ich noch nicht gemacht, lediglich ein Diagramm entworfen.
Gegeben den Fall das der Test die Normalverteilungshypothese bestätigt, muss ich dann trotzdem einen Wilcoxon Rang Test als Stichprobentest wählen oder kann ich dann auf einen einfachen t-test zurückgreifen?
Im Internet habe ich dazu verschiedenes gelesen, bzw. eventuell den Zusammenhang nicht tiefgreifend genug verstanden.
Viele Grüße und besten Dank,
Kristoffer