tironedavid hat geschrieben:@bele
Okay, sollte ich dann die Rangsummen berechnen und darstellen?
Hallo,
das kommt darauf an, was Du für wen machst. Ich komme aus der Medizin, wo man traditionell recht berichtsfaul in Sachen Statistik ist. Da würde ein p-Wert und die Aussage, welche Gruppe jetzt jünger oder älter ist reichen. In anderen Fächern ist anderes üblich und natürlich macht es einen Unterschied, ob Du ein Poster oder eine Dissertation schreibst.
Ich möchte strukturmarionette widersprechen und zustimmen. Welcher Test anzuwenden ist, ist entweder Deine freie Wahl oder entspricht der Vorliebe Deines Betreuers, wenn es einen gibt. Ob Du einen Rangsummentest, einen Mediantest, einen Permutationstest oder einen t-Test rechnest bleibt eigentlich Dir überlassen, sofern Du Deine Wahl begründen kannst. Je größer die Stichprobe wird, umso egaler ist es, denn bei N = 40000 wird bei fast jedem Vergleich jeder Test ein p unter 0,05 hervorzaubern. Ich würde trotzdem zum t-Test tendieren, und zwar aus einem ganz anderen Grund: Wie in meinem PS oben geschrieben, kann dein Effekt höchst statistisch-signifikant und dennoch irrelevant klein sein. Identische Mediane und Quartilsgrenzen deuten darauf hin, dass das bei Dir so sein könnte. Wenn Du bei solch großen Stichproben tatsächlich auf Signifikanz testest, dann musst Du die Größe und Bedeutsamkeit des Unterschieds untersuchen. Für den t-Test bietet sich Cohen's d dafür an. Egal, ob das jetzt das entscheidende Traummaß ist: Es ist so weit verbreitet und so bekannt, dass man es beim Leser eines wissenschaftlichen Papers als bekannt voraussetzen darf. Cohen's d passt aber nun einmal besonders gut zu einer parametrischen Herangehensweise. Das wäre meine pragmatische Sicht der Dinge. Dazu die oben vorgeschlagenen Histogramme oder empirische kummulative Verteilung oder, oder , oder. Natürlich könntest Du auch durch Bootstrapping ein Konfidenzintervall für den Mittelwertsunterschied oder den Medianunterschied oder, oder, oder errechnen.
Kernaussage: Sehr große Stichprobe, Differenz signifikant, unbedingt untersuchen, ob Differenz relevant. Wahl zwischen parametrischem und nichtparametrischem Test eher wenig relevant.
LG,
Bernhard