Der Wilcoxon Vorzeichenranttest ist streng genommen für intervallskalierte Messungen
Ich habe einen Beobachtungsbogen bestehend aus 60 Items der von 2 Gruppen zu je 2 Messzeitpunkten (Prä1, Post1, Prä2, Post2) ausgefüllt wurde. Zwischen Prä und Post lag eine Intervention. Ziel der Auswertung ist zu zeigen, in wie weit (signifikante) Veränderung stattgefunden hat. Es gibt keine Vergleichsgruppe. Die erwartete Veränderung ist eine höhere Summe (Skalenwert). Zur Auswertung wurde mir der Wilcoxon-Test empfohlen. Ich ging davon aus, dass die Summen der Likert-Items häufig als intervallskaliert verwendet werden. Ich habe leider nur Grundkenntnisse und versuche mich da durch zu kämpfen. Ich bin für Tipps, wie ich das richtig angehe, sehr dankbar.
und vor allem berechnet er nicht den Unterschied zwischen Medianen.
Habe ich hier aufgeschnappt; unter
http://www.statistik-und-beratung.de/2015/07/effektstaerke/ steht:
Unterschied zwischen zwei Medianen: r
Für den Unterschied zwischen zwei Medianen (also passend zum Mann-Whitney U Test bzw. Wilcoxon Test) wird aus der standardisierten Teststatistik des entsprechenden Tests (z) und der Fallzahl (N) die Effektgröße r berechnet.
Wieso soll denn auf Teufel komm raus eine "Effektgröße" berechnet werden,
die ist in Stichproben (kleinen zumal) doch zu nichts zu gebrauchen.
Meine Stichproben sind nicht sonderlich klein (N=78 bzw. N=57). Ich brauche die Effektstärke maßgeblich für die Gesamtauswertung. Das oben beschriebene Problem trat auf, als ich Untergruppen vergleichen wollte (nur um etwaige Anomalien aufzuspüren, statistisch macht das nicht viel Sinn, schon klar).
Die Frage, die ich eigentlich mit der Effekstärke beantworten möchte ist, wie sehr oder nicht sehr sich die Einschätzung verändert hat.