Wilcoxon-Rangsummentest bei ungleicher Verteilungsform

Re: Wilcoxon-Rangsummentest bei ungleicher Verteilungsform

Beitragvon steaf » Do 7. Sep 2023, 11:16

Okay Punkt 1. kann man streichen. Mit dem Wilcoxon aus der library exactRankTests habe ich den exakten p-Wert berechnen können.
steaf
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Mi 6. Sep 2023, 12:46
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Wilcoxon-Rangsummentest bei ungleicher Verteilungsform

Beitragvon bele » Do 7. Sep 2023, 18:59

Das wäre auch mein Vorschlag gewesen. Zu 2 kann ich nichts sagen. Zu 3: einen Mediantest mit R via Bootstrapping oder Permutationstest zu rechnen ist schnell gemacht und daher keine Kanone.

LG, Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1398 mal in 1384 Posts

Re: Wilcoxon-Rangsummentest bei ungleicher Verteilungsform

Beitragvon steaf » Mo 18. Sep 2023, 14:56

Nochmal eine Frage zum Berichten der Ergebnisse:

hier heißt es, dass ich bei gleicher Verteilungsform bei einem sig. Wilcoxon die Mediane berichte und bei ungleicher Verteilungsform die mittleren Ränge. https://statistikguru.de/spss/mann-whit ... tik-2.html

Meine Fragen:
1. Kommt es für das Ergebnis nun doch auf die Verteilungsformen an?

2. Bei mir haben Gruppe 1 und 2 für jede abhängige Variable jeweils denselben mittleren Rang. Wie kann das sein?

3. In Bezug auf Frage 1. Falls der Wilcoxon bei Gleichheit der Verteilungen nun doch auf Medianunterschiede testet, warum wird folgender Test dann nicht signifikant?
Gruppe 1:
n=23
modus=4
median=4
q1=4.0
q3=5.0
min=2
max=5

Gruppe 2
n=21
modus=5
median=5
q1=4.0
q3=5.0
min=2
max=5
steaf
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Mi 6. Sep 2023, 12:46
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Wilcoxon-Rangsummentest bei ungleicher Verteilungsform

Beitragvon bele » Mo 18. Sep 2023, 15:52

steaf hat geschrieben:1. Kommt es für das Ergebnis nun doch auf die Verteilungsformen an?


Nein, der Test testet, ob die eine Gruppe systematisch in der Rangfolge weiter oben steht als die andere.

2. Bei mir haben Gruppe 1 und 2 für jede abhängige Variable jeweils denselben mittleren Rang. Wie kann das sein?


wilcox.exact gibt doch gar keine mittleren Ränge aus, oder doch? Nun bestehen mindestens 75% Deiner Werte in beiden Gruppen nur aus 4 und 5. Es gibt also sehr viele Bindungen. Dann kann es vielleicht doch aus Zufall nur mal vorkommen, dass die Ränge genau aufgehen. Bei wahrhaft kontinuierlichen Werten wäre das deutlich weniger plausibel.

3. In Bezug auf Frage 1. Falls der Wilcoxon bei Gleichheit der Verteilungen nun doch auf Medianunterschiede testet, warum wird folgender Test dann nicht signifikant?


Warum sollte er signifikant werden? In beiden Gruppen sind die allermeisten Werte entweder 4 oder 5 und entweder sind das jeweils fast gleich viele, dann sollte nichts signifikant werden oder es sind deutlich unterschiedlich viele, dann solltest Du nicht von gleichen Verteilungen sprechen. Ich verstehe das Problem nicht wirklich. Du könntest natürlich mit table() eine Häufigkeitstabelle beider Variablen erstellen und hier posten.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1398 mal in 1384 Posts

Re: Wilcoxon-Rangsummentest bei ungleicher Verteilungsform

Beitragvon steaf » Mo 18. Sep 2023, 18:07

Okay, vielen Dank.

Zu 2.: Ich habe mir die mittleren Ränge noch berchnen lassen. Das habe ich folgendermaßen (und vielleicht falsch) gemacht:
mean_rank_group_1 <- mean(rank(dep_resp[ind_resp == 1]))
mean_rank_group_2 <- mean(rank(dep_resp[ind_resp == 2]))

Wie berichte ich denn dann die Ergbnisse? Prüfgröße U, p-Wert und was noch?
steaf
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Mi 6. Sep 2023, 12:46
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Wilcoxon-Rangsummentest bei ungleicher Verteilungsform

Beitragvon bele » Mo 18. Sep 2023, 19:27

Das sieht in der Tat so aus, als hättest Du das Vorgehen beim Rangsummentest noch nicht verstanden. Such mal auf https://de.m.wikipedia.org/wiki/Wilcoxo ... itney-Test die Überschrift "Wilcoxon-Rangsummenstatistik". Da stehen zwei Sätze, den ersten musst Du Wort für Wort verstehen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1398 mal in 1384 Posts

Re: Wilcoxon-Rangsummentest bei ungleicher Verteilungsform

Beitragvon steaf » Di 19. Sep 2023, 11:28

Hi Bernhard,

ich habe mir den Test nun nochmal genauer angeschaut.
Wenn ich es richtig verstanden habe, ist die Prüfgröße W eben die Rangsumme der kleineren Stichprobe, wie in der Formel:


Unter der Nullhypothese sollten die Rangsumme der anderen Stichprobe innerhalb des kritischen Wertebereichs sein, d.h die Rangsummen sollten sich nicht stark voneinander unterscheiden.

Meine Frage ist, wie es genau zu interpretieren ist, wenn sie außerhalb dieses Bereichs liegt. Sagen wir einmal sie liegt darunter. Dann sollte es ja so sein, dass die meisten Wert aus der größeren Stichprobe ihrem Rang nach unter denen der anderen Stichprobe liegen.

Kann ich in diesem Fall folgern, dass die Werte dieser Stichprobe signifikant kleiner sind? Und falls ja, wie berichte ich das denn dann? Gebe ich dann die Prüfgröße, den p-Wert und die mittleren Ränge aus beiden Gruppen an?
steaf
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Mi 6. Sep 2023, 12:46
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Wilcoxon-Rangsummentest bei ungleicher Verteilungsform

Beitragvon bele » Di 19. Sep 2023, 12:37

steaf hat geschrieben:ich habe mir den Test nun nochmal genauer angeschaut.
Wenn ich es richtig verstanden habe, ist die Prüfgröße W eben die Rangsumme der kleineren Stichprobe,


Na vor allem müssen die Stichproben erstmal miteinander gepoolt werden. In dem R Code oben hast Du von jeder Gruppe die Werte in Rangdaten umgewandelt. Das hilft beim Vergleich gar nichts. Du musst beide Gruppen zusammen in einen Topf tun und dann Ränge bilden. Dann zeigt sich, ob die eine Gruppe immer oben und die andere immer unten auftaucht. Das meinte ich mit "Test noch nicht verstanden". Ränge bilden ist ein sehr einfacher Vorgang, wenn man keine Bindungen hat. Deine Datensatz hat aber wahnsinnig viele Bindungen. Die von Dir verwendete Funktion rank() bietet sechs Optionen an, wie sie mit Bindungen umgehen kann. Da ich nicht weiß, wie wilcox.exact() das mit den Rängen bei Bindungen genau macht, ist das Nachprogrammieren der Rangsummen nicht ganz banal. Mehr zu den Varianten, wie man Ränge bei Bindungen berechnen kann sagt Dir R auf 'help("rank")'.


Kann ich in diesem Fall folgern, dass die Werte dieser Stichprobe signifikant kleiner sind?


Persönlich habe ich mehr Vertrauen in die Programmierer dieser Funktion (Torsten Hothorn und Kurt Hornik) als in mich selbst. Ich rechne also mit der Funktion, ob es einen signifikanten Unterschied gibt (das erkenne ich am p-Wert) und wenn es nicht aus den Balkendiagrammen eindeutig ist, welche Gruppe höher ist, dann rechne ich einfach nochmal mit der Funktion den einseitigen Test. Spätestens dann ist es ja klar. Im Beispiel:

Code: Alles auswählen
library(exactRankTests)
x <- 1:8   # irgendwelche Beispielwerte
y <- 6:11
stripchart(list(x, y), method = "jitter")    #  offensichtlich x < y

wilcox.exact(x, y)     

wilcox.exact(x, y, alternative = "less")    # eins von diesen beiden, um die Richtung zu bestimmen
wilcox.exact(x, y, alternative = "greater")


LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1398 mal in 1384 Posts

Re: Wilcoxon-Rangsummentest bei ungleicher Verteilungsform

Beitragvon steaf » Di 19. Sep 2023, 13:18

Ja, dass ich alle Werte in Rangfolge bringen muss hatte ich schon verstanden. Danke aber auch nochmal für deine ausführliche und hilfreiche Erklärung. Ich wollte mit dem R Code die mittleren Ränge für jede Gruppe berechnen, weil ich dachte, dass ich die am Besten auch zusätzlich zu W (oder U) und dem p-Wert berichte.

Ich bin nun dabei den Test in R einmal "zu Fuß" zu berechnen. Dazu bin ich wie folgt vorgegangen:
1. Ränge für alle Werte gemeinsam berechnet.
2. Rangsummen und mittlere Ränge für beide Gruppen berechnet (ich weiß, dass ich die mittleren Ränge für die Berechnung nicht brauche, habe das aber wie gesagt für die Ergebnisdarstellung gemacht)

Leider (aber auch verständlicherweise bei 5-stufigen Likert-Items) habe ich ja viele Rangbindungen, auch zwischen den Gruppen.
Ich weiß an dieser Stelle auch nicht, wie ich am besten damit umgehe. Auf dieser Seite stehen die verschiedenen Optionen https://www.rdocumentation.org/packages ... opics/rank

Ein gute Tip aber von dir, die Tests nochmal einseitig zu rechnen. Werde ich mal machen.
Wie gesagt liegt mein eigentliches Problem auch eher bei der Ergebnisdarstellung, d.h. der Frage ob ich die mittleren Ränge berichten soll, und wie ich die bei den vielen Rangbindungen berechne.
steaf
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Mi 6. Sep 2023, 12:46
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Wilcoxon-Rangsummentest bei ungleicher Verteilungsform

Beitragvon steaf » Di 19. Sep 2023, 15:38

So, ich habe nun mal einfach aus Interesse den Test mal mit SPSS und R gerechnet.

Meine erste Erkenntnis: sowohl wilcox.exact als auch SPSS bilden bei Rangbindungen einfach die Mittelwerte der Ränge (die Default-Einstellung bei rank())

Ich habe mal die Outputs von SPSS und R für eine Variable verglichen.
Die Rangsummen und mittleren Ränge gibt wilcox.exact nicht von sich aus, die habe ich selbst dazu gebastelt.

SPSS
    Zusammenfassung des Mann-Whitney-U-Tests bei unabhängigen Stichproben
    Gesamtzahl 44
    Mann-Whitney-U-Test 348,000
    Wilcoxon-W 579,000
    Teststatistik 348,000
    Standardfehler 38,694
    Standardisierte Teststatistik 2,752
    Asymptotische Sig. (zweiseitiger Test) ,006
    Mittlerer Rang Gruppe 1 17,87 (aus Grafik abgeschrieben)
    Mittlerer Rang Gruppe 2 27,57 (aus Grafik abgeschrieben)

R - wilcox.exact
    statistic W 135
    p.value 0.005917046
    ranksum_group_1 411
    ranksum_group_2 579
    mean_rank_group_1 17.86957
    mean_rank_group_2 27.57143

Meine Frage ist aber nun, was "statistic W" genau bezeichnet? Wie man sieht, ist das nicht die Teststatistik in SPSS.
Zuletzt geändert von steaf am Di 19. Sep 2023, 19:43, insgesamt 2-mal geändert.
steaf
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Mi 6. Sep 2023, 12:46
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

VorherigeNächste

Zurück zu Nichtparametrische Tests

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron