Hallo Zusammen,
letztens wollte ich anhand eines simulierten Datensatzes einen Post Hoc Test (Nemenyi) ausprobieren und bin dabei auf etwas verwirrendes gestoßen, das ich mir nicht erklären kann. Ich vermute, dass es eine sehr simple Erklärung gibt, aber irgendwie komme ich nicht drauf.
Und zwar habe ich einen Datensatz simuliert, bestehend aus 4 verschiedenen Eisproben, die von 8 Probanden probiert wurden und aufsteigend nach der Süße des Geschmacks (1 bis 4) sortiert wurden. Spaßeshalber habe habe ich die Daten so erstellt, dass jeder Proband exakt die gleiche Reihenfolge für die Eisproben hat.
Beispieltabelle:
Eissorte | Rang | Proband
Eis A | 1 | Proband 1
Eis B | 2 | Proband 1
Eis C | 3 | Proband 1
Eis D | 4 | Proband 1
Eis A | 1 | Proband 2
Eis B | 2 | Proband 2
Eis C | 3 | Proband 2
Eis D | 4 | Proband 2
... usw.
Meine Erwartung beim Post-Hoc Test war, dass sich alle 4 Eissorten signifikant voneinander unterscheiden. Stattdessen war das nicht der Fall.
Ergebnis ( bei a = 0,5):
......| Eis A | Eis B | Eis C |
Eis B | n.s. |_______|_____|
Eis C | _ * _ | _ n.s. |_____ |
Eis D | _ * _ | _ * __ | _ n.s.|
Wie kann ich mir erklären, dass sich nicht alle Sorten signifikant voneinander unterscheiden, wo sie doch alle einheitlich in jeweils unterschiedliche Kategorien sortiert wurden? Immer die benachbarten Kategorien unterscheiden sich komischerweise nicht signifikant voneinander.
Vielen Dank schonmal auf eure Hilfe!
Grüße
Yet