bin gerade dabei, zum ersten Mal den Chi²-Test praktisch anzuwenden, und verstehe ihn leider nicht so ganz.
Mein Beispiel: Ich soll für eine Menge von ~ 19.000 Genen die in 4 Gruppen unterteilt sind, überprüfen, ob es Unterschiede gibt bezüglich des Auftretens von Mutationen in den Genen der jeweiligen Gruppen. Die 4 Gruppen wurden quantilsbasiert erstellt, es enthalten also alle 4 Gruppen gleich viele Gene. Die Kreuztabelle sieht so aus:
- Code: Alles auswählen
mutations
groups 0 1
1 1698 3153
2 1557 3294
3 1651 3200
4 1449 3402
Habe mir das Ganze auch geplottet (blau = 0 = keine Mutation, orange = 1 = Mutation):
Sieht ja nun so auf den ersten Blick eher nicht so aus, als würde da ein Zusammenhang bestehen, sodass eine bestimmte Gruppe besonders häufig Mutationen hätte.
Ich habe dann mit R mit quisq.test(crosstab) den Test durchgeführt und folgendes Ergebnis erhalten:
- Code: Alles auswählen
X-squared = 34.0211, df = 3, p-value = 1.961e-07
Soweit ich weiß, heißt das doch, dass statistisch signifikante Unterschiede bestehen. Irgendwie verstehe ich das nicht ganz. Habe ich den Test falsch angewandt? Oder liegt das einfach an der Stichprobengröße dass da doch ein signifikanter Unterschied gefunden werden kann (besonders wenig Mutationen in der 4. Gruppe)? Muss ich irgendetwas anders machen oder zusätzlich berücksichtigen? Bin verwirrt. Kann jemand helfen?
Liebe Grüße
Nadita