Ich habe 11 Patienten, bei denen ich die seitengetrennte Nierenfunktion untersuche. Dabei gibt es zwei Methoden die mit dem Goldstandard verglichen werden sollen. Ich habe mal die Normalverteilung (Shapiro-Wilk) um den T-Test durchzuführen - für Methode 1 (Sign. 0,603) kam Normalverteilt und für Methode 2 nicht Normalverteilt (Sign. 0,003). Kann ich damit schon eine Aussage treffen z.B. über die Qualität der Daten, bzw was hilft mir diese Info außer für die Testwahl?
Normalverteilt müssten ja die intraindividuellen Differenzen sein,
nicht die Messwerte selbst.
Aber wozu willst Du eigentlich einen inferenzstatistischen Test rechnen?
Dass die Methoden nicht exakt gleich sind, also in der Grundgesamtheit
nicht exakt um den Betrag 0,00000000... differieren, liegt auf der
Hand. Um den Vergleich "signifikant" zu bekommen, braucht man also
nur eine ausreichend große Stichprobe. Umgekehrt ist eine Stichprobe
von n=11 derart klein, dass selbst mittelgroße wahre Unterschiede
kaum eine Chance haben, in der Stichprobe signifikant zu werden.
Das heißt, dass ein nicht-signifikantes Ergebnis vermutlich wertlos ist,
weil man annehmen muss, dass es nur der schmalen Datenbasis geschuldet
ist (einen Eindruck dafür gibt das 95% Konfidenzintervall der Differenzwerte).
Ein "signifikantes" Ergebnis kannst Du bei n=11 nur erwarten, wenn eine
Methode sehr vom Goldstandard abweicht.
Ich habe auch große Probleme bei meiner Hypothese: Eigentlich will ich wissen "Welche Methode ist besser/ Welche Methode liegt näher am Goldstandard?" Mein Wunsch wäre zu sagen Methode 1 ist um XX% genauer als Mehtode 2. Ich bin mir nicht sicher ob zweimal den T-Test bzw den U-Test durchzuführen der richtige Weg ist.
Du könntest die intraindividuellen Differenzen Goldstandard/Methode 1
vergleichen mit denen von Goldstandard/Methode 2. Nur hast Du weiter
das Problem einer sehr kleinen Stichprobe. Der wahre Unterschied
zwschen den Methoden müsste schon sehr groß sein, um ein "signifikantes"
Ergebnis zu erzielen.
Mit freundlichen Grüßen
P.