Untersucht werden soll bei einem einzigen Patienten die Wirksamkeit regelmäßiger Behandlungen. Gegeben sind
- ein vom Patienten täglich festgelegter Symptom-Score (S), der sicher nicht Gauß-verteilt ist
- für jeden Wert die Zeit seit der letzten Behandlung in Tagen (d), die ebenfalls nicht Gauß-verteilt ist (da die Behandlung ca. alle 6 Wochen erfolgt, sind alle Werte von 1 bis 40 fast gleich verteilt).
Es liegen Daten von 140 Tagen vor.
Eine im X/Y-Diagramm "S über d" von Excel eingezeichnete Trendlinie deutet auf eine starke Abhängigkeit hin (geringe Symptome kurz nach der Behandlung, dann ansteigend).
Um die Signifikanz zu prüfen, habe ich einen Chi-Quadrat-Test durchgeführt. Ich habe die Daten dazu kategorisiert (d in 4 Bereichen, S in 3 Bereichen). Um die Bedingung e_ij>5 einzuhalten, habe ich die Grenzen in S noch verschoben. Dabei ist mir aufgefallen, dass bei erfüllter Bedingung die Grenzen der Kategorisierung einen großen Einfluss auf das berechnete Signifikanzniveau p hat. Je nachdem, wie ich die Grenzen der Kategorien in S und d wähle, schwankt p zwischen 0,01 und 0,1. Auch wenn ich die Freiheitsgrade auf 1 reduziere (2*2 Felder), so dass die e_ij Werte um 35 erreichen, führen minimale Änderungen der Grenzen zu Schwankungen von p im Bereich 0,01 bis 0,1.
Ich frage mich nun, ob es einen besseren Test gibt. Beim Kategorisieren werden ja auch Informationen über die genauen Werte verworfen, daher wäre mir ein Test lieber, der die genauen Daten verwendet, sofern ein solcher Test wegen der nicht Gauß-verteilten Daten anwendbar ist.
Kann mir freundlicherweise jemand einen Rat geben?