Gehen wir davon aus ich habe Daten zu einer Versuchsgruppe von 400 Personen zur Entwicklung ihres Körpergewichts innerhalb von zwei Jahren. Die Daten sind so erfasst worden, dass ich nun beispielsweise für den 01.01.12 die Differenz des aktuellen Gewichts zum Gewicht vor einem Jahr (ergo dem 01.01.12) in Prozent als Datenpunkt habe; dies dann für Januar 2011- Januar 2012. Von diesen 400 Personen waren in dieser Zeit 100 regelmäßig bei einer Ernährungsberatung und ernährten sich nach einem Nährwerteplan, der ihrem Bedarf angepasst wurde. Die 300 anderen gingen drei mal die Woche eine Stunde Joggen, Sonntags eines Stunde Fahrradfahren, sollten jedoch ausdrücklich weiter so essen wie bisher.
Was ich nun wissen möchte ist:
1. Besteht ein Unterschied zwischen der Entwicklung des Körpergewichts zwischen den beiden Gruppen und ist dieser signifikant?
2. Sollte ein signifikanter Unterschied bestehen, in welche Richtung geht dieser (aka Umsteller haben ihr Gewicht stärker reduziert/erhöht als Sportler oder umgekehrt.)
In einem ersten Schritt schaue ich mir also erstmal die bloßen Mittelwerte übers Jahr verteilt an. In einem Linien-Diagramm sehen wir, dass beide Gruppen abnehmen, die Ernährungsumsteller jedoch immer 0,3 bis 1 Prozentpunkt „mehr“ abnehmen als die Sportler.
Jetzt darf ich ja nicht einfach sagen „schauen sie in das Diagramm, klare Sache“ sondern möchte das „beweisen“.
Also möchte ich erst mal schauen: unterscheiden sich die beiden Gruppen.
H0: Die Gruppen unterscheiden sich nicht voneinander
H1: Die Gruppen unterscheiden sich voneinander
Ich mache dann mit SPSS in der „Explorativen Datenanalyse“ den Kolmogorov-Smirnov Test und sehe, dass nur die Werte der Sportler normalverteilt sind (Wert von 0.200), die der Ernährungsumsteller jedoch nicht (Wert von 0.000). Also darf ich keinen t-test machen, weil der ja eine Normalverteilung verlangt.
Beim t-test wär die Sache ja einfach: Rechnen lassen, signifikanz prüfen. Bei Signifikanz, gerichtete Hypothese mit verdoppeltem Signifikanzniveau prüfen, und ich kann meine Aussagen treffen.
Welchen Unterschiedstest wende ich nun bei nicht-normalverteilten Gruppen an? Das Statistik-Buch rät mir zu dem Kolmogorov-Smirnov Test unter dem Menüpunkt „Nichtparametrische Tests“. Ist das so zutreffend?