Zur Datenverteilung: Ich gehe stark davon aus, dass die Daten nicht normalverteilt sind.
Die Daten müssen nicht normalverteilt sein, um parametrische Verfahren wie Varianzanalyse
oder lineare Regression zu rechnen. Normalverteilt sein sollen die Vorhersagefehler (die Residuen).
Im Fall eines t-Tests zum Beispiel sollten die Daten in den beiden
Subgruppen jeweils aus normalverteilten
Grundgesamtheiten stammen, nicht die Gesamtstichprobe.
Fällt damit der t-test komplett raus
Gegen kleinere Abweichungen ist der t-Test bei n=45 einigermaßen robust. Wichtiger ist eher, dass
die Subgruppen in etwa dieselbe Streuung haben, sofern die Subgruppen unterschiedlich groß sind.
und ich sollte nur den Mann-Whitney U-Test nutzen, richtig? Was tue ich, wenn ich in mehr als 3 Gruppen (Beispiel wie oben mit dem Alter) unterteilen muss?
Kruskal-Wallis H-Test.
Ich habe diese Daten sowohl am Zeitpunkt x und am Zeitpunkt y. Die eine Hälfte der Patienten hat an einem speziellen Training teilgenommen, die andere Hälfte nicht. Ich würde nun gerne Untersuchen, ob der Teil der Patienten mit dem Training anders "performt" hat wie der Teil der Patienten ohne Training (also in Bezug auf die 8 Eigenschaften).
Ich habe zunächst den Ansatz gewählt, dass ich eine Kreuztabelle gemacht habe (mit Training ja/nein und den Änderungen der Eigenschaften) und dann mit dem Chi Quadrat Test die Irrtumswahrscheinlichkeit berechnet, schätze aber, dass dieses ebenfalls nciht der beste Ansatz ist....
Was hast Du eigentlich immer mit dem Chi-Quadrat, der ist für kategoriale Varablen. Da müsstest Du erstmal Deine Scores in Kategorien umwandeln, was Informationsverschwendung wäre.
Es wäre Methode der Wahl eine Messwiederholungsanalyse, mit dem Gruppierungs-Faktor (Zwischensubjekt-Faktor) "Trainig ja/nein" und dem Messiwderholungsfaktor "Messzeitpunkt (prä - post). Die Wechselwirkung beider Faktoren testet, ob die Veränderung über die Zeit bei den beiden Trainingsgruppen unterschiedlich ist.
Falls das nicht geht mangels ausreichender Kenntnisse oder weil die Verteilungseigenschaften der Daten nicht den Voraussetzungen für ein solches Verfahren entsprechen, käme auch einfach ein Gruppenvergleich zu t2 mittels U-Test in Betracht. Allerdings ergibt der nur Sinn, wenn die beiden Untersuchungsgruppen nach Zufall gebildet wurden oder zumindest sehr ähnliche Ausgangswerte aufweisen.
Eine weitere Möglichkeit ist dann die Berechnung von Differenzwerten prä-post und Vergleich dieser Differenzen
zwischen den Gruppen mittels U-Test. Auch da mit der Problematik, dass ungleiche Ausgangsniveaus zu Scheineffekten führen können.
Etwas Sorge bereitet, dass Du mit vollen 8 abhängigen Messungen und vielen Untergruppierungen hantierst.
Allein Deine Beispiele bedeuten bereits schon 32 Tests. Da wäre eine Verschärfung des sonst üblichen alpha-Niveaus (5%) für ein "signifikantes" Ergebnis angebracht, um die Gefahr von Zufallsfunden aufgrund vielfacher Testung zu begrenzen.
Mit freundlichen Grüßen
P.