Dabei gibt es zwei verschiedene Shampoos und drei verschiedene Dosierungen dieser Shampoos, sodass jede Kombination zehnmal vorkommt.
Sind das 6 Gruppen oder haben dieselben Leute alle 6 Bedingungen
durchlaufen, oder war das Design noch anders?
Über den Shapiro-Wilk-Test habe ich rausgefunden, dass die Daten annähernd normalverteilt sind (p=0,1091).
Wenn man präzise sein will: Es ist nicht möglich, durch einen statistischen
Signifikanztest soetwas nachzuweisen.
Allenfalls ist hier festzustellen, dass die Nullhypothese (" die Daten stammen aus
einer normalverteilten Grndgesamtheit") nicht verworfen werden konnte.
Bei kleineren Stichproben tritt so ein Nicht-Verwerfen sogar bei markant
nicht-normalen Verteilungen auf (zu wenig Daten, um die Nullhypothese
verwerfen zu können), das ist eben kein Beleg für Normalverteilung.
Wichtige: eine (Normal-)Verteilung der Daten ist für so ziemlich alle gängigen
Verfahren (wie Varianzanalyse, t-Test, lineare Regression) irrelevant, weil nur die
Verteilung
innerhalb der Gruppen bzw. die Verteilung
der Vorhersagefehler
(Residuen) mitunter wichtig ist für die Zuverlässigkeit der Tests. Und zwar bei
kleinen Stichproben. Bei Stichproben ab ca. > 30 kann man davon ausgehen, dass
Abweichungen von der Normalverteilung der Residuen bzw. in den Gruppen die
Zuverlässigkeit der Tests nicht mehr beeinträchtigt (vgl. "zentraler Grenzwertsatz").
Daher kann ich den t-Test durchführen.
Der passt hier allem Anschein nach nicht (6 Gruppen, oder
eine Gruppe mehrfach gemessen, oder 2 Gruppen mehrfach
gemessen).
In der Vorlesung haben wir gelernt, dass einige Verfahren nur für intervallskalierte Daten durchgeführt werden können und man die Daten von der Verhältnisskala über logarithmieren auf die Intervallskala transferiert.
Dass das nicht nachvollziehbar ist bzw. ein Missverständnis, hatten
wir doch bereits? Da wird nichts transferiert und es gibt keinen
ersichtlichen Anlass für eine logarithmische Transformation hier.
Ratioskala heißt doch nur, dass es einen natürlichen Nullpunkt gibt und
daher Divisionen durchgeführt werden könnten. Vielleicht bezieht sich die
Angabe zum Logarithmieren auf Variablen, die durch Division zweier
Ausgangsvariablen gebildet wurden und deswegen sehr ungewöhnliche
Verteilungenb aufweisen?
Mit freundlichen Grüßen
PonderStibbons