Ich arbeite mit SPSS und hatte auch schon eine Statistikberatung an der Uni, bei der vorgeschlagen wurde, die nicht normalverteilten Variablen zu logarithmieren und dann so damit weiterzumachen, damit ich Tests machen kann, die eine Normalverteilung voraussetzen (t-Test).
t-Tests erfordern keine normalverteilten Daten. Allenfalls innerhalb der beiden
Gruppen sollten die Werte aus Normalverteilungen stammen. Aber auch das ist
nur bei kleinen Stichproben der Fall. Bei n > 90 (wie hier beim Vergleich der
beiden kleinsten Stichproben) brauchst Du Dir um "Normalverteilung" für
die Gültigkeit des Tests keine Gedanken zu machen, bei ausreichend großen
Stichproben ist der Tests robust.
Eine andere Frage ist, ob bei solchen biologischen Parametern nicht üblicherweise,
aus inhaltlichen Gründen logarithmiert wird. Zum Beispiel, wenn es sich um
Wachstumsprozesse handelt, zu der einfache, lineare Betrachtungen nicht passen.
Das ist aber eine substanzwissenschaftliche Frage und hat nichts mit Normalverteilung
zu tun.
Dafür müsste ich die nicht normalverteilten Variablen ja noch nicht logarithmieren, bloß ist der Mittelwert bei schief verteilten Daten eine sinnvolle Angabe?
Mittelwert und Standardabweichung und Minimum und Maximum und Median wären Angaben,
aus deren Gesamtheit sich ein brauchbares Bild ergibt.
Danach soll mittels einfaktorieller Varianzanalyse ein Mittelwertvergleich erfolgen (und später auch der Einfluss von kategorialen Variablen untersucht werden). Hier sollte laut meinen Statistikbüchern Varianzhomogenität vorliegen, was aber laut Levene-Test oft nicht gegeben ist (auch nicht mit den logarithmierten Daten).
Dafür gibt es in SPSS die Korrekturen nach Welch bzw Brown-Forsythe.
Außerdem sollte die abhängige Variable innerhalb der Gruppen normalverteilt sein, was aber oft auch nicht so ist (aber ab ca 20 Personen sollen Verletzungen nicht so schlimm sein..)
Man kann es auch einfacher haben und sich die Verteilung der Vorhersagefehler (Residuen) aus
der Varianzanalyse ansehen. Diese Residuen sollten vorzugsweise aus einer Normalverteilung
stammen, aber bei einer Stichprobengröße von Gesamt n = 189 ist die Analyse auch dann korrekt,
wenn davon abgewichen wird.
Bei der Beratung wurde mir mitgeteilt, dass man sehr vorsichtig in der Auswertung von Varianzanalysen sein muss, wenn logarithmierte und nicht logarithmierte Daten darin vorkommen (aber wie genau man vorgehen muss, ist leider nicht erklärt worden..)
Wie gesagt, nirgends ist eine erkennbar eine Normalverteilung von was auch immer
erforderlich, Du könntest durchgehend ohne Transformation rechnen. Aber es könnte
sein, dass es um biologische Prozesse geht, die nahelegen, dass Du von vornherein die
meisten Deiner Variablen logarithmieren willst.
Mit freundlichen Grüßen
PonderStibbons