Es wird angegeben, dass für verschiedene Analyseverfahren eine NV vorliegen muss.
Wenn sich das auf die AV der Gesamtstichprobe bezieht, dann ist das in aller Regel
unzutreffend.
Dabei werden wiederum Tests auf NV angegeben, bspw. Kolmogorov-Smirnow oder Shapiro-Wilk. Nun wendet man diese an, obwohl dies scheinbar falsch ist?!
Die nützen in der Regel nichts. Bei kleinen Stichproben sind sie
zu wenig sensitiv, bei großen allzu sensitiv.
Untersuchen gerade diese beiden Tests nun die NV der Residuen oder der Variablen?
Das liegt beim Anwender. Dem Test ist es egal, woher die Daten stammen.
Meine Stichprobe ist leider etwas klein (n=18).
Untersucht werden soll, ob die Variabilität von Biomasse von verschiedenen anderen Faktoren abhängig ist. Dies soll u.a. durch Korrelationen und multi-lineare Regressionsverfahren analysiert werden.
Falls Du multiple lineare Regression meinst, damit ist bei n=18
nur begrenzt ein Modell zu bilden. Mehr als 2 oder 3 erklärende
Variablen wären schon zu viel.
Ich bin mir mittlerweile unsicher ob dafür nun eine NV vorliegen muss? Verschiedene Quellen geben verschiedene Angaben.
Die korrekte Angabe ist, dass bei einer linearen Regression die
Vorhersagefehler aus einer normalverteilten Grundgesamtheit
stammen sollen.
Um nochmals auf die Tests auf NV zurückzukommen. Es wäre also sinnvoller die Residuen zu berechnen und diese auf NV zu überprüfen (anhand der oben genannten Tests)?
Sollte der Test der Residuen bei n=18 schon inferenzstatistisch
signifikant ausfallen, hast Du in der Tat ein Problem, dann
dürfte die Abweichung markant sein.
Sollten diese nicht normalverteilt sein, ist eine Transformation anzuwenden? Könnte es da erneut Probleme bei der Interpretation geben?
Rechtsschiefe Verteilungen kann man geeignet logarithmieren.
Ich bin kein großer Freund davon, wenn es nicht inhaltlich Sinn
macht.
Mit freundlichen Grüßen
P.