Ja, ich bin ein Laie, aber ich kann erhobenen Hauptes sagen, dass ihr meine vorletzte Hoffnung seid. Die letzte Hoffnung ist die Statistik-Abteilung meiner Uni, aber da eine Antwort zu bekommen gleicht einem Spießrutenlauf.
Also, ich bin Forstwissenschaftler und habe Untersuchungen an jungen Bäumen vorgenommen und ihren Blättern vorgenommen. Insgesamt 11 Variablen habe ich aufgenommen:
- Gewicht des Samens (vor der Pflanzung)
Länge des Samens (vor der Pflanzung)
Höhe der Pflanze
Anzahl der Blätter (ganze Zahlen)
Länge des Blattstiels
Länge des Blattes ohne Stiel
Größte Breite des Blattes
Schmalste Breite des Blattes
Länge des Blattes bis zur größten Breite
Anzahl der Blattlappen (ganze Zahlen)
Anzahl der Blattadern (ganze Zahlen)
Insgesamt habe ich 5 Versuchsflächen, von jeder habe ich 100 Stichproben entnommen. Also habe ich 500 Stichproben insgesamt.
Als Gruppen habe ich die Versuchsflächen 1-5 definiert. Sie sollte bei der Varianzanalyse meine unabhängige Variable sein. Als abhängige Variablen habe ich alle oben genannten Variablen genommen. Als ich die Vorraussetzungen für die ANOVA geprüft habe, stellte sich heraus, dass beim Levene Test keine einzige abhängige Variable varianzhomogen ist. Den Shapiro-Wilk's Test nutzte ich zur Überprüfung der Normalverteilung. Auch hier waren die meisten abhängigen Variablen nicht normalverteilt.
Andererseits habe ich gelesen, dass beide Voraussetzungen nicht erfüllt sein müssen, solange die Stichprobenanzahl in allen Gruppen gleich groß und ausreichend hoch ist. Aber was bedeutet ausreichend hoch?
Ist die klassische Varianzanalyse "Breakdown & one-way ANOVA" bei StatSoft's STATISTCA überhaupt die richtige Option? Bin ich auf dem richtigen Weg?
Viele verzweifelte Grüße,
Tom