Hallo! Im Rahmen einer Studienarbeit habe ich mich nun zur Auswertung mal an R gewagt und habe nun eine Frage bezüglich der Verwendung des richtigen Tests.
Ich hoffe natürlich, dass ich das hier an der richtigen Stelle poste bzw. frage. Falls nicht, dann schonmal sorry Also erstmal zur Einleitung paar Eckdaten zum Versuch.
Es geht, grob zusammengefasst, um die Bestimmung einer Infektionsrate in Wurzelhaaren von verschiedenen Pflanzen. Dafür wurden jeweils X Pflanzen von Y Verschiedenen Arten untersucht. Pro Pflanze wurde eine gleiche Anzahl an Wurzelhaaren untersucht, ob diese Infiziert sind oder nicht. Beispielsweise habe ich also 7 verschiedene Arten, davon je 10 verschiedene Exemplare. Je Pflanze wurden 80 Haare beobachtet und eine Infektionsrate bestimmt.
Nun zur Frage bzw. zum bisherigen Vorgehen:
Ich habe die Daten in R eingelesen und auch erste einfache Tests, Zusammenfassungen und Plots durchgeführt. Es soll nun untersucht werden, ob die Art einen signifikanten Einfluss auf die Infektionsrate hat(oder halt nicht). Im Vorfeld habe ich den Levenetest (Varianzhomogenität) und Shapirotest (Normalverteilung) angewendet. Der Levenetest lieferte ein positives Ergebnis, leider sind die Daten (knapp) nicht normalverteilt.
Was habe ich nun gemacht? Ich habe 2 verschiedene „Wege“ probiert. Zum einen habe ich die Daten transformiert (in diesem Fall logarithmiert), damit die Daten normalverteilt sind. Dann habe ich damit eine Anova (bei R mit dem Befehl „aov(infektion~art)“) durchgeführt und F- und p-Werte notiert. Als 2. Weg habe ich mit den untransformierten Daten einen Kruskal-Wallis Test durchgeführt (R Befehl „kruskal.test(infektion, art)) und dann wieder p-Wert notiert. Letztendlich sind natürlich unterschiedliche Zahlen dabei herausgekommen, das Ergebnis an sich, also dass die Mittelwerte der Gruppen sich signifikant voneinander unterscheiden, ist bei beiden jedoch bestätigt.
Nun natürlich abschließend meine Frage: Welcher der Tests ist für meinen Fall besser bzw. überhaupt geeignet? Also nutze ich nun die Anova Daten oder das Ergebnis des Kruskal-Wallis? Kann ich auch, unter der Voraussetzung, dass ich beide Tests in diesem Fall auch anwenden darf, beide Ergebnisse anführen oder macht dies keinen Sinn?
Was ist denn überhaupt allgemein der Unterschied zwischen diesen beiden Tests, außer dass die Voraussetzung mit der Normalverteilung einmal gegeben sein muss und einmal nicht? Und wie ist der chi-Wert, den mir R beim Kruskal ausgibt zu interpretieren?
Ich hoffe, dass ich mein Anliegen verständlich ausführen konnte und mir jemand helfen bzw. Auskunft darüber geben kann.
Vielen Dank schonmal dafür!