Hallo liebe Community,
Zur Zeit schreibe ich an einer Studienarbeit wobei ich erstmals mit Multivariater Statistik arbeiten muss (die ich noch nicht im Studium hatte) und ich stehe etwas auf dem Schlauch wie ich da am besten vorgehe. Aber erst einmal zur Beschreibung des Versuchs:
Wir haben verschiedene biologische und physiko-chemische Bodenparameter auf 3 Weiden mit unterschiedlicher Behandlungen (geflutet=FLO, gedüngt=FER, Kontrolle=C) gemessen. Auf den FER- und C-Flächen wurden 3 Beprobungen durchgeführt und auf der FLO-Fläche 2 Beprobungen. Das macht zusammen 8 Mischproben. Im Labor wurden von jeder Mischprobe 3 Replikate hergestellt und gemessen. Ich habe schon mal ein bisschen geschaut wie die Datenverteilung etc ist und für fast alle Parameter hatte ich für die einzelnen Gruppen keine Norm-Verteilung und Varianzhomogenität (sowohl für die Einzelwerte der Replikate, sowie wenn ich die Replikate gemittelt hatte). Macht es hier überhaupt Sinn die Einzelwerte der Replikate zu verwenden oder sollten die Replikate prinzipiell immer gemittelt werden?
Ich möchte den Einfluss der Behandlung auf die mikrobielle Biomasse (Cmic) untersuchen und anschließend gucken welche Parameter die Cmic-Werte am besten erklären. Letztendlich will ich dann schauen ob die am besten erklärenden Parameter mit der Behandlung (Flo, Fer, C) zusammenhängen.
Frage 1:
Es wird angenommen, dass die mikrobielle Biomasse auf den gedüngten (FER) und gefluteten (FLO) Fläche höher ist als auf der Kontrollfläche (C). Ob auf der FER oder FLO Fläche eine höhere Cmic zu finden ist, darüber kann ich aufgrund fehlender Informationen keine Aussage machen (also entweder nehme ich an dass sie gleich sind ODER dass sie sich unterscheiden ohne eine Angabe über die Richtung zu machen). Welche Methode würdet ihr empfehlen? Zwei T-Tests (FER Vs. C; FLO Vs. C) oder in Dummy variablen umkodieren und dann ein lineares Modell ...?
Frage 2:
Dann möchte ich auf einen Zusammenhang zwischen einigen physiko-chemischen Bodenparametern (Humusgehalt, pH-Wert, Konzentration einiger Kationen, Gesamtkohlenstoff, organischer Kohlenstoff, Stickstoff, Phosphor) und der Cmic testen. Macht es hier Sinn eine Multiple Regression zu machen mit Cmic = abhängige Variable und alle anderen Parameter = unabhängige Variable?
Frage 3:
Wie kann ich den Zusammenhang der oben genannten erklärenden Parameter und der Behandlungen (FER, FLO, C) untersuchen?
Es wäre super wenn jemand mir da helfen könnte. Die Durchführung mit R würde ich bestimmt hinkriegen, wenn ich mich ein wenig in dem Forum oder in anderen Guides umschaue. Es geht hier nur darum die Test-Methode zu finden. Vielen Dank schonmal im Vorraus!
Viele Grüße
Julius