Hallo Cosmo,
das könnte man in einem ersten Schritt als lineares Modell angehen. Zunächst einmal kopiere folgendes in Dein R. Das erzeugt einfach ein paar Beispieldaten für zwei angenommene Wiesen und je 2x10 plots und irgendein Zielkriterium, dass ich wert genannt habe:
- Code: Alles auswählen
daten <- data.frame(
wiese = gl(2,20),
plot = gl(10,1,40),
gemaeht = gl(2,1,40, labels=c("ja", "nein")),
wert=c(17.6, 26.24, 11.47, 26.73, 18.16, 27.17, 16.04, 25.08, 20.54,
26.76, 14.36, 28.13, 16.7, 27.91, 13.19, 31.04, 15.6, 26.96,
11.86, 24.51, 23.47, 27.88, 21.67, 34.43, 16.56, 32.87, 17.84,
30.83, 22.84, 30.02, 14.99, 29.84, 21.9, 30.57, 24.51, 34, 20.97,
34.66, 23.46, 32.58)
)
Die so erzeugten Beispieldaten kannst Du Dir anschauen mit
- Code: Alles auswählen
print(daten)
und da kommt dann sowas raus:
- Code: Alles auswählen
wiese plot gemaeht wert
1 1 1 ja 17.60
2 1 2 nein 26.24
3 1 3 ja 11.47
4 1 4 nein 26.73
5 1 5 ja 18.16
6 1 6 nein 27.17
7 1 7 ja 16.04
8 1 8 nein 25.08
9 1 9 ja 20.54
10 1 10 nein 26.76
11 1 11 ja 14.36
12 1 12 nein 28.13
13 1 13 ja 16.70
14 1 14 nein 27.91
15 1 15 ja 13.19
16 1 16 nein 31.04
17 1 17 ja 15.60
18 1 18 nein 26.96
19 1 19 ja 11.86
20 1 20 nein 24.51
21 2 1 ja 23.47
22 2 2 nein 27.88
23 2 3 ja 21.67
24 2 4 nein 34.43
25 2 5 ja 16.56
26 2 6 nein 32.87
27 2 7 ja 17.84
28 2 8 nein 30.83
29 2 9 ja 22.84
30 2 10 nein 30.02
31 2 11 ja 14.99
32 2 12 nein 29.84
33 2 13 ja 21.90
34 2 14 nein 30.57
35 2 15 ja 24.51
36 2 16 nein 34.00
37 2 17 ja 20.97
38 2 18 nein 34.66
39 2 19 ja 23.46
40 2 20 nein 32.58
Wir werten das im linearen Modell aus, d. h. wir nehmen an, dass sich der Wert errechnet aus einer Konstanten die von der Wiese abhängt plus einer Konstanten je nachdem ob gemäht oder nicht und einem Zufallswert je nach plot. In R steht 'lm' für das lineare Modell und man schreibt:
- Code: Alles auswählen
linearesModell <- lm(wert ~ wiese + gemaeht, data=daten)
print(summary(linearesModell))
Als ergebnis kommt dann heraus:
- Code: Alles auswählen
Call:
lm(formula = wert ~ wiese + gemaeht, data = daten)
Residuals:
Min 1Q Median 3Q Max
-5.6925 -1.8475 0.2715 1.9555 4.8495
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 15.6905 0.7056 22.236 < 2e-16 ***
wiese2 4.9920 0.8148 6.127 4.23e-07 ***
gemaehtnein 11.2240 0.8148 13.775 3.85e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.577 on 37 degrees of freedom
Multiple R-squared: 0.86, Adjusted R-squared: 0.8524
F-statistic: 113.6 on 2 and 37 DF, p-value: < 2.2e-16
Intercept ist 15,67, soviel wert gibt es also zunächst einmal für alles. wiese2 hat den Wert 4,99, d. h. im linearen Modell ergibt wiese2 jeweils 4,99 mehr wert als wiese1, die hier als Vergleichgröße auch für alle weiteren Wiesen herhalten müsste. gemaehtnein ist 11,22, es gibt also gegenüber der Vergleichsgröße (gemaeht=ja) immer 11,22 mehr wenn nicht gemäht wurde. In diesem Fall würde nicht mähen also zu mehr Ergebnis führen. Ist dieser Wert signifikant größer als Null? Ja, der p-Wert dazu steht in der Tabelle ganz rechts und ist mit
weit unter 0,05. Jeder einzelne Plot wurde zur Bestimmung dieser Zahlen herangezogen, allerdings unverbunden je 5 plots ungemäht und je 5 plots gemäht. Wenn die plots miteinander verbunden sind wird's noch etwas komplizierter.
So ungefähr könnte man das angehen. Das Problem ist, wie öffnen wir ein riesig weites Feld, dass sich nicht sinnvoll in einem Forum bearbeiten lässt. Da wäre ein gutes Buch sicher besser. Da stünde dann auch drin, was all die anderen Ergebniszahlen bedeuten.
Cosmo hat geschrieben:Zu meinem Problem: Ich muss eine statistische Auswertung mit dem Programm R vornehmen (ohne dieses bislang genutzt oder überhaupt einen Statistikschein gemacht zu haben).
Das ist ziemlich blöd. Ist es auf rechten Wegen zu solch einer komischen Situation gekommen? Gibt es einen anderen Ausweg?
Wie gesagt, ich habe bedauerlicherweise weder Ahnung von R noch von Statistik allgemein.
Dann solltest Du Dir kompetente Hilfe holen. Statistik ist voller Stolperfallen. Das kann man nicht einfach nach einem Schema nachkochen. Im Forum kann man mal einen guten Tipp in eine geeignete Richtung übernehmen. Das Forum wird Dir aber nicht die Auswertung abnehmen. Mache Dich kundig, ob Dir in der Ausbildungsinstitution die Dir das zumutet jemand ist, der Dir helfen kann.
Bislang habe ich nur den R-Comander genutzt,
Der R-Commander scheint nicht ganz schlecht zu sein aber ich habe den Eindruck, dass es sehr schwierig ist, in einem deutschen Forum dazu Support zu bekommen. Vielleicht hier ab Seite 33
https://cran.r-project.org/doc/contrib/ ... intro2.pdf ?
Auch für Quellen, die mir u.U. helfen könnten, wäre ich sonst sehr dankbar.
https://cran.r-project.org/doc/contrib/Faraway-PRA.pdfhttps://cran.r-project.org/doc/contrib/ ... tsRBio.pdf (ab Seite 273 "Two-Factor ANOVA)
http://www.amazon.de/Discovering-Statis ... 446200469/http://www.amazon.de/Linear-Models-Chap ... 439887330/http://www.amazon.de/R-Nutshell-OReilly ... 44931208X/http://www.amazon.de/R-Book-Michael-J-C ... 470973927/http://www.amazon.de/Einführung-Ein-Kochbuch-statistischen-Datenanalyse/dp/3833491841/ (kenne ich nicht selbst, wollte aber auch was Deutsches verlinken)
https://cran.r-project.org/doc/manuals/ ... -intro.pdf (ab Kapitel 11)
Toi, toi, toi,
Bernhard