nested paired t-test?

nested paired t-test?

Beitragvon Cosmo » Do 3. Dez 2015, 14:36

Moin moin,

normalerweise ist es ja gute Gepflogenheit in Foren, zunächst ausgiebigst die Suchfunktion zu nutzen. Da mir der A**** allerdings schon ziemlich auf Grundeis geht, möchte ich ausnahmsweise parallel gleich ein eigenes Thema erstellen.

Zu meinem Problem: Ich muss eine statistische Auswertung mit dem Programm R vornehmen (ohne dieses bislang genutzt oder überhaupt einen Statistikschein gemacht zu haben).
Für meine Arbeit untersuche ich die Reaktion einer Pflanze auf einmaligen Schnitt. Dazu habe ich 5 verschiedene Wiesen untersucht. Auf jeder Wiese habe ich insgesamt 10 plots, 5 in einem gemähten Abschnitt der Wiese, 5 in einem ungemähten Abschnitt der Wiese.
Es geht nun darum, ob sich die Stichproben in den gemähten Bereichen in mehreren Merkmalen (z.B. Pflanzen pro qm²) signifikant von denen in den ungemähten Bereichen unterscheiden.

Zur Auswertung müsste ich einen paired T-Test verwenden. Für eine einzelne Wiese sehe ich da auch keine Schwierigkeit, es gibt zu jedem der 5 gemähten Plots einen entsprechenden ungemähten plot (n gemäht=5; n ungemäht=5). Die Auswertung mit R macht hier auch keine Probleme
Auch für alle Wiesen gemeinsam besteht keine Schwierigkeit. Hierbei zähle ich einfach alle gemähten und alle ungemähten Plots pro Wiese zusammen, bei insgesamt 5 Wiesen habe ich auch hier n gemäht=5 und n ungemäht=5.

Nun brauche ich aber einen Test, der zwar alle Wiesen in einem berücksichtigt, dennoch aber nicht alle plots pro wiese einfach zusammenzählt.
Wie gesagt, ich habe bedauerlicherweise weder Ahnung von R noch von Statistik allgemein.
Kennt jemand einen "nested" paired t-test und kann mir erklären, wie ich diese Auswertung mit R vornehme? Bislang habe ich nur den R-Comander genutzt, damit ging ein normaler paired t-test auch völlig unkompliziert.

Auch für Quellen, die mir u.U. helfen könnten, wäre ich sonst sehr dankbar. Ich finde leider gar keinen Zugang.
Cosmo
Beobachter
Beobachter
 
Beiträge: 11
Registriert: Mi 2. Dez 2015, 11:04
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: nested paired t-test?

Beitragvon bele » Do 3. Dez 2015, 16:26

Hallo Cosmo,

das könnte man in einem ersten Schritt als lineares Modell angehen. Zunächst einmal kopiere folgendes in Dein R. Das erzeugt einfach ein paar Beispieldaten für zwei angenommene Wiesen und je 2x10 plots und irgendein Zielkriterium, dass ich wert genannt habe:

Code: Alles auswählen
daten <- data.frame(
    wiese = gl(2,20),
    plot = gl(10,1,40),
    gemaeht = gl(2,1,40, labels=c("ja", "nein")),
    wert=c(17.6, 26.24, 11.47, 26.73, 18.16, 27.17, 16.04, 25.08, 20.54,
           26.76, 14.36, 28.13, 16.7, 27.91, 13.19, 31.04, 15.6, 26.96,
           11.86, 24.51, 23.47, 27.88, 21.67, 34.43, 16.56, 32.87, 17.84,
           30.83, 22.84, 30.02, 14.99, 29.84, 21.9, 30.57, 24.51, 34, 20.97,
           34.66, 23.46, 32.58)
    )


Die so erzeugten Beispieldaten kannst Du Dir anschauen mit
Code: Alles auswählen
print(daten)

und da kommt dann sowas raus:
Code: Alles auswählen
   wiese plot gemaeht  wert
1      1    1      ja 17.60
2      1    2    nein 26.24
3      1    3      ja 11.47
4      1    4    nein 26.73
5      1    5      ja 18.16
6      1    6    nein 27.17
7      1    7      ja 16.04
8      1    8    nein 25.08
9      1    9      ja 20.54
10     1   10    nein 26.76
11     1   11      ja 14.36
12     1   12    nein 28.13
13     1   13      ja 16.70
14     1   14    nein 27.91
15     1   15      ja 13.19
16     1   16    nein 31.04
17     1   17      ja 15.60
18     1   18    nein 26.96
19     1   19      ja 11.86
20     1   20    nein 24.51
21     2    1      ja 23.47
22     2    2    nein 27.88
23     2    3      ja 21.67
24     2    4    nein 34.43
25     2    5      ja 16.56
26     2    6    nein 32.87
27     2    7      ja 17.84
28     2    8    nein 30.83
29     2    9      ja 22.84
30     2   10    nein 30.02
31     2   11      ja 14.99
32     2   12    nein 29.84
33     2   13      ja 21.90
34     2   14    nein 30.57
35     2   15      ja 24.51
36     2   16    nein 34.00
37     2   17      ja 20.97
38     2   18    nein 34.66
39     2   19      ja 23.46
40     2   20    nein 32.58


Wir werten das im linearen Modell aus, d. h. wir nehmen an, dass sich der Wert errechnet aus einer Konstanten die von der Wiese abhängt plus einer Konstanten je nachdem ob gemäht oder nicht und einem Zufallswert je nach plot. In R steht 'lm' für das lineare Modell und man schreibt:

Code: Alles auswählen
linearesModell <- lm(wert ~ wiese + gemaeht, data=daten)
print(summary(linearesModell))


Als ergebnis kommt dann heraus:
Code: Alles auswählen
Call:
lm(formula = wert ~ wiese + gemaeht, data = daten)

Residuals:
    Min      1Q  Median      3Q     Max
-5.6925 -1.8475  0.2715  1.9555  4.8495

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)  15.6905     0.7056  22.236  < 2e-16 ***
wiese2        4.9920     0.8148   6.127 4.23e-07 ***
gemaehtnein  11.2240     0.8148  13.775 3.85e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.577 on 37 degrees of freedom
Multiple R-squared:   0.86,   Adjusted R-squared:  0.8524
F-statistic: 113.6 on 2 and 37 DF,  p-value: < 2.2e-16

Intercept ist 15,67, soviel wert gibt es also zunächst einmal für alles. wiese2 hat den Wert 4,99, d. h. im linearen Modell ergibt wiese2 jeweils 4,99 mehr wert als wiese1, die hier als Vergleichgröße auch für alle weiteren Wiesen herhalten müsste. gemaehtnein ist 11,22, es gibt also gegenüber der Vergleichsgröße (gemaeht=ja) immer 11,22 mehr wenn nicht gemäht wurde. In diesem Fall würde nicht mähen also zu mehr Ergebnis führen. Ist dieser Wert signifikant größer als Null? Ja, der p-Wert dazu steht in der Tabelle ganz rechts und ist mit weit unter 0,05. Jeder einzelne Plot wurde zur Bestimmung dieser Zahlen herangezogen, allerdings unverbunden je 5 plots ungemäht und je 5 plots gemäht. Wenn die plots miteinander verbunden sind wird's noch etwas komplizierter.

So ungefähr könnte man das angehen. Das Problem ist, wie öffnen wir ein riesig weites Feld, dass sich nicht sinnvoll in einem Forum bearbeiten lässt. Da wäre ein gutes Buch sicher besser. Da stünde dann auch drin, was all die anderen Ergebniszahlen bedeuten.


Cosmo hat geschrieben:Zu meinem Problem: Ich muss eine statistische Auswertung mit dem Programm R vornehmen (ohne dieses bislang genutzt oder überhaupt einen Statistikschein gemacht zu haben).

Das ist ziemlich blöd. Ist es auf rechten Wegen zu solch einer komischen Situation gekommen? Gibt es einen anderen Ausweg?

Wie gesagt, ich habe bedauerlicherweise weder Ahnung von R noch von Statistik allgemein.

Dann solltest Du Dir kompetente Hilfe holen. Statistik ist voller Stolperfallen. Das kann man nicht einfach nach einem Schema nachkochen. Im Forum kann man mal einen guten Tipp in eine geeignete Richtung übernehmen. Das Forum wird Dir aber nicht die Auswertung abnehmen. Mache Dich kundig, ob Dir in der Ausbildungsinstitution die Dir das zumutet jemand ist, der Dir helfen kann.

Bislang habe ich nur den R-Comander genutzt,

Der R-Commander scheint nicht ganz schlecht zu sein aber ich habe den Eindruck, dass es sehr schwierig ist, in einem deutschen Forum dazu Support zu bekommen. Vielleicht hier ab Seite 33 https://cran.r-project.org/doc/contrib/ ... intro2.pdf ?

Auch für Quellen, die mir u.U. helfen könnten, wäre ich sonst sehr dankbar.

https://cran.r-project.org/doc/contrib/Faraway-PRA.pdf
https://cran.r-project.org/doc/contrib/ ... tsRBio.pdf (ab Seite 273 "Two-Factor ANOVA)
http://www.amazon.de/Discovering-Statis ... 446200469/
http://www.amazon.de/Linear-Models-Chap ... 439887330/
http://www.amazon.de/R-Nutshell-OReilly ... 44931208X/
http://www.amazon.de/R-Book-Michael-J-C ... 470973927/
http://www.amazon.de/Einführung-Ein-Kochbuch-statistischen-Datenanalyse/dp/3833491841/ (kenne ich nicht selbst, wollte aber auch was Deutsches verlinken)
https://cran.r-project.org/doc/manuals/ ... -intro.pdf (ab Kapitel 11)


Toi, toi, toi,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: nested paired t-test?

Beitragvon Cosmo » Do 3. Dez 2015, 18:36

Moin Bernhard,

zunächst vielen Dank, dass du so ausführlich antwortest. Ehrlich gesagt scheiterte mein Versuch, deine Ausführungen nachzuvollziehen, schon beim Reinkopieren deines Beispiels. Ich habe es in den Editor kopiert, wollte es mir Strg +R abschicken und bekomme "Fehler: unerwartetes ",".

Ich bin der Auffassung, dass sich mein Problem eigentlich einigermaßen "einfach" lösen lassen müsste, da bekannt ist, dass ich weder mit Statistik im Allgemeinen noch mit R im Speziellen vertraut bin.
Daher ging ich auch zunächst davon aus, dass mein paired t-test pro Wiese (was sogar schon mit excel ging) schon ausreichend wäre.

Vielen Dank für die links. Ich werde zumindest versuchen, damit weiter zu kommen.

Mein Betreuer meinte, die Wiese sei nur eine Co-Variable (Gemäht/ungemäht die predictor-variable......Anzahl der Pflanzen, Höhe der Pflanzen etc. die response variablen).
Cosmo
Beobachter
Beobachter
 
Beiträge: 11
Registriert: Mi 2. Dez 2015, 11:04
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: nested paired t-test?

Beitragvon bele » Do 3. Dez 2015, 19:48

Sagt R auch, an welcher Stelle das Komma unerwartet ist? Magst Du vielleicht die ganze Fehlermeldung hier herein kopieren?
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: nested paired t-test?

Beitragvon Cosmo » Do 3. Dez 2015, 20:08

Jetzt kommt eine andere Fehlermeldung, komisch:

Fehler: Unerwartete(s) ')' in " )"

vorher kam meine ich "unerwartetes ',' in 34.66
Cosmo
Beobachter
Beobachter
 
Beiträge: 11
Registriert: Mi 2. Dez 2015, 11:04
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: nested paired t-test?

Beitragvon bele » Fr 4. Dez 2015, 12:23

Cosmo hat geschrieben:Jetzt kommt eine andere Fehlermeldung, komisch

Ja, das ist komisch. Anscheinend hast Du zwei falsche Wege gefunden, Code vom einen in ein anderes Fenster zu kopieren und Du hast auch noch keinen Weg gefunden, Fehlermeldungen von R in den Browser zu kopieren. Das sind wichtige Grundlagenfertigkeiten an denen Du arbeiten solltest, bevor Du mit einem Computer wissenschaftlich arbeiten willst.
Ich habe gerade nochmal eine neue R Console geöffnet und geprüft, dass der Code so sicher lauffähig ist. Es bleibt damit umso mehr die Empfehlung bestehen, Dir sachkundige Hilfe vor Ort zu suchen.

Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: nested paired t-test?

Beitragvon Cosmo » Fr 4. Dez 2015, 12:57

Ich dachte, man schickt sowas über den Editor ab......normales Einfügen (rechter Mausklick) funktioniert und es kommt genau das raus, was du auch verlinkt hast. Ok, ist natürlich peinlich, wenn sowas schon schiefgeht.

Nun gilt dein Beispiel aber ja für unverbundene Stichproben, insofern könnte ich damit ja auch nicht wirklich versuchen weiter zu arbeiten?

Ich spiele mit dem Gedanken, die Auswertung von dem hier beworbenen Statistik-Service machen zu lassen. Will aber weder mit Kanonen auf Spatzen schießen (zumal das teuer ist), noch etwas unerlaubtes tun :D

Danke trotzdem für deine Bemühungen.....
Cosmo
Beobachter
Beobachter
 
Beiträge: 11
Registriert: Mi 2. Dez 2015, 11:04
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: nested paired t-test?

Beitragvon bele » Fr 4. Dez 2015, 14:19

Auf jeder Wiese habe ich insgesamt 10 plots, 5 in einem gemähten Abschnitt der Wiese, 5 in einem ungemähten Abschnitt der Wiese.

Das klingt nach unverbundenen Plots.
, es gibt zu jedem der 5 gemähten Plots einen entsprechenden ungemähten plot

Das klingt nach verbundenen Plots. Wie die verbunden sind, wenn doch alle auf der gleichen Wiese sind, hast Du nicht erläutert.


Ein bezahlter Helfer wäre in vielerlei Hinsicht eine gute Idee. Vielleicht würdest Du dem auch unter Verschwiegenheit Details (warum Du z. B. denkst, dass die Plots verbunden sind) schildern, die Du hier nicht schilderst.

Der Satz mit dem "unerlaubtes tun" verwirrt mich: Ein Statistikschein war für Deine Ausbildung nicht erforderlich aber die Statistik selbst zu machen gehört zu den Anforderungen in der Abschlussarbeit? In meinem Studiengang war eine (minimale) Statistikausbildung gefordert und trotzdem hat keiner was dagegen, wenn man sich mit der Statistik helfen lässt. Naja, andere Fächer, andere Sitten.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: nested paired t-test?

Beitragvon Cosmo » Fr 4. Dez 2015, 14:49

Ob das verboten wäre, weiß ich nicht. Ich hätte lediglich die Befürchtung......müsste vorher gesicherte Infos dazu einholen.
Natürlich hast du vollkommen recht, dass es keinen Sinn macht, statistische Schwerpunkte bei der Abschlussarbeit zu setzen, wenn in der vorangegangenen Ausbildung Statistik keine Rolle gespielt hat. Dennoch bin ich jetzt in diese missliche Lage hineingeraten.

Warum die Plots meiner Ansicht nach gepaart sein müssten, erkläre ich gerne. Die Plots sind nämlich nicht zufällig auf der Wiese verteilt, sondern haben eine feste Anordnung entlang der Grenze zwischen gemähtem und ungemähtem Abschnitt der Wiese. So liegen sich ein gemähter und ein zugehöriger ungemähter Plot immer genau gegenüber. Diese sehe ich als gepaart an....

Sonstige Bedingungen, bis auf das Mähen, sollten in einem Plot-Paar relativ ähnlich sein. Wie sich dieses zwischen den Plot-Paaren verhält, wäre eine andere Frage. Da die Paare ziemlich weit auseinander liegen, könnten durchaus diverse Gradienten in Sachen Feuchtigkeit, Bodeneigenschaften etc. vorliegen.
Cosmo
Beobachter
Beobachter
 
Beiträge: 11
Registriert: Mi 2. Dez 2015, 11:04
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: nested paired t-test?

Beitragvon bele » Fr 4. Dez 2015, 15:49

Guck, so finde auch ich das mit der Paarung plausibel. Nächstes Mal sowas am besten gleich in den Eröffnungspost, wo das Problem beschrieben wird, schreiben.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Nächste

Zurück zu t-Test

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste

cron