Hallo,
entschuldigung. Ich dachte eigentlich ich würde eine EMail bekommen, wenn jemand antwortet.
In der Zwischenzeit hat sich einiges getan. Die häufigen Nullwerte (kaum zu erkennen), waren methodische Probleme. D.h. diese können gelöscht werden.
Alle Daten sind Höhenwerte von Pflanzen. Wie gefragt, kann ich davon ausgehen, dass zum Beispiel das 0,3 -Quantil, die schlechtesten 30% aller Werte enthält.
Wenn ich nun den "Grund" für das Wachstum der Pflanzen suche, würde ich diese mit Bodendaten, Hangneigung etc. vergleichen, in dem ich eine sehr große Tabelle in R nutze und bekomme dann ein Ergebnis. Ich folge hier der Anleitung (
http://www.gardenersown.co.uk/education ... #lr_models).
Ein nicht so schönes Ergebnis wäre dann:
- Code: Alles auswählen
Call:
lm(formula = data09$X0906_0904 ~ data09$X5m_curv + data09$X09.z +
data09$X5m_slp + data09$X5m_plcur + data09$X5m_prcur + data09$X5m_twi)
Residuals:
Min 1Q Median 3Q Max
-1.12298 -0.02210 0.01365 0.04586 0.48418
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -4.019e+00 7.784e-02 -51.632 <2e-16 ***
data09$X5m_curv -2.193e+02 8.232e+02 -0.266 0.7900
data09$X09.z 4.839e-02 7.546e-04 64.125 <2e-16 ***
data09$X5m_slp -3.406e-03 1.412e-03 -2.412 0.0159 *
data09$X5m_plcur 2.194e+02 8.232e+02 0.266 0.7899
data09$X5m_prcur -2.193e+02 8.232e+02 -0.266 0.7900
data09$X5m_twi 6.673e-03 3.039e-04 21.961 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.1132 on 98650 degrees of freedom
Multiple R-squared: 0.0532, Adjusted R-squared: 0.05314
F-statistic: 923.8 on 6 and 98650 DF, p-value: < 2.2e-16
Bedeutet im Prinzip die Wachstumshöhen sind über die gewählten Parameter nicht erklärbar. Was bedeutet das 3fache Sternchen genau? Und wie kann man das einfache Sternchen interpretieren?
Ist die Vorgehensweise generell richtig?
Ist der Weg über Excel M. Regression im Prinzip das Gleiche? (
http://cameron.econ.ucdavis.edu/excel/e ... ssion.html)?
Viele Grüße
Dirk