Hallo,
ich habe räumliche Datensätze von Pflanzenhöhen, also deren Verteilung über einen gewissen Bereich für 3 Zeitabstände eines Jahres. Im Prinzip möchte ich die Bereiche herausfinden, die generell ein schlechtes, normales oder sehr gutes Wachstum über alle 3 Zeitabstände zeigen. Da ich jeweils einen gewissen Zuwachs habe (z.b. 10, 25, 45 cm), macht Clustern für mich keinen Sinn, da ich ja dann wieder diese Zeitabstände herausarbeite, oder? Deshalb denke ich, dass eine Principal Component Analyse (PCA) mehr Sinn machen würde. Kann ich dann die Eigenvektoren pro Flächeneinheit nutzen, die ja dann theoretisch die gemittelte Stärke der Pflanzenhöhe sind, um diese mit anderen Daten wie der Hangneigung in einer Regression zu evaluieren?
Letzteres ist eigentlich das Gesamtziel, die relativ hohe Variabilität des Pflanzenwachstums über Parameter (z.b. Bodeneigenschaften etc.) erklären zu können. Pro Zeitschiene ist dies einfach, wenn ich aber eine Zusammenfassung haben möchte (pro Jahr), brauche ich eine zusammenfassende Lösung. Und ich bin mir nicht sicher welches Konzept (Cluster, PCA) richtig ist.
Vielen Dank im Vorraus
Dirk
PS: das meiste mach ich in R.