Hallo,
im Rahmen eines Projekts an der Uni habe ich im Frühling letzten Jahres Zähldaten zu den Blüten von WIldkirschen erhoben.
Die Rohdaten wurden mir anhand eines R-Codes in eine tabellarische Form überführt mit der ich in R gut arbeiten kann.
Ziel ist es nun anhand der folgenden 4 Variablen ein Modell (GLM) zu basteln, das die zu erwartende Blütenanzahl für einen Ast vorhersagen kann:
Prädiktoren:
Astdurchmesser (numerisch)
Astlänge (numerisch)
Himmelsausrichtung (kategorial)
Position in der Baumkrone (kategorial)
Response-Variable: Blütenanzahl
Mein Problem hierbei ist, dass die Einteilung der beprobten Äste auf eine Weise gemacht wurde, die die Daten ineinander verschachteln.
Also zB:
Der Ast 1 trägt laut Datensatz 300 Blüten, diese sind verteilt auf seine Hauptachse und seine 5 Nebenachsen (5 Unteräste)
Diese Nebenachsen werden aber als eigene Äste erfasst und im Datensatz angeführt, genauso wie der Ast 1, heißen dann aber eben Ast 1A, 1B, 1C, 1D und 1E.
Auf seiner Hauptachse trägt der Ast 1 eigentlich nur 120 Blüten, die restlichen 180 Blüten trägt er verteilt auf den Nebenachsen/Unteräste. Dennoch werden dem Ast 1 alle 300 Blüten zugeordnet da die Unteräste ja ihm angehören und also mitgezählt werden.
Da aber auch für alle Unteräste separat Angaben gemacht werden, haben wir hier das Problem dass die Blüten sozusagen zwei mal gezählt werden, einmal summiert auf dem Ast 1 und dann einzeln für jeden Unterast.
Damit diese Verzerrung(Doppelzählung der Daten im Modell berücksichtigt wird, denke ich dass ich sog. nested random effects anhand des R-Pakets lme4 einbauen muss.
Allerdings habe ich damit keine Erfahrung und tue mich sehr schwer zu begreifen, welche Funktion ich aus dem Paket wie genau verwenden muss.
Könnte mir da jemand weiterhelfen?
Vielen Dank und Beste Grüße!