Umgang mit fehlenden Werten

Fragen, die sich auf kein spezielles Verfahren beziehen.

Umgang mit fehlenden Werten

Beitragvon Carabus » Di 17. Sep 2019, 09:32

Hallo zusammen,

zurzeit schreibe ich an meiner Bachelorarbeit im Bereich der Freilandökologie und stehe nun vor der statistischen Auswertung meiner erfassten Daten.
Erstmal zum Versuchsaufbau: Es ging im praktischen Teil der Arbeit darum, bodenbewohnende Käfer (Laufkäfer) in meinem Untersuchungsgebiet zu erfassen. Dafür wurden auf sechs Teilflächen jeweils fünf Bodenfallen, also insgesamt 30 Fallen, eingesetzt, die im Untersuchungszeitraum sieben Mal geleert wurden (also sieben Fangintervalle). Die gefangenen Tiere wurden anschließend nach Art bestimmt. Bisher habe ich also eine Liste, auf welchen Teilflächen wann welche und wie viele Käfer gefangen wurden. Die Fallen sollen übrigens nicht einzeln, sondern gemeinsam nach Teilflächen ausgewertet werden.

Nun zu meinem Problem: Leider kam es immer mal wieder vor, dass einzelne (oder mehrere) Fallen durch Wildschweine ausgegraben wurden (für die ist so eine Falle voller Käfer nämlich eine Art Gratis-All-You-Can-Eat-Buffet). Das hat dazu geführt, dass mir nicht (wie geplant) 7 * 30 (also 210) Fallenfänge vorliegen, sondern nur 196. Das bedeutet für manche Fangintervalle, dass mir für eine Teilfläche beispielsweise nur zwei statt fünf auswertbare Fallen zur Verfügung standen.

Was kann man in so einem Fall machen?

Viele Grüße
Carabus
Carabus
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 17. Sep 2019, 08:42
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Umgang mit fehlenden Werten

Beitragvon PonderStibbons » Di 17. Sep 2019, 10:04

Wieviele Käfer sind üblicherweise in so einer Falle?

Auf wie viele verschiedene Fallen und auf welche
der 6 Teilflächen verteilen sich die 14 fehlenden Werte?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Umgang mit fehlenden Werten

Beitragvon bele » Di 17. Sep 2019, 11:59

Haben die Wildschweine zufällig irgendwelche Fallen ausgegraben oder muss man befürchten, dass die Wildschweine nur die Fallen ausgegraben haben, die besonders viele Käfer enthielten?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5927
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

Re: Umgang mit fehlenden Werten

Beitragvon Carabus » Mi 18. Sep 2019, 15:34

@bele: Das ist schwer zu sagen. Möglicherweise suchen die sich schon die Fallen mit dem meisten Inhalt aus, allerdings sind das dann nicht nur Laufkäfer (die mich interessieren), sondern auch Schnecken, Ameisen, andere Käfer (die mich nicht interessieren); manchmal sind die Fallen voll mit allen möglichen Tieren, aber es ist kein einziger Laufkäfer dabei. Von daher würde ich (in Bezug auf die Laufkäfer) von einem zufälligen Ausgraben ausgehen.

@PonderStibbons: Insgesamt habe ich 147 Käfer aus den 196 Einzelfängen, also pro Falle im Durchschnitt weniger als 1 Käfer. Die verteilen sich aber nicht gleichmäßig auf die Teilflächen. Hier mal eine Übersicht über die insgesamt gefangenen Käfer und die auswertbaren Fallen (maximal 35):

Fläche A: 82 Käfer aus 31 Fallen
Fläche B: 27 Käfer aus 31 Fallen
Fläche C: 5 Käfer aus 35 Fallen
Fläche D: 16 Käfer aus 35 Fallen
Fläche E: 13 Käfer aus 35 Fallen
Fläche F: 4 Käfer aus 29 Fallen

Viele Grüße
Carabus
Carabus
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 17. Sep 2019, 08:42
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Umgang mit fehlenden Werten

Beitragvon PonderStibbons » Mi 18. Sep 2019, 16:01

Wie lautet die Fragestellung, das Auswertungsziel?

Mit freudlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Umgang mit fehlenden Werten

Beitragvon bele » Mi 18. Sep 2019, 21:04

Ich weiß nicht, ob ich in den nächsten Tagen ins Netz komme, deshalb warte ich die Antwort auf PonderStibbons' zentrale Frage nicht ab.

Wenn man davon ausgeht, dass die Fallen alle bei gleichem Wetter über gleiche Zeiträume etc draußen gestanden haben, dann kann man das Problem wohl auf den Quotient Käfer pro Falle reduzieren. Wenn man einige vernünftige Unabhängigkeitsannahmen macht (zum Beispiel dass ein gefangener Käfer nicht die Chance auf einen weiteren Käfer verändert), dann bietet es sich an, das als Poisson-Prozess zu modellieren (Poisson-Verteilung googlen und prüfen).

Die conjugate distribution (gibt es dafür ein deutsches Wort?) für die Poissonverteilung ist die Gamma-Verteilung ( https://en.wikipedia.org/wiki/Conjugate_prior )
Auf Fläche A nehmen wir an, dass 82/31=2,6 Käfer pro Falle auftreten. Da hier 31 Fallen ausgewertet wurden ist diese Zahl mit einer größeren Unsicherheit verbunden als die mit 35 Fallen bestimmte und mit weniger Unsicherheit als die mit 29 Fallen bestimmte.

Um die Likelihood verschiedener möglicher Fangraten zu visualisieren kannst Du Dir R installieren ( http://www.r-project.org ) und folgendes hinein copy-pasten
Code: Alles auswählen
curve(dgamma(x, 82, 31), xlim=c(0,5), xlab="angenommene Rate", yaxt="no", ylab="likelihood")


Das Maximum dieser Likelihoodkurve liebt erwartungsgemäß bei 2,6. Du kannst die anderen Beobachtungszahlen einsetzen und sehen, wie die Breite der Kurve und damit die Präzision mit der die Rate bestimmt wurde von der Zahl der Fallen abhängt.

R bietet Dir außerdem eine Funktion für einen Signifikanztest. Wenn Du beispielsweise testen möchtest, ob Fläche A und Fläche C grundsätzlich die gleiche Fangrate in einem Poissonmodell haben könnten, dann macht das folgender Aufruf

Code: Alles auswählen
poisson.test(x=c(82, 27), T=c(5, 35))


Der p-Wert ist, wie die Anschauung vermuten lässt, mit sehr vielen Nullen hinter dem Komma gesegnet.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5927
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste