Stichprobenumfang: Was als "n" nehmen?

Fragen, die sich auf kein spezielles Verfahren beziehen.

Stichprobenumfang: Was als "n" nehmen?

Beitragvon Simon303 » Mo 30. Jan 2012, 17:04

Hallo zusammen!

Ich bin Doktorand der Biologie und mich beschäftigt zur Zeit flgendes Problem, welches mein Biostatistik-Buch nicht beantwortet:

Ich messe Einzelereignisse an Einzelnen Zellen in einer Kulturschale (ganz grob: präsynaptische Vesikelfusionen, elektrophysiologisch an dissoziierten Neuronen) und wiederhole das mehrmals, um einen ausreichenden Stichprobenumfang zu erhalten. Es gibt 2 Gruppen (unterschiedlich behandelt). Aufgrund der hohen Variabilität zwischen einzelnen Zellen haben wir hier immer die einzelnen Zellen als n genutzt. Also alle auftertenden Ereignisse pro Zelle gemittelt, sodass wir je Zelle einen Messert haben, mit dem dann weitergerechnet wird. Es wird aber immer wieder behauptet (z.B. von Reviewern), man müsse die einzlene Behandlung als n nehmen. Eine einleuchtende Begründung bleibt da aber aus. So würde unser n natürlich schnell sehr klein, und die Arbeit vervielfacht sich.
Mich würde interessieren wie man denn Entscheidet, was jetzt das n ist. Man kann ja immer eine "Ebene" höher gehen. Wenn man das auf die Spitze treibt, hieße das in unserem Fall, dass ein einzelnes Tier das n ist. Zur anderen Seite könnten wir aber auch die oben erwähnten Einzelereignisse als n betrachten (gabs auch schon in Veröffentlichungen).

Was meint ihr dazu?

Gruß,
Simon
Simon303
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mo 30. Jan 2012, 16:50
Danke gegeben: 0
Danke bekommen: 2 mal in 2 Posts

Re: Stichprobenumfang: Was als "n" nehmen?

Beitragvon Simon303 » Mo 12. Mär 2012, 17:32

Hmm schade, ich dachte es gäbe hie rmehr Beteiligung. Also gut, weiter im Monolog:

Offensichtlich ist das ein aktuelles Problem welches unter dem Stichwort "Pseudoreplikation" gehandhabt wird. Das Problem wird schon lange diskutiert, zuerst taucht es hier auf:
Hurlbert SH: "Pseudoreplication and the design of ecological field experiments."; Ecol Monogr 1984, 54(2) :187-211

Aktuell gibt es mehrere Veröffentlichungen, die aber gegensätzliche Meinungen vertreten.
Das Argument GEGEN die "Pseudoreplikation" ist, dass gesammelte Datenpunkte oft nicht statistisch unabhängig seien und über größere experimentelle Einheiten gemittelt werden sollten. Also z.B. bei den statistischen Tests die Zellen aus einem Tier mitteln und Tiere = n setzen.
Wie es z.B. hier verlangt wird:
Stanley E Lazic: "The problem of pseudoreplication in neuroscientific studies: is it affecting your analysis?"; BMC Neuroscience 2010, 11:5 doi:10.1186/1471-2202-11-5

Das Problem dabei ist, dass ab einem gewissen Punkt ALLES abhängig ist, wie die Leute sagen, die meinen Pseudoreplikation sei kein wirkliches Problem und die Mittelung von Messpunkten führe zum Verlust von Informationen. Denn Tiere können auch voneinander Abhänig sein, wenn sie im selben Käfig leben. Und die Käfige stehen im selben Raum usw.....
Diskutiert wird das z.B. in diesem Paper:
Jeffrey C. Schank & Thomas J. Koehnle "Pseudoreplication is a Pseudoproblem"; J. Comparative Psychology 2009, Vol. 123, No. 4, 421–433

Ich denke, solange man seine Versuche hinreichend randomisiert und Umweltbedingungen konstant hält ist diese "Pseudoreplikation" kein Problem. Oder?
Simon303
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mo 30. Jan 2012, 16:50
Danke gegeben: 0
Danke bekommen: 2 mal in 2 Posts

Re: Stichprobenumfang: Was als "n" nehmen?

Beitragvon PonderStibbons » Mo 12. Mär 2012, 20:49

Hmm schade, ich dachte es gäbe hie rmehr Beteiligung.

Im deutschen Sprachraum mit 100 Millionen Mitgliedern haben im Querschnitt
so ca. 10-20 Leute die Kompetenz und die Lust darauf, kostenlos in Foren
statistische Beratung zu leisten. Da ist es nicht unbedingt zu erwarten, dass
für jede Fachrichtung mit ihren speziellen Problemen sogleich jemand
eine Lösung weiß.

Ich selber halte mich aus threads mit Petrischalen aus eben dem Grunde fern,
dass die Abhängigkeit der Messwerte evident ist, aber aus pragmatischen Gründen eine Rechtfertigung gesucht wird, dies ignorieren zu dürfen.
Es wundert mich auch, dass es angesichts des altbekannten Problems keine
Standards für die Lösung gibt. In der Sozialpsychologie oder der Pädagogik
(z.B.) hat man analoge Probleme mit Gruppen bzw. Schulklassen, da
lautet eben die Schlussfolgerung, Abhängigkeiten mitzumodellieren. In
der moderneren (und anspruchsvollen) Herangegehensweise in Form von Mehrebenenmodellen. In der eher simplen Variante kann man schauen,
ob man statt über die Mitglieder einer Petrischale zu mitteln, die einzelne
Petrischale als Stufe eines Faktors in einer ANOVA oder ANCOVA in die
Analyse aufnimmt. Aber wie bereits angedeutet, das Fachgebiet und seine Standards sind mir eher fremd.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Stichprobenumfang: Was als "n" nehmen?

Beitragvon Simon303 » Di 13. Mär 2012, 13:30

Hallo PonderStibbons,

Danke für deine Antwort. Mein Eingangs-Statement war keinesfalls fordernd gemeint. Daher habe ich auch mein Wissen bis jetz hier gepostet. Ich hätte den Satz wohl auch weglassen können, da hast du recht.

Zur Thematik:
Auch hier danke ich für die geäußerten Gedanken. Für mich ist es nicht ganz klar, warum die Abhängikeit der Messwerte evident ist, sonst hätte ich hier ja nicht gefragt. Ich möchte auch klarstellen: Es soll nichts ignoriert werden. Es ist nur so, dass unsere eigenen logischen Überlegungen im Widerspruch zu anderen stehen. Und das will aufgeklärt werden, also wo genau der Denkfehler liegt.
Die Grundfrage läuft doch darauf hinaus: Sind die Zellen in einer Petrischale voneinander abhängiger als einzelne Petrischalen. Da diese im selben Inkubator stehen, sind diese auch auch abhängig voneinander. Die Frage ist eben, wo man die Grenze zieht.
Da du offensichtlich der Meinung bist, man sollte die Petrischalen nehmen, bin ich daran interessiert, es auch zu verstehen. Andererseits verstehe ich auch deine Zurückhaltung , wenn dir das Fachgebiet fremd ist. Danke daher auch für die Beispiele.

Aber die Lösung über Mehrebenenmodelle finde ich auch interessant. Da werde ich mich mal genauer informieren. Irgendwelche Lektüre-Tips?
Simon303
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mo 30. Jan 2012, 16:50
Danke gegeben: 0
Danke bekommen: 2 mal in 2 Posts

Re: Stichprobenumfang: Was als "n" nehmen?

Beitragvon PonderStibbons » Di 13. Mär 2012, 13:58

Auch hier danke ich für die geäußerten Gedanken. Für mich ist es nicht ganz klar, warum die Abhängikeit der Messwerte evident ist,

Vielleicht habe ich auch falsche Vorstellungen. Ich dachte, die Zellen in einer
Schale würden gemeinsam dort aufgezogen und ernährt.
Die Grundfrage läuft doch darauf hinaus: Sind die Zellen in einer Petrischale voneinander abhängiger als einzelne Petrischalen. Da diese im selben Inkubator stehen, sind diese auch auch abhängig voneinander. Die Frage ist eben, wo man die Grenze zieht.

Dass die einzelnen Petrischalen unabhängige Elemente von Zufallsstichproben darstellen,
ist weitaus leichter anzunehmen, als man dies bei gemeinsam aufgezogene Zellen, die sich
dasselbe Milieu, die Nährstoffe etc. teilen. Aber wie gesagt, ich habe da vielleicht falsche
Vorstellungen.

Generell reduziert man bei einer Betrachtung der Schale als Stichprobenelement zwar
seine Stichprobe, aber man bekommt durch Aggregieren der Messungen innerhalb der
Stichprobe präzisere Parameterschätzungen, weil sich Zufälle ausmitteln. Insofern sehe
ich das nicht von vornherein nur als handicap.
Aber die Lösung über Mehrebenenmodelle finde ich auch interessant. Da werde ich mich mal genauer informieren. Irgendwelche Lektüre-Tips?

Über einführenede Texte bin ich nicht auf dem neuesten Stand. Du könntest nach
einem introductory Buch recherchieren, in dem das anhand der von Dir verwendeten
Software beschrieben wird.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Stichprobenumfang: Was als "n" nehmen?

Beitragvon Simon303 » Di 13. Mär 2012, 17:45

Dass die einzelnen Petrischalen unabhängige Elemente von Zufallsstichproben darstellen,
ist weitaus leichter anzunehmen, als man dies bei gemeinsam aufgezogene Zellen, die sich
dasselbe Milieu, die Nährstoffe etc. teilen. Aber wie gesagt, ich habe da vielleicht falsche
Vorstellungen.


Also Du hast schon recht, die Zellen einer Schalen teilen sich das Nährmedium. Sicher ist es weitaus leichter anzunehmen, das die Schalen unabhägiger voneinander sind als die Zellen. Daraus kann man ja aber nichts über die Stärke der Abhängikeit sagen. Das Medium ist chemisch eindeutig definiert und hat daher sehr konstante Zusammensetzungen. Ok, die Zellen interagieren natürlich trotzdem untereinander, aber das erhöht ja nicht die Variabilität zwischen den Schalen... glaube ich.


Generell reduziert man bei einer Betrachtung der Schale als Stichprobenelement zwar
seine Stichprobe, aber man bekommt durch Aggregieren der Messungen innerhalb der
Stichprobe präzisere Parameterschätzungen, weil sich Zufälle ausmitteln. Insofern sehe
ich das nicht von vornherein nur als handicap.


Ich hab mal meine bisherigen Daten neu durchgerechnet und auf gesamte Präparationen (d.H. Schalen) gemittelt. Für Streuung und Mittelwerte ändert sich nicht viel, die Streuung scheint sogar etwas kleiner (das heißt die Varianzen zwischen den Zellen sind in etwa genauso groß oder größer wie zwischen den Schalen?). Aber da das n kleiner wird, "verliert" man natürlich Teststärke.


Also nochmal eine allgemeinere Frage zum Verständnis.
Also ich verstehe, wenn es z.B. um wenige Individuen geht, d.H. wenn man Zellen verlgeicht, bei denen Gruppe A aus einem Tier und Gruppe B aus einem anderen Tier kommen. Dann kann man natürlich trotz 100 Messungen pro Gruppe nicht sehr genau den Mittelwert der Population bestimmen, nur den für das Tier. Aber je mehr Tiere man hat, also sagen wir 5 Tiere à 20 Messungen, desto eher erhält man doch Informationen aus der Gesamtpopulation, auch wenn man diese Werte nicht über die Tiere mittelt? Ich verstehe, dass man zwischen den Varianzen der Stichproben und denen der Population unterscheiden muss, aber je gleichmäßiger ich meine Messungen auf viele Individuen "verteile", desto weniger Fehler mache ich doch bei der Schätzung, oder?


In der eher simplen Variante kann man schauen,
ob man statt über die Mitglieder einer Petrischale zu mitteln, die einzelne
Petrischale als Stufe eines Faktors in einer ANOVA oder ANCOVA in die
Analyse aufnimmt.


Die ANOVA werde ich nochmal prüfen, aber irgendwie erscheint mir das nicht der richtige Weg zu sein. Wenn ich die Petrischalen als weitere Faktorstufe hinzufüge, hätte ich zwei Faktoren: Petrischale und Behandlung. Ich bräuchte also die zweifaktorielle ANOVA. Aber Effekte von Faktoren werden doch als feste (und nicht zufällige) Effekte modelliert und sind in meinem Fall unpassend, oder? Hinzu kommt, dass ich natürlich viele Petrischalen habe und die Behandlungen sich nicht kombinieren lassen (ist eine Petrischale behandelt, kann sie ja schlecht noch einmal anders behandelt werden), wie es die Testtheorie voraussetzt?
ANCOVA dagegen sagt mir nichts, da werde ich wohl auch nochmal nachforschen.
Simon303
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mo 30. Jan 2012, 16:50
Danke gegeben: 0
Danke bekommen: 2 mal in 2 Posts

Re: Stichprobenumfang: Was als "n" nehmen?

Beitragvon Simon303 » Mo 19. Mär 2012, 17:01

Also eine "Nested", also hierachische ANOVA ist wohl das Richtige, hab das auch schon mal durchgerechnet, scheint soweit zu funktionieren.
Jetzt bin ich nur noch auf der Suche nach einem geeigneten Test, um paarweise Mittelwerte zu vergleichen, also post-hoc/a posteriori.
Simon303
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mo 30. Jan 2012, 16:50
Danke gegeben: 0
Danke bekommen: 2 mal in 2 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot], Mr_Chow und 5 Gäste