Vermeidung Pseudoreplikation: Wie meine Daten auswerten?

Fragen, die sich auf kein spezielles Verfahren beziehen.

Vermeidung Pseudoreplikation: Wie meine Daten auswerten?

Beitragvon danielfunk » Fr 8. Jan 2016, 21:17

Liebe Community,
Im Rahmen meiner Diplomarbeit werte ich mit elektronenmikroskopischen Verfahren den Eisengehalt in verschiedenen Hirnregionen aus und untersuche dabei, welche Zelltypen und welche unterliegende Strukturen hierbei maßgeblich beteiligt sind. Die Proben aus Hirnregionen werden von insgesamt ca 10 verschiedenen Gehirnen stammen.

Ich habe in meinen ersten Überlegungen den Datensatz gedanklich so anordnen wollen, dass jede ausgewertet Zelle in einer Zeile dargestellt wird (wären dann ca. n=250), und über Wertlisten einerseits die Zuordnung zum jeweiligen Gehirn, zur Hirnregion, zu Zelltypus, etc. erfolgt.
Mit den eben beschriebenen Daten wäre jedenfalls u.a. mein Plan gewesen, die unabhängigen kategorialen Variablen Zelltyp und Hirnregion gegen die abhängige diskrete Variable Counts auf Unterschiede zu überprüfen (mehrfaktorielle ANOVA ohne Messwiederholung).

Mein erster Versuch des späteren Arrangements der Daten ist aber wie es aussieht völlig falsch: Ein Kollege hat mich darauf hingewiesen, dass eine derartige Auswertung nicht möglich sei, da mein n=10 (Gehirne) ist, und sich daran nichts rütteln lässt. Genauso, dass es unmöglich wäre, die Zellen als einzelne Datenzeilen mit n=250 darstellen zu wollen, da ich diese dann als unabhängig betrachten würde, obwohl eine klare Abhängigkeit vorliegt (mehrere Zellen gehören zu einem Gehirn). Soweit ich das nun durch nachlesen richtig verstanden habe, also eine Pseudoreplikation.

Wenn ich das ganze also nun gedanklich korrekt darstelle, hätte ich richtigerweise insgesamt nur 10 Zeilen (n=10 Gehirne) mit jeweils bis zu 80 Messungen in den Spalten (für verschiedenen Hirnregionen und deren Zellen). Dies so auszuwerten wäre jedoch in meinen Augen völliger Nonsens. Mein erster gedanklicher Ansatz wäre somit, die Mittelwerte der Eisencounts in einem Setting wie anfangs beschrieben als Gruppen auszuwerten, um danach dann ein völlig neues Datenset zu generieren, wo n=10.
->Könnte ich dann hier einfach die jeweiligen Spalten mit „Hirnregion und Zelltyp“ benennen und pro Zeile den entsprechenden zuvor ermittelten Mittelwert eingeben? Somit hätte ich dann die Abhängigkeit der Werte zu dem entsprechenden Gehirn ja gesichert? Danach kann ich, sofern mit dem geringen n möglich, ja schauen, ob sich überhaupt etwas mit inferentieller Statistik anfangen lässt, oder ich mich auf deskriptive Auswertungen beschränken muss.

Stimmen diese neuen Ansatzpunkte oder denke ich hier zu kompliziert oder generell falsch?

Sorry für den langen Text, ich hoffe es ist/war halbwegs verständlich ausgedrückt.
Ich bin für jegliche Hilfe dankbar!

LG
danielfunk
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Fr 8. Jan 2016, 14:17
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Vermeidung Pseudoreplikation: Wie meine Daten auswerten?

Beitragvon bele » Sa 9. Jan 2016, 00:18

Hi,

zunächst geht es nicht umZeilen und Spalten, sondern um ein statistisches Modell. Was weißt Du über Messwiederholungs-ANOVAs?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5920
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1401 mal in 1387 Posts

folgende User möchten sich bei bele bedanken:
danielfunk

Re: Vermeidung Pseudoreplikation: Wie meine Daten auswerten?

Beitragvon danielfunk » Sa 9. Jan 2016, 01:14

Danke erstmal für die schnelle Antwort.

Sorry bezüglich meinem Zeilen/Spalten-Denken, ich bin sonst freizeittechnisch eher mit Datenbanken beschäftigt und habe das dementsprechend immer gedanklich dann so im Kopf, wie ich meine Daten nach Importierung in SPSS sehe... :P

Nun, mir sind ANOVAs mit MW generell nur aus der klinischen Forschung bekannt, wobei z.B. eben im einfaktoriellen Fall Mittelwerte der gleichen Patienten (verbundene Stichproben) zu z.B. unterschiedlichen Punkten (z.B. Messzeitpunkten) verglichen werden - 1 AV auf 1 kateg. UV mit >2 Faktorstufen. Allerdings sehe ich nicht, wie ich bei den Gehirnen mit n=10 überhaupt noch eine kategoriale Variable für die unterliegenden gemessenen Zellen einführen könnte (habe von jeder Zelle nur eine Messung), geschweige denn die Voraussetzungen für eine Normalverteilung erfüllen kann - Hier könnte ich also m.E. nur mehr die bereits errechneten Mittelwerte (nach Hirnregionen und Zelltypen für jedes Gehirn) des vorherigen ersten Datensatzes einspielen, in dem ich nur für deskriptive Verfahren alle erfassten Zellen als n ansehe.

Vielleicht denke ich hier generell aber auch falsch - wie hattest du das mit der MW-ANOVA angedacht?

LG
danielfunk
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Fr 8. Jan 2016, 14:17
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Vermeidung Pseudoreplikation: Wie meine Daten auswerten?

Beitragvon bele » Sa 9. Jan 2016, 09:39

danielfunk hat geschrieben:Mit den eben beschriebenen Daten wäre jedenfalls u.a. mein Plan gewesen, die unabhängigen kategorialen Variablen Zelltyp und Hirnregion gegen die abhängige diskrete Variable Counts auf Unterschiede zu überprüfen (mehrfaktorielle ANOVA ohne Messwiederholung).


Du hast n=250 Zellen, aber das sind eben wiederholte Messungen von nur 10 Gehirnen. Du darfst weder so rechnen, als ob das 250 unabhängige Messungen wären noch wäre es klug, mit nur n=10 Mittelwerten in SPSS zu starten. Wenn man so tun darf, als wären Deine Zählwerte kontinuierliche Werte, dann wäre die repeated measures ANOVA ein Ansatz, der beides verbindet. Bei Zählwerten könnte man auch ein lineares Poisson-Modell erwägen. Immerhin mal zwei Stichworte zum Googlen und Youtuben.

Schönes Wochenende,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5920
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1401 mal in 1387 Posts

folgende User möchten sich bei bele bedanken:
danielfunk


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 17 Gäste

cron