Guten Tag ich habe eine Reihe von statistischen Problem, die ich zu lösen versuche.
Im Folgenden beschreibe ich meine Aufgabenstellung und danach meine Vorgehensweise. Die Exceldatei mit der ich arbeite ist auch angefügt.
Zunächst mache ich Fotos von verschiedenen Zellen. Auf den Fotos sind immer unterschiedliche viele Zellen abgebildet (1-15 sind ungefähr möglich) und es ist mir nicht möglich zu erkennen, wo eine Zelle endet und die nächste beginnt.
Nachdem ich die Fotos gemacht habe, zähle ich Kreise, die bestimmte Strukturen anfärben, auf den Fotos und messe deren Durchmesser.
Meine erste Aufgabe lautet folgende Dinge fertig zu stellen:
-Die Durchschnittsgröße aus allen erfassten Werten ermitteln und ein Diagramm erstellen, das eine durchschnittliche Größenverteilung für eine Zelle wiedergibt mit Fehlerbalken.
-Die durchschnittliche Anzahl an Kreisen für eine Zelle ermitteln
-Für alle ermittelten Werte muss ich die Standardabweichung, Varianz und Signifikanz berechnen
(p-Wert). Wobei ich den Hintergrund dieser Begriffe noch nicht ganz verstanden habe.
In einem weiteren Schritt soll ich die Aussagekraft der Unterschiede zwischen verschiedenen Zellarten für die ich solche Auswertungen vornehme bewerten und eine Aussage darüber treffen können, wie viele Zellen noch ausgezählt werden müssen um unsere ermittelten Unterschiede erhärten zu können, bzw. bewerten können, ob es überhaupt Sinn macht weitere Zellen auszuwerten.
Der Vergleich soll zunächst mittels Anova vorgenommen werden.
Danach sollen unterschiedliche Strukturen (alles Kreise in verschiedenen Farben) in jeder Zelle angefärbt und auf die gleiche Weise ausgewertet werden und auch wieder Unterschiede und Zusammenhänge ermittelt mittels one, two oder three way-anovas
Zunächst möchte ich alles in Excel verwirklichen und später das Vorgehen in andere Programme übertragen können.
Was ich bisher getan habe (Excel Datei anbei):
In einer Exceldatei habe die gemessenen Durchmesser für jedes Bild separat in einer Spalte gesammelt und in einer anderen Spalte aufgeführt wie viele Zellen auf dem Bild waren.
Anschließend habe für jedes Bild die durchschnittliche Anzahl von Messwerten pro Zelle folgendermaßen ermittelt:
Anzahl Messwerte gesamt vom Bild : Anzahl von Zellen auf dem Bild.
Von diesen Mittelwerten, habe ich wiederum einen Mittelwert gebildet und zwar folgendermaßen:
Mittelwert Bild1 + Mittelwert Bild2 … : Anzahl der Bilder .
Das ist so nicht richtig, denke ich, da nicht berücksichtigt wird, dass es unterschiedlich viele Zellen auf den Bildern zu sehen gibt.
Dann habe ich noch die STABW von den Werten Mittelwert Bild 1, Mittelwert Bild2… berechnen lassen und sie prozentual zum zuvor ausgerechneten Mittelwert aller Bilder ausgedrückt. Das ist denke ich wieder falsch aus dem gleichen Grund wie zuvor.
Nun habe ich die einzelnen Messwerte aller Bilder in einer einzigen Spalte vereint, sie sortiert nach Durchmesser sortiert, gezählt und die Anzahl in einer weiteren Spalte notiert und diese Anzahl wiederum durch die Summe der Zellen auf allen Bildern geteilt.
Mit diesen Anzahlen pro Durchmesser habe ich ein Säulendiagramm erstellen können für die durchschnittliche Größenverteilung in einer Zelle.
Leider aber ohne Fehlerbalken.
Vielleicht fehlt hier ein Zwischenschritt für die Korrektheit, indem ich erst für jedes Bild zähle und dann weiter verfahre um in einem Diagramm dass ich auf eine Zelle herunterbreche einen Fehlerbalken einfügen zu können.
Sobald, dass was ich zuvor beschreiben habe statistisch sauber erledigt ist, würde ich die Werte unterschiedlicher Ziellinien gerne mittels anovas miteinander vergleichen.
Wenn es jemand bis hier geschafft hat, schon einmal vielen Dank fürs lesen.
Die Exceldatei kann man hier herunterladen:
https://fromsmash.com/EjogXLQ1sH-dt