STATISTIK-FORUM.de

Bernie · von **Bernie** » Mi 19. Feb 2020, 15:30

Guten Tag ich habe eine Reihe von statistischen Problem, die ich zu lösen versuche.
Im Folgenden beschreibe ich meine Aufgabenstellung und danach meine Vorgehensweise. Die Exceldatei mit der ich arbeite ist auch angefügt.

Zunächst mache ich Fotos von verschiedenen Zellen. Auf den Fotos sind immer unterschiedliche viele Zellen abgebildet (1-15 sind ungefähr möglich) und es ist mir nicht möglich zu erkennen, wo eine Zelle endet und die nächste beginnt.
Nachdem ich die Fotos gemacht habe, zähle ich Kreise, die bestimmte Strukturen anfärben, auf den Fotos und messe deren Durchmesser.

Meine erste Aufgabe lautet folgende Dinge fertig zu stellen:

-Die Durchschnittsgröße aus allen erfassten Werten ermitteln und ein Diagramm erstellen, das eine durchschnittliche Größenverteilung für eine Zelle wiedergibt mit Fehlerbalken.
-Die durchschnittliche Anzahl an Kreisen für eine Zelle ermitteln
-Für alle ermittelten Werte muss ich die Standardabweichung, Varianz und Signifikanz berechnen
(p-Wert). Wobei ich den Hintergrund dieser Begriffe noch nicht ganz verstanden habe.

In einem weiteren Schritt soll ich die Aussagekraft der Unterschiede zwischen verschiedenen Zellarten für die ich solche Auswertungen vornehme bewerten und eine Aussage darüber treffen können, wie viele Zellen noch ausgezählt werden müssen um unsere ermittelten Unterschiede erhärten zu können, bzw. bewerten können, ob es überhaupt Sinn macht weitere Zellen auszuwerten.
Der Vergleich soll zunächst mittels Anova vorgenommen werden.
Danach sollen unterschiedliche Strukturen (alles Kreise in verschiedenen Farben) in jeder Zelle angefärbt und auf die gleiche Weise ausgewertet werden und auch wieder Unterschiede und Zusammenhänge ermittelt mittels one, two oder three way-anovas
Zunächst möchte ich alles in Excel verwirklichen und später das Vorgehen in andere Programme übertragen können.

Was ich bisher getan habe (Excel Datei anbei):

In einer Exceldatei habe die gemessenen Durchmesser für jedes Bild separat in einer Spalte gesammelt und in einer anderen Spalte aufgeführt wie viele Zellen auf dem Bild waren.

Anschließend habe für jedes Bild die durchschnittliche Anzahl von Messwerten pro Zelle folgendermaßen ermittelt:

Anzahl Messwerte gesamt vom Bild : Anzahl von Zellen auf dem Bild.

Von diesen Mittelwerten, habe ich wiederum einen Mittelwert gebildet und zwar folgendermaßen:
Mittelwert Bild1 + Mittelwert Bild2 … : Anzahl der Bilder .
Das ist so nicht richtig, denke ich, da nicht berücksichtigt wird, dass es unterschiedlich viele Zellen auf den Bildern zu sehen gibt.

Dann habe ich noch die STABW von den Werten Mittelwert Bild 1, Mittelwert Bild2… berechnen lassen und sie prozentual zum zuvor ausgerechneten Mittelwert aller Bilder ausgedrückt. Das ist denke ich wieder falsch aus dem gleichen Grund wie zuvor.

Nun habe ich die einzelnen Messwerte aller Bilder in einer einzigen Spalte vereint, sie sortiert nach Durchmesser sortiert, gezählt und die Anzahl in einer weiteren Spalte notiert und diese Anzahl wiederum durch die Summe der Zellen auf allen Bildern geteilt.

Mit diesen Anzahlen pro Durchmesser habe ich ein Säulendiagramm erstellen können für die durchschnittliche Größenverteilung in einer Zelle.
Leider aber ohne Fehlerbalken.

Vielleicht fehlt hier ein Zwischenschritt für die Korrektheit, indem ich erst für jedes Bild zähle und dann weiter verfahre um in einem Diagramm dass ich auf eine Zelle herunterbreche einen Fehlerbalken einfügen zu können.

Sobald, dass was ich zuvor beschreiben habe statistisch sauber erledigt ist, würde ich die Werte unterschiedlicher Ziellinien gerne mittels anovas miteinander vergleichen.
Wenn es jemand bis hier geschafft hat, schon einmal vielen Dank fürs lesen.

Die Exceldatei kann man hier herunterladen:
https://fromsmash.com/EjogXLQ1sH-dt

bele · von **bele** » Mi 19. Feb 2020, 16:39

Hallo Bernie,

willkommen im Forum. Deine Exceldatei kann ich gerade nicht öffnen, mag aber an meinem Browser oder an meinem Arbeitgeber und dessen Sicherheitseinstellungen liegen.

Bernie hat geschrieben:Zunächst mache ich Fotos von verschiedenen Zellen.

Wir reden von biologischen Zellen unter einem Lichtmikroskop oder zumindest etwas damit vergleichbares?

-Für alle ermittelten Werte muss ich die Standardabweichung, Varianz und Signifikanz berechnen
(p-Wert). Wobei ich den Hintergrund dieser Begriffe noch nicht ganz verstanden habe.

Es wird Dir klar sein, dass Du diese Begrifflichkeiten erst zu fassen kriegen musst, bevor Du von der beschreibenden zur prüfenden Statistik übergehst. Solche Grundbegriffe sind in jedem Buch besser nachzulesen als in einem Forum zu erklären. Wenn Du aber konkrete Schwierigkeiten beim Verstehen des Buches hast, kannst Du die hier gerne thematisieren.

Der Vergleich soll zunächst mittels Anova vorgenommen werden.

ANOVA steht für Varianzanalyse, weshalb Du zunächst einmal den Begriff der Varianz verinnerlicht haben solltest.

Zunächst möchte ich alles in Excel verwirklichen und später das Vorgehen in andere Programme übertragen können.

Ich darf vielleicht sagen, dass ich das nicht klug finde. Suche mal nach JASP. Das ist kostenlos und interagiert hervorragend mit Excel und Du ersparst Dir die Klimmzüge, die gute Grafiken und Varianzanalysen in Excel bedeuten.

Was ich bisher getan habe (Excel Datei anbei):

In einer Exceldatei habe die gemessenen Durchmesser für jedes Bild separat in einer Spalte gesammelt und in einer anderen Spalte aufgeführt wie viele Zellen auf dem Bild waren.

Von diesen Mittelwerten, habe ich wiederum einen Mittelwert gebildet und zwar folgendermaßen:
Mittelwert Bild1 + Mittelwert Bild2 … : Anzahl der Bilder .
Das ist so nicht richtig, denke ich, da nicht berücksichtigt wird, dass es unterschiedlich viele Zellen auf den Bildern zu sehen gibt.

Was richtig ist, hängt davon ab, was Du genau berechnen möchtest. Ich vermute aber: Du hast eine Spalte mit der Anzahl der angefärbten Strukturen und eine Spalte mit Anzahl der Bilder. Wenn Du nun die Spaltensumme mit allen Strukturen durch die Spaltensumme mit allen Bilderanzahlen teilst, hast Du die durchschnittliche Anzahl Punkte pro Zelle.

Dann habe ich noch die STABW von den Werten Mittelwert Bild 1, Mittelwert Bild2… berechnen lassen und sie prozentual zum zuvor ausgerechneten Mittelwert aller Bilder ausgedrückt. Das ist denke ich wieder falsch aus dem gleichen Grund wie zuvor.

Kommt wieder darauf an, ob Du Varianzen/Standardabweichungen pro Bild oder pro Zelle berechnen willst. Meines Erachtens ist das eine nicht sinnvoll und das andere nicht möglich. Nehmen wir an, Du hast 5 Zellen und 10 Strukturen. Wenn jede Zelle 2 Strukturen enthält ergibt das eine ganz andere Varianz/Standardabweichung der Strukturen pro Zelle als wenn eine Zelle 10 und die anderen alle keine angefärbten Strukturen haben. Um das zu verstehen musst Du Dir die Begriffe Varianz une Standardabweichung klar machen und zwar als allernächsten Schritt, bevor Du nochmal einen Computer anfasst.

Mit diesen Anzahlen pro Durchmesser habe ich ein Säulendiagramm erstellen können für die durchschnittliche Größenverteilung in einer Zelle.
Leider aber ohne Fehlerbalken.

Fehlerbalken kann man mit Excel darstellen ( https://www.ablebits.com/office-addins- ... Excel-2016 ) aber ich würde wirklich raten, die Grafiken von Anfang an in einem Statistikprogramm zu machen. JASP oder PSPP oder was Dir zur Verfügung steht.

Das mit den ANOVAs wird nicht ganz banal, aber zunächst musst Du Dir des Problems mit den pro Zelle unbestimmbaren Varianzen und den pro Bild unvergleichbgaren Varianzen klar machen, sonst stocherst Du in Sachen ANOVA im Dunkeln.

LG,
Bernhard

folgende User möchten sich bei bele bedanken:
Bernie

Bernie · von **Bernie** » Mi 19. Feb 2020, 17:04

Hallo Bernhard,
vielen Dank für die schnelle und umfangreiche Antwort.

Ja, es handelt sich um biologische Zellen. Ich werde was du geschrieben hast auf jeden Fall Punkt für Punkt abarbeiten.

Ich kann gerne versuche die Datei wo anders hoch zu laden. Hier hat es leider nicht geklappt.

Mir steht Graphpad zur Verfügung. Bis jetzt arbeite ich in Excel und versuche alles automatisch erldedigen zu lassen, soweit möglich, aber ich sehe ein, dass du recht hast und ich auf ein anderes Programm umsteigen sollte.

Bernie · von **Bernie** » Do 20. Feb 2020, 14:07

Es wird Dir klar sein, dass Du diese Begrifflichkeiten erst zu fassen kriegen musst, bevor Du von der beschreibenden zur prüfenden Statistik übergehst. Solche Grundbegriffe sind in jedem Buch besser nachzulesen als in einem Forum zu erklären. Wenn Du aber konkrete Schwierigkeiten beim Verstehen des Buches hast, kannst Du die hier gerne thematisieren.

Ich habe mir nun den nötigen Überblick verschafft.

Deine Exceldatei kann ich gerade nicht öffnen, mag aber an meinem Browser oder an meinem Arbeitgeber und dessen Sicherheitseinstellungen liegen.

Die Seite, die ich zum hochladen benutzt habe reagiert sehr langsam und es dauert ein bisschen, bis man überhaut etwas angezeigt bekommt.

Was richtig ist, hängt davon ab, was Du genau berechnen möchtest. Ich vermute aber: Du hast eine Spalte mit der Anzahl der angefärbten Strukturen und eine Spalte mit Anzahl der Bilder. Wenn Du nun die Spaltensumme mit allen Strukturen durch die Spaltensumme mit allen Bilderanzahlen teilst, hast Du die durchschnittliche Anzahl Punkte pro Zelle.

Genau das habe ich gemacht. Jetzt möchte ich von diesen berechnetet Mittelwert aber wiederum einen Mittelwert berechnen und würde dies gerne so tun, dass ich noch einen Standardfehler dazu angeben kann. Momentan habe ich einfach die Standardabweichung meiner einzelnen Mittelwerte berechnet und diese dann ins Verhältnis zum Mittelwert der Mittelwerte gesetzt.

Kommt wieder darauf an, ob Du Varianzen/Standardabweichungen pro Bild oder pro Zelle berechnen willst. Meines Erachtens ist das eine nicht sinnvoll und das andere nicht möglich. Nehmen wir an, Du hast 5 Zellen und 10 Strukturen. Wenn jede Zelle 2 Strukturen enthält ergibt das eine ganz andere Varianz/Standardabweichung der Strukturen pro Zelle als wenn eine Zelle 10 und die anderen alle keine angefärbten Strukturen haben. Um das zu verstehen musst Du Dir die Begriffe Varianz une Standardabweichung klar machen und zwar als allernächsten Schritt, bevor Du nochmal einen Computer anfasst.

Das ist aber genau mein Problem. Ich kann keine Individuen auswerten, sondern nur unterschiedlich große Gruppen. Allerdings kenne ich immer die Anzahl der Mitglieder der Gruppe, kann die Gruppenmitglieder aber nicht auseinander halten. Nur die Gruppen kann ich voneinander trennen.
Ich möchte aber alle meine Daten zusammenfasse und diese später mehreren Anoven zuführen oder auf eine andere Weise Siginifikanzen berechnen. Hierfür brauche ich aber eine Varianz, einen Standardabweichung/einen Standardfehler und muss genau wissen, wie ich damit umzugehen habe.

Fehlerbalken kann man mit Excel darstellen ( https://www.ablebits.com/office-addins- ... Excel-2016 ) aber ich würde wirklich raten, die Grafiken von Anfang an in einem Statistikprogramm zu machen. JASP oder PSPP oder was Dir zur Verfügung steht.

Ich weiß, wie man Fehlerbalken setzt, aber ich muss vorher eine saubere Standardabweichung bzw. einen Standardfehler ausrechnen. Das Problem ist dabei nach wie vor, dass ich die Mittelwerte von unterschiedlich großen Gruppen vergleiche und nicht weiß, wie ich am besten damit umgehe. Prinzipiell messe ich immer das gleiche nur immer unterschiedlich viele Individuen auf einmal und möchte am Ende einen Durchschnitt für ein Individuum angeben (in den aber alle meine Messungen einfließen) mit Fehlerbalken/Standardfehler abgeleitet von meiner Standardabweichung.

bele · von **bele** » Do 20. Feb 2020, 14:56

Bernie hat geschrieben:
Was richtig ist, hängt davon ab, was Du genau berechnen möchtest. Ich vermute aber: Du hast eine Spalte mit der Anzahl der angefärbten Strukturen und eine Spalte mit Anzahl der Bilder. Wenn Du nun die Spaltensumme mit allen Strukturen durch die Spaltensumme mit allen Bilderanzahlen teilst, hast Du die durchschnittliche Anzahl Punkte pro Zelle.

Genau das habe ich gemacht.

Ich habe Dich so verstanden, dass Du das zeilenweise gemacht hast. Mit Spaltensumme meine ich hier aber die Summe aller Werte in dieser Spalte. Wenn Du das machst, erhälst Du den Mittelwert pro Zelle, nicht viele Mittelwerte pro Bild. Der Mittelwert pro Zelle ist also leicht zu errechnen

und würde dies gerne so tun, dass ich noch einen Standardfehler dazu angeben kann.
...
Ich kann keine Individuen auswerten, sondern nur unterschiedlich große Gruppen. Allerdings kenne ich immer die Anzahl der Mitglieder der Gruppe, kann die Gruppenmitglieder aber nicht auseinander halten.

Ich bin kein Mathematiker, aber ich glaube nicht, dass das geht. In all den Bildern, die zwei oder mehr Zellen enthalten ist diese Information verloren. Darüber hätte man sich beim Studiendesign Gedanken machen müssen. Jetzt muss man schauen, ob es irgendwelche Auswege aus dieser dämlichen Situation gibt.

Am einfachsten erscheint mir, die Zeilen herauszusuchen, in denen es nur eine Zelle im Bild gibt. Aus diesen lässt sich die Standardabweichung der angefärbten Strukturen pro Zelle ja ermitteln und wenn es biologisch Sinn macht, kann man vielleicht annehmen, dass die Standardabweichung für all die anderen Zellen, die nicht allein mikroskopiert wurden, die gleiche ist. Wenn es natürlich so wäre, dass besonders große Zellen oder besonders schwere Zellen oder ... eine höhere Chance auf ein "Foto allein" hatten und in diesen Zellen auch die Varianz der angefärbten Strukturen anders ist, dann wäre das ein Bias.

LG,
Bernhard

STATISTIK-FORUM.de

Mittelwerte und Standardabweichungen berechnen für Anova

Mittelwerte und Standardabweichungen berechnen für Anova

Re: Mittelwerte und Standardabweichungen berechnen für Anova

Re: Mittelwerte und Standardabweichungen berechnen für Anova

Re: Mittelwerte und Standardabweichungen berechnen für Anova

Re: Mittelwerte und Standardabweichungen berechnen für Anova

Wer ist online?