MStats hat geschrieben:Mich würde eben interessieren, was es bedeutet, wenn eine Verteilung bzw. symmetrisch verläuft. Oder auch die größe der Boxplots. Was sagt das über die Daten aus?
Na, die Hälfte der Daten liegt in den Kästchen, die andere Hälfte liegt außerhalb der Kästchen aber im Bereich der Whiskers. Wenn bei allen Messungen immer das gleiche heraus kommt, dann schrumpft der Boxplot zu einer Linie. Wenn immer fast das gleiche heraus kommt, dann erhälst Du einen ganz kleinen und je mehr die Messwerte streuen umso größere Boxplots.
In Deinem rechten Fall (Twitter) liegt der Median etwa in der Mitte der Figur, die Quartilsgrenzen und die Ende der Whiskers haben nach oben und nach unten etwa den gleichen Abstand. Die Werte weichen also vom Median nach oben und nach unten einigermaßen gleichmäßig ab.
Bei Deinem linken Fall (Facebook) liegt die untere Hälfte der Werte (Median bis unteres Whisker) in einem ganz engen Bereich. Es besteht also immer eine gewisse Frequenz (>40) von der auch nicht so oft abgewichen wird. Von dort aus gibt es Werte nach oben die weit über die Twitter Werte hinaus gehen, aber im Median hat Twitter die höhere Frequenz.
Die Verteilung von Twitterfrequenzen könnte normalverteilt sein, die von Facebook ist es ganz sicher nicht.
http://de.wikipedia.org/wiki/Schiefe_(Statistik)
http://www.faes.de/Basis/Basis-Lexikon/ ... ertei.htmlDabei sollte diese Grafik zeigen wie die Verteilung im Hinblick auf die Sendefrequenz in einem bestimmten Analysezeitraum ausfällt.
Ja, das tut die Grafik (andere Grafiken, etwa ein Histogramm oder ein Violinplot würden noch mehr preisgeben). Wenn Du die Grafik weiter deuten möchtest musst Du Dich fragen, warum Du diese Analyse überhaupt gemacht hast und was die dahinter stehende Frage ist. Davon muss Deine gesamte Analyse getragen werden. Solange Du das nicht tust, bleibst Du bei abstrakten Datenbeschreibungsbegriffen wie Schiefe hängen.
LG,
Bernhard