von bele » Fr 9. Nov 2018, 17:32
Da stellt sich jetzt die Frage, ob man einem standardisierten Algorithmus dafür folgen muss. Ich jedenfalls habe noch keine Arbeit gelesen, in der die Weite der Bins gerechtfertigt wurde. Die Klassenbreite sollte man so wählen, dass die Verteilung der Daten anschaulich und nicht missverständlich oder irreführend dargestellt wird. Dazu darf man m. E. einfach eine Reihe von verschiedenen Werten durchprobieren bis man ein Gefühl für die wahre Verteilung hat und dann subjektiv diejenige wählen, die das am besten ausdrückt.
Wenn man sich für ein Histogramm entscheidet, dann weiß man, dass das Aussehen durch die Wahl der Klassen beeinflusst wird. Wenn man sich damit gar nicht abfinden mag, dann muss man halt auf Alternativen ausweichen. Ein Beeswarm-Plot beispielsweise wird häufiger zum Vergleich von Verteilungen als zur Darstellung von Verteilugnen genutzt, sollte aber bei n = 173 in der Regel ganz gut funktionieren. und zeigt klar, welcher Punkt an welcher Stelle liegt.
Siehe z. B.
https://flowingdata.com/2017/05/02/shif ... ng-people/ https://content.edupristine.com/images/ ... arm_10.pngIn der Regel weiß aber der Leser um das Problem mit den Boxplots und hat sich daran gewöhnt.
LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)