Streuungsmaß eines Boxplots

Univariate Statistik.

Streuungsmaß eines Boxplots

Beitragvon Gänseblümchen » Mi 18. Aug 2021, 16:37

Hallo liebe Leute,

ich soll die Verteilung meiner erhobenen Daten durch Boxplots visualisieren und interpretieren.
Stimmt es, dass ich mir den Interquartilsabstand (IQR) anschauen muss, um die unterschiedlichen Streuungen zu beurteilen?
Also größer Interquartilsabstand = größte Streuung?
Habe bei Wikipedia gelesen, dass der IQR die Streuung um den Median und die Varianz die Streuung um das arithmetische Mittel wiedergibt.
Bei meinen Daten sind nur die Mediane relevant, da es hohe Ausreißer gibt und der IQR gibt die mittleren 50 % der Daten wieder, richtig?
Um die Streuung meiner Daten beurteilen zu können, vergleiche ich die IQR, nicht die Varianzen, oder irre ich mich?

Liebe Grüße
Marla
Gänseblümchen
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Sa 24. Apr 2021, 16:26
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Streuungsmaß eines Boxplots

Beitragvon bele » Mi 18. Aug 2021, 17:07

Hallo Marla,

als das stimmt und stimmt dann doch wieder nicht. Man muss sich beim Boxplot immer wieder bewusst klar machen, dass nur die Hälfte der Daten in der Box steckt und die andere Hälfte eben nicht. Über die Hälfte der Daten, die nicht in der Box steckt, sagt der IQR nichts aus. Der folgende R-Code zieht eine sehr große Stichprobe aus einer t-Verteilung mit 2 Freiheitsgraden und er zieht eine Stichprobe aus einer t-Verteilung mit 50 Freiheitsgraden und nimmt jeden Wert davon mal 1,21. Die Boxen der beiden Boxplots sind quasi identisch, also gleiche IQR:

Code: Alles auswählen
a = rt(1e6, 2)         
b = rt(1e6, 50) * 1.21
boxplot(a, b, ylim = c(-1, 1))


Und dennoch ist die Varianz bei a fast 10 Mal so groß wie bei b:

Code: Alles auswählen
> var(a)
[1] 14.64615
> var(b)
[1] 1.522778


Die Berechnung der Varianzen bezieht alle Daten mit ein, die Größe des IQR ist nur durch die Ausbreitung der mittleren Hälfte beeinflusst.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: Streuungsmaß eines Boxplots

Beitragvon Gänseblümchen » So 22. Aug 2021, 15:41

Vielen Dank Bernhard!

Ich habe jetzt nochmal mit meinem Betreuer geschrieben und er hat mir unter anderem folgendes geantwortet:
"Wenn Sie die Mediane vergleichen wollen, dann müssten sie die deren Unterschiede auf Signifikanz testen."
"[...] Sie sollten die Mediane betrachten und die IQR interpretieren oder auf Unterschiede testen."

Ich stehe gerade auf dem Schlauch! Mit welchem Test untersuche ich die Unterschiede der Mediane (von z.B. 5 Gruppen) auf deren signifikante Unterschiede?
Und bezieht sich bei "die IQR interpretieren oder auf Unterschiede testen" das Testen auf die Unterschiede der Mediane oder der IQR?

Liebe Grüße
Marla
Gänseblümchen
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Sa 24. Apr 2021, 16:26
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Streuungsmaß eines Boxplots

Beitragvon PonderStibbons » So 22. Aug 2021, 18:10

Ich stehe gerade auf dem Schlauch! Mit welchem Test untersuche ich die Unterschiede der Mediane (von z.B. 5 Gruppen) auf deren signifikante Unterschiede?

Mediantest.
Und bezieht sich bei "die IQR interpretieren oder auf Unterschiede testen" das Testen auf die Unterschiede der Mediane oder der IQR?

Falscher Adressat? Das müsstest Du wohl Deinen Betreiier fragen.

Mit freundlichden Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Streuungsmaß eines Boxplots

Beitragvon bele » So 22. Aug 2021, 18:31

Hallo Marla,

Gänseblümchen hat geschrieben:ich soll die Verteilung meiner erhobenen Daten durch Boxplots visualisieren und interpretieren.

Das heißt, Boxplots sind fest vorgegeben und eher nicht verhandelbar?

Bei meinen Daten sind nur die Mediane relevant, da es hohe Ausreißer gibt

Naja, das kann man so machen, es ist aber nicht so, dass es keine Alternativen gibt. Man könnte beispielsweise auch einen 5%-getrimmten-Mittelwert untersuchen, wenn jenseits der Ausreißer der Mittelwert als sinnvoll erscheint. Ich will Dich weder von den Boxplots noch vom Median wegreißen. Du darfst nur nicht die Erwartung haben, dass es hier die eine richtige Antwort gibt. Es gibt meistens verschiedene Wege unter denen man auswählen kann, wenn die Betreuung einem keine festen Vorgaben macht.

"Wenn Sie die Mediane vergleichen wollen, dann müssten sie die deren Unterschiede auf Signifikanz testen."
"[...] Sie sollten die Mediane betrachten und die IQR interpretieren oder auf Unterschiede testen."


Ein Mediantest, wie von PonderStibbons vorgeschlagen, existiert, ist aber sehr ungewöhnlich. Die deutsche Wikipedia schreibt dazu:
Der Median-Test ist sehr einfach durchzuführen, gilt jedoch aufgrund seiner im Vergleich zu alternativen Verfahren geringen Teststärke für die meisten Anwendungen als obsolet.

Ob ein Vergleich der Mediane über Bootstrapping mehr Teststärke bringen würde weiß ich nicht. Auch weiß ich nicht, ob es da einen Omnibus-Test gibt, der gleich alle fünf Mediane auf einmal testet. Wenn man keine Verteilungsannahmen für seine Daten macht ist es üblich, Boxplots zu zeichnen und dann die zentrale Tendenz mit einem Rangsummentest (ggf. Kruskall-Wallis-Test) zu vergleichen. Das testet zwar streng genommen keine Mediane, wäre aber das deutlich "normalere" Vorgehen. Ohne weitere Detailkenntnisse glaube ich eher an eine Betreuerin die glaubt, dass ein Rangsummentest Mediane testet als an eine Studie, die mit Mediantests durchgeführt werden soll.

Das können wir aber in Unkenntnis Deiner Betreuung nicht abschließend beantworten.
LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts


Zurück zu Mittelwert, Standardabweichung & Co.

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste