Umgang mit Ausreißerwerten?

Umgang mit Ausreißerwerten?

Beitragvon Kennedy » Di 13. Jul 2021, 13:51

Hallo liebe Statistiker,

ich werte eine retrospektive Studie mit n= 24 und zwei Messzeitpunkten aus.
Genutzt wurde der YSR, einen Problemfragebogen für Kinder und Jugendliche. Der Fragebogen hat ca. 120 Item, welche in acht Syndrom Skalen zusammengefasste werden. Aus diesen Syndrom Skalen werden zwei Übergeordnete Skalen berechnet. Internalisierende- und Externalisierend Probleme. Außerdem wird noch aus Summe aller Items ein Gesamtwert berechnet. Ich habe also insgesamt 11 Skalen. Ich will einmal für alle Fälle die Symptomreduktion der 11 Skalen betrachten und dann noch einmal bei denjenigen Fällen, bei denen die Anfangswerte bereits über den klinisch auffälligen Normwerten liegen. Da die Anzahl der Fälle pro Skala bei den Auffälligen werten sehr unterschiedlich ist, schwankt mein Anzahl hier. Mein kleinstes n=12.

Daher würde ich insgesamt gerne 22 T-test bei verbunden Stichproben durchführen. Das Signifikanzniveau würde ich nach Bonferroni korrigieren und immer noch einige signifikante Ergebnisse bekommen.
Mein Hauptproblem ist aktuell, dass die Differenzen zwischen den einzelnen Messzeitpunkten nicht normalverteilt sind. Ich habe den Kolmogorov Smirnov Test und den Shapiro Wilk Test durchgeführt. Der Shapiro Wilk Test ergibt für einige Skalen eine Signifikanz von 0,026 bzw. 0,011, so dass ich nicht von Normalverteilung ausgehen kann. Dies liegt an einem Ausreißer-Wert. Wenn ich diesen entfernen würde, wären die Differenzwerte nach beiden Tests normalverteilt.

Der (Ausreißer?) Wert ist wirklich ungewöhnlich hoch. Es ist eine Reduktion um 69 Punkte, die nächsthöchste Differenz beträgt 37 Punkte (M=15,37; SD=16,69) Abgesehen von der großen Differenz finde ich keine Gründe, warum der Fall ausgeschlossen werden sollte.
Meine Frage ist nun, wie ich am besten vorgehen soll.

1) Den Fall von der Auswertung ausschließen? Dadurch hätte ich eine Normalverteilung und könnte mit meinen T-Test für verbundene Stichproben fortfahren. Ich bin aber unsicher, wie ich das begründen kann.
2) Ich lasse den Fall in der Auswertung führe trotzdem T-Tests bei verbundenen Stichproben durch und berufe mich auf den Kolmogorov-Smirnov Test und darauf, dass der T-Test bei verbundenen Stichproben robust gegenüber Ausreißern reagiert.
3) Ich lasse den Fall in der Auswertung und führe für alle Skalen, bei denen ich nicht von Normalverteilung ausgehen kann den Wilcoxon-Paarvergleichstest durch.

Ich bin dankbar für eure Meinungen.
Viele Grüße
Kennedy
Kennedy
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mo 14. Jun 2021, 10:02
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Umgang mit Ausreißerwerten?

Beitragvon PonderStibbons » Di 13. Jul 2021, 14:30

Da es sich um eine kleine Stichprobe und eine noch kleinere Substichprobe handelt
(was den Normalverteilungstest mangels statistischer Trennschärfe weitgehend wertlos
macht), bietet sich eine durchgehende Testung mit dem Wilcoxon-Vorzeichenrangtest an.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Kennedy

Re: Umgang mit Ausreißerwerten?

Beitragvon bele » Di 13. Jul 2021, 14:36

Hallo Kennedy,

ich habe keine eindeutige Antwort für Dich. Einerseits erscheint es mir etwas maßlos, aus 24 befragten eine so große Zahl von Aussagen zu ziehen, andererseits sagst Du ja, das Du trotz Bonferroni-Korrektur noch Signifikanzen hast. Klingt trotzdem merkwürdig, ausschließlich nach Effekten zu suchen die so stark sind, dass sie bei n = 24 und Bonferronikorrektur noch signifikant werden.

Etwas anderes: Nehmen wir mal an, dass Du den Gewinn von 500 Lottospielern untersuchst. Weil nur jeder dreizehnmillionste sechs richtige hat wird der in Deiner Stichprobe nicht vertreten sein und der mögliche Gewinn eines Sechsers geht in Deiner Auswertung perdu und das obwohl er der Hauptanreiz für die Spielenden ist. Will sagen: Es gibt in der Wirklichkeit extrem schiefe Verteilungen mit extremen Werten, die man weder über große Stichproben abbilden noch einfach vernachlässigen kann. Ich kenne Dein Setting nicht, aber eine Studie zu Problemen von Kindern und Jugendlichen, warum sollte es da nicht vereinzelte Kinder oder Jugendliche geben deren gewaltige perzipierte Probleme sich plötzlich in Luft auflösen oder die plötzlich gewaltige Probleme berichten?

Gefühlt würde ich deshalb dazu neigen, keine Normalverteilung anzunehmen, stattdessen alles nichtparametrisch zu prüfen und dafür ein etwas lockereres Korrekturverfahren als Bonferroni wählen.

Du hast nach "Meinungen" gefragt - das ist auch nur eine Meinung und ich stelle keinen Anspruch, dass sie "richtig" sei.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

folgende User möchten sich bei bele bedanken:
Kennedy


Zurück zu t-Test

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 9 Gäste

cron