von bele » Mo 17. Okt 2011, 07:33
Nehmen wir zum Beispiel den Pearsonschen Korrelationskoeffzienten. Der ist bekanntlich sehr fehleranfällig für Ausreißer. Wenn Du jetzt Bootstrapping machst, dann werden einige "Variationen" des Datensatzes den Ausreißer enthalten und andere nicht. Demnach wird das Konfidenzintervall für r sehr groß sein, wenn r durch Ausreißer bestimmt ist, aber nicht groß sein, wenn r nicht durch Ausreißer bestimmt ist.
Probier mal mit folgenden Wertepaaren aus wie das Konfidenzintervall des Korrelationskoeffizients mit und ohne das letzte Wertepaar ist (wie gesagt, ich habe kein SPSS):
x <- 1.4, 1.3, 1.2, 1.1, 1.0, 8.0
y <- 2.7, 2.8, 3.0, 3.1, 3.7, 9.0
- Dateianhänge
-
- Der Ausreißer rechts oben verfälscht die Korrelation erheblich. Daher erfolgt normalerweise eine visuelle Kontrolle. Mit Bootstrapping werden Variationen des Datensatzes untersucht in denen der Ausreißer vorkommt und solche, in denen er nicht vorkommt. Dank Jackknife-After-Bootstrap lässt sich der entscheidende Punkt dann auch identifizieren.
- ausreißer.png (2.64 KiB) 12316-mal betrachtet
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)