Hi zusammen.
Nach intensiver Recherche bzgl. der Definition und Entdeckung von Ausreißern bei einer logistischen Regression bin ich verwirrter als zuvor. Ein paar Fragen schwirren mir durch den Kopf:
- Sind Ausreißer extreme Werte metrisch skalierter UV?
- Oder sind Ausreißer Residuen, die sich stark von den empirischen Werten unterscheiden? Wobei extreme Werte in einer UV sicherlich extreme Residuen begünstigen oder verursachen.
- Aber was ist, wenn man als UV nur dichotome und quasi-metrische UV mit einem Wertebereich von zB 1-10 hat? Da kann ja nichts extrem werden (so lange die Werte einigermaßen verteilt sind)? Können trotzdem die Residuen extrem werden und somit für Ausreißer sprechen? Sind dann Ausreißer zu verstehen als eine Kombination von Ausprägungen der UV die sehr ungewöhnlich ist?
- Es wird empfohlen, die studentisierten Residuen zu betrachten wobei Werte größer 2 bzw. kleiner -2 auf Ausreißer hindeuten. An einer anderen Stelle lese ich wiederum, dass studentisierte Residuen logischerweise einer T-Verteilung folgen und somit etwa 5% der Werte "extrem" sind, also außerhalb [-2;2].
Wäre super wenn mich jemand aus der Verwirrung befreien könnte, ein Tip für gute Literatur wäre auch schon super!