Hallo,
ich habe eine recht basale Frage zu Ausreißern generell und als UV in der binären logistischen Regression...
Eine meiner UV (Summe aller Arztbesuche 12 Monate) hat viele Ausreißer (etwa 40 von 660 Fällen nach boxplot/Stem&Leaf) - jetzt frage ich mich einerseits ob ich diese generell ausschließen soll (oder in der deskriptiven Statistik auf Median ausweichen soll??) und ob das eine Auswirkung auf die log. Regression hat und ich deswegen vielleicht diese Fälle sogar löschen muss?? Falls ich sie lösche, wäre die Anzahl der fehlenden Werte ja recht hoch und weniger Vpn würden beider Berechneung des log. Regressionsmodells einbezogen werden, oder?
Ich hoffe ihr versteht was ich meine, es scheint mir eigentlich ein recht grundlegendes, einfaches Problem zu sein, was aber leider meinen statistischen Horizont übersteigt
Ich bin leider trotz ausgiebiger Recherche zu keiner eindeutigen Lösung gekommen...
Danke schon einmal.
K