Hallo Freunde der Statistik,
ich habe drei kleinere Fragen zur Erstellung einer Regression mit dem OLS Ansatz.
Der Stichprobenumfang meiner Untersuchungen ist meist zwischen n=66 und n=550. Der Funktionale Aufbau meist nur eine oder zwei Dummys (y =a + D1 * x + u).
Meistens sieht der Q - Q Plot so aus wie auf dem Bild der Fall ganz links.
(1) Ist das noch normalverteilt oder nicht, weil es zu sehr von der Geraden abweicht?
(2) Stimmt es, dass bei einem so großen Beobachtungsumfang (>n=50) die Residuen nicht mehr normalverteilt sein müssen? Ich habe dies nun schon mehrmals gelesen. Wenn ja, wie heißt die Grundlage dafür. Ich frage, da ich die Ergebnisse und Annahmen mit Quellen belegen muss.
(3) Bei der Behandlung von Ausreißern bin ich auf zwei Methoden gestoßen. Die erste besagt, Ausreißer löschen und die Regression nochmal machen. Die zweit besagt, eine andere Methode verwenden und zwar die "Robuste Regression". Hier werden die Beobachtungen mit größeren Residuen weniger stark gewichtet. Welche dieser zwei Methoden ist ratsam?
Vielen Dank für eure Hilfe!
Boom