Hallo,
ich habe eine Regression gerechnet und mir anschließend die Modellannahmen angeschaut.
Das P-P Diagramm der Residuen sieht nicht gut aus, d.h. die Punkte liegen nicht auf der gerade sondern schlingern etwas drunter und drüber.
Die mögliche Ursache, dass dies durch Ausreißer hervorgebracht wird (nach Urban 2008), habe ich ausgeschlossen, in dem ich die angezeigten Fälle in der Fallweisen Diagnose innerhalb der Regression mal rausgenommen habe und mir das ganze dann noch mal angeschaut habe-da gab es beim P-P Diagramm keine Änderung.
Als zweite Möglichkeit gilt die schiefe Verteilung der y-Variable (bei mir 5 stufig). Diese kann man mit verschiedenen Transformationen abschwächen laut Urban. Ich habe also die y-Variable also ein mal logarithmiert (ln und Log10) und es mit Sqrt versucht. Die P-P Diagramme bleiben gleich.
Zudem habe ich mir für die transformierten Variablen eine deskriptive Statistik ausgeben lassen und mir Schiefe und Kurosis angeschaut.
Da sieht es folgendermaßen aus:
Schiefe Kurtosis
Original 0.843 0.192
Ln 0.183 -1.311
Log10 0.183 -1.311
Sqrt 0.465 -0.787
NAch diesem Vergleich würde ich bei der Originalvariable bleiben, wie es auch Urban beschreibt, wenn keine Transformation eine Verbesserung bringt.
Was meint ihr? Oder gibt es noch eine sinnvolle Transformation, die Abhilfe schaffen könnte? Alle Transformationen gewichten ja auch über (bei kleinen Werten) und unter (bei großen Werten), was eine anschließende Interpretation wiederun erschwert. Wie schwer wiegt also der Verstoß gegen die Normalverteilung?
Gruß
MArie