Hallo!
Ich haben eine Datensatz und würde für diesen gerne ein lineares Modell erstellen. Ich weiß, dass der Erklärungswert sehr gering sein wird. Mir geht es allerdings eher um den Linearisierungsprozess.
Die Zielgröße (ncit) ist extrem linkssteil verteilt, wie Ihr sehen könnt, sind die Residuen (des Modells ncit~nclaims) nicht normalverteilt :
https://gofile.io/d/kmHJL8 (offensichtlich kann ich nichts hochlanden im Forum)
Wie verhält man sich bei solchen Daten? Welche Transformation müsste ich vornehmen, damit die Residuen normalverteilt werden. Mir fehlt es hier einfach an Erfahrung bzw. Gefühl - in vielen Büchern steht, dass man de-factor alles linearisieren kann...