ich möchte einen Datensatz analysieren und soll dabei betrachten wie die Zufriedenheit im Job und die Ausbildung das Einkommen beeinflussen.
Dabei ist das Einkommen kontinuierlich verteilt, die beiden anderen Variablen sind ordinal.
Wie könnte ich dabei nun vorgehen, wenn ich ein Model vorhersagen will?
Das Einkommen ist nicht-normal verteilt, sondern wie man erwartet nach links schief verteilt. Um mögliche Outlier aus dem Datensatz zu entfernen würde ich gerne den Datensatz in eine Normalverteilung bringen, die Outlier entfernen und dann wieder zurückrechnen. Ist sowas statistisch sinnvoll?
Welchen Ansatz könnte ich allgemein wählen? SOllte man da mit einer Regression anfangen? Korrelation? Diskriminanten Analyse?
Könnt ihr mir vielleicht ein paar Tipps geben?
Vielen Dank schonmal!!
