Hallo Leute,
ich habe mal eine Frage. Ich habe einen Datensatz, welche die Reponse einer Direct Mailing Kampagne wiederspiegelt. Die unabhängigen Variablen sind allerdings nicht linear bzw. monoton. Das heißt z. B. beim Alter gibt es weniger Abschlüsse unter 30 Jahren, von 30-60 gibt es einige und >60 wieder wenige.
Habt ihr ne Idee, wie ich das am besten modellieren kann? Die meisten Variablen weisen so eine Struktur auf. Ich habe schon überlegt, ob ich einfach Kategorien bilden soll, welche die einzelnen Variablenwerte in Gruppen abbilden und dann via Dummy-Variable ins Modell bringe. Macht das Sinn?
LG
Sush