Hallo!
Zum Hintergrund:
Ich soll den Zusammenhang zwischen einem Score (range 0-125) und dem Alter modellieren. Auf Grund des Scatterplots kam die Idee einen exponentiellen Ansatz zu wählen.
Mein Vorgehen:
(1) log(Score)
(2) Lineare Regression: log(Score) ~ Alter
(3) exp(intercept + Alter)
Somit bekomme ich einen exponentielle Kurve im Scatterplot als Fit.
Problem: Der Score enthält auch Nuller!
Damit ich das ganze mal durchlaufen lassen kann, hatte ich jetzt einfach mal log(Score + 0,01) angewendet, was natürlich mathematisch gesehen nicht korrekt ist. Was ich links hinzufüge, muss ich natürlich auch rechts der Gleichung hinzufügen, was mir dann aber Probleme bereitet.
Eine andere Idee war, den Score einfach systematisch um eine Einheit höher zu setzen auf 1-126. Das ist aber auch keine saubere Lösung, da die Kurven immer leicht anders aussehen, je nachdem, um wieviele Einheiten man den Score nach oben verschiebt.
Ich weiß weiter... Hat irgendjemand eine andere saubere Idee, wie ich eine exponentielle Kurve in meine Daten fitten kann? Es soll unbedingt was exponentielles sein und man soll am Ende eine Modellgleichung haben. Also fallen Splines schonmal raus.
Ich wäre über jeden weiterführenden Kommentar dankbar
Grüße
Icke