Problem log(0) Lösung?

Alle Verfahren der Regressionanalyse.

Problem log(0) Lösung?

Beitragvon Icke » Fr 18. Dez 2015, 09:38

Hallo!

Zum Hintergrund:
Ich soll den Zusammenhang zwischen einem Score (range 0-125) und dem Alter modellieren. Auf Grund des Scatterplots kam die Idee einen exponentiellen Ansatz zu wählen.

Mein Vorgehen:
(1) log(Score)
(2) Lineare Regression: log(Score) ~ Alter
(3) exp(intercept + Alter)
Somit bekomme ich einen exponentielle Kurve im Scatterplot als Fit.

Problem: Der Score enthält auch Nuller!

Damit ich das ganze mal durchlaufen lassen kann, hatte ich jetzt einfach mal log(Score + 0,01) angewendet, was natürlich mathematisch gesehen nicht korrekt ist. Was ich links hinzufüge, muss ich natürlich auch rechts der Gleichung hinzufügen, was mir dann aber Probleme bereitet.

Eine andere Idee war, den Score einfach systematisch um eine Einheit höher zu setzen auf 1-126. Das ist aber auch keine saubere Lösung, da die Kurven immer leicht anders aussehen, je nachdem, um wieviele Einheiten man den Score nach oben verschiebt.

Ich weiß weiter... Hat irgendjemand eine andere saubere Idee, wie ich eine exponentielle Kurve in meine Daten fitten kann? Es soll unbedingt was exponentielles sein und man soll am Ende eine Modellgleichung haben. Also fallen Splines schonmal raus.

Ich wäre über jeden weiterführenden Kommentar dankbar :-)

Grüße
Icke
Icke
Einmal-Poster
Einmal-Poster
 
Beiträge: 1
Registriert: Fr 18. Dez 2015, 09:24
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Problem log(0) Lösung?

Beitragvon rotkehlpieper » So 17. Jan 2016, 12:53

Hi, da "alter" eine Count-Variable ist, wäre es der natürlichste Weg eine Poisson-Regression zu machen (d.h., die AV ist Poisson-Verteilt), da wird standardmäßig eine log-Link-Funktion für verwendet, was Dir die gewünschte exponentielle Abhängigkeit gibt
rotkehlpieper
Mitglied
Mitglied
 
Beiträge: 25
Registriert: Do 3. Dez 2015, 14:45
Danke gegeben: 3
Danke bekommen: 1 mal in 1 Post

Re: Problem log(0) Lösung?

Beitragvon DHA3000 » Mi 20. Jan 2016, 18:47

Der Standardansatz in diesem Fall ist einfach alles so zu lassen, wie es ist und "Alter" zusätzlich als quadrierte Variable aufzunehmen.

Problem gelöst.
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 10 Gäste

cron