Random Forest und Variablentransformation

Alle Verfahren der Regressionanalyse.

Random Forest und Variablentransformation

Beitragvon Paul20 » Mo 6. Apr 2015, 22:39

Hi,

ich habe einige Fragen zur Modellierung einer Zeitreihe mit dem Random Forest-Algorithmus bei denen ich euren Rat gut gebrauchen kann. Ich habe eine Zeitreihe von Preisen sowie 5 Prädiktoren, aus denen ich eine Prognose für den jeweils nächsten Preis generieren möchte. Folgendes ist mir hierbei noch nicht ganz klar:

1. Ist bei der Anwendung des Random Forests die Implementierung eines Lags sinnvoll? D.h. ist es sinnvoll, in die Zeile jeder einzelnen Beobachtung der Trainingsdaten sowie des späteren Inputvektors die Prädiktorwerte der vorangegangenen 2 oder 3 Beobachtungen einzufügen?

2. Bei der abhängigen Variable handelt es sich um einen Preis, der teilweise Spitzenwerte annimmt die um ein Vielfaches oberhalb der „normalen“ Werte liegen. Ist es sinnvoll, die abhängige Variable bspw. mit dem Logarithmus zu transformieren? Wenn ja, wie beeinflusst dies das Random Forest-Modell / welchen Nutzen erfüllt es?

Vielen Dank für eure Unterstützung!
Paul
Paul20
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mo 6. Apr 2015, 22:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Random Forest und Variablentransformation

Beitragvon DHA3000 » Di 7. Apr 2015, 19:04

Meines Wissens nach hat die Anwendung von Random Forrests keine Auswirkungen auf die Transformation der Variablen. Du kannst diese also genau so behandeln, wie bei einem klassischen Regressionsmodell.
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste