Fahrzeug-Restwertermittlung mittels Regression

Alle Verfahren der Regressionanalyse.

Fahrzeug-Restwertermittlung mittels Regression

Beitragvon herrklingtgeil » Do 20. Aug 2020, 15:15

Guten Tag zusammen,

kurz zum Hintergrund:
Derzeit schreibe ich meine Abschlussarbeit zum Thema Wirtschaftlichkeit von Lkws (konventionell vs. Elektro), weshalb u.a. auch der entsprechende Restwert eine große Rolle spielt.
Diesbezüglich habe ich Daten mit Python von einer Gebrauchtwagenplattform gezogen, um mithilfe dieser Daten den Restwert (AV) in Abhängigkeit der Laufleistung (UV) darzustellen.
In Studien zu Pkw-Restwertberechnungen wurde zusätzlich auch das Alter herangezogen, was doch eigentlich nicht zielführend wäre aufgrund der Multikorrelation.

Wie dem auch sei: Nach Regressionsanalyse mit Excel (ca. 600 Datensätze) kam ich auf ein dürftiges Bestimmtheitsmaß (R Square) von 0,08 was sich auch auf der Datenwolke widerspiegelt (Im Anhang).

Natürlich könnte ich noch einige Ausreißer löschen, allerdings denke ich nicht, dass sich viel tun würde.

Gäbe es sonstige Möglichkeiten, um die Qualität der Regression zu verbessern bspw. per Gruppierung?
herrklingtgeil
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Do 20. Aug 2020, 14:42
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Fahrzeug-Restwertermittlung mittels Regression

Beitragvon bele » Do 20. Aug 2020, 15:38

Die Punktwolke im Anhang wäre tatsächlich einen Blick wert, ab er leider gibt es hier keine Anhänge.

Du schreibst nicht, welche Art der Regression Du anwendest. Eine einfache lineare Regression ist sicher ungeeignet, weil sie eine konstante Steigung hat. Mindestens bei PKW ist es aber so, dass sie anfangs sehr schnell an Wert verlieren und der Wertverlust dann immer langsamer wird. Hast Du eine Regressionsform genutzt, die so etwas berücksichtigt?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: Fahrzeug-Restwertermittlung mittels Regression

Beitragvon herrklingtgeil » Do 20. Aug 2020, 16:11

Hallo Bernd,

ich entschuldige ich mich vorab für meine Anfängerfehler.

Leider wird mir beim Anlagen-Upload immer wieder angezeigt, dass "das Kontingent für Dateianhänge bereits vollständig ausgenutzt" sei.

Vielleicht klappt es auf diesem Wege:
Bild
bzw. den Link: https://ibb.co/vJhZdFg klicken.

Genau, es handelt sich lediglich um eine lineare Regression bisher. Trotzdem hätte ich nicht gedacht, dass die lineare Funktionen eine so geringe Aussagekraft hat.
Leider funktioniert SPSS (Server der Uni) aktuell nicht, daher kann ich nur auf Excel und deren Datenanalyse zurückgreifen. Ich versuche mich mal eben schlau zu machen wie ich relativ einfach eine logarithmische/Expo Regression erstellen kann und melde mich dann zurück :-)

Beste Grüße
herrklingtgeil
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Do 20. Aug 2020, 14:42
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Fahrzeug-Restwertermittlung mittels Regression

Beitragvon bele » Do 20. Aug 2020, 19:16

Also ich sehe da eine nahezu strukturlose Wolke und würde schlussfolgern, dass sich das eine nicht aus dem anderen vorhersagen lässt. Gibt es keine weiteren Infos wie beispielsweise den Neupreis?
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: Fahrzeug-Restwertermittlung mittels Regression

Beitragvon herrklingtgeil » Do 20. Aug 2020, 20:15

Was ich noch machen kann, ist es, die Datensätze nach expliziten Marken/Modellen zu filtern, um die Qualität insgesamt zu erhöhen.

Allgemeine Nettolistenpreise habe ich zu den entsprechenden Lkws aus anderen Quellen, allerdings sind dort keine Sonderausstattungen inkludiert.
Trotzdem wäre es auch eine Möglichkeit, eine weitere Spalte als "% Abschreibung" auf Basis Potenzieller Neupreis (Nettolistenpreis+ Pauschale für Sonderausstattung) MINUS Restwert anzuhängen.
Die Frage ist, ob man das so machen "darf".

Ich hatte im Vorfeld auch mal Folgendes gemacht:
Die unterschiedlichen Laufleistungen klassifiziert (Intervall von 150.000 - 250.000 entsprechen 200.000 usw.) und aus den Klassen die durchschnittlichen Restwerte gebildet.
Daraus ergab sich dann folgendes Diagramm:
https://ibb.co/vD12Kdp

Wäre dies auch ein gängiges Mittel?

Schlussendlich brauche ich lediglich eine Restwertabschätzung nach 5 Jahren Regelnutzung, die Laufleistung-sensitiv ist, da ich hier unterschiedliche KM-Szenarien in meiner Wirtschaftlichkeitsberechnung heranziehe.

UPDATE: Markentechnisch hat sich nichts verbessert - leider. Ich ziehe mir nun nochmal einen Datenschnitt, um die Anzahl der Datensätze zu erhöhen (letzer Datenschnitt von der Handelsplattform wurde vor 3 Monaten gemacht).
In letzter Instanz sollte ich nicht nur nach Marken filtern, sondern auch nach expliziter Sonderausstattung. Spätestens dann sollte eigentlich eine Abhängigkeit des Restwertes von der Laufleistung erkennbar sein. Ansonsten ;-(
herrklingtgeil
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Do 20. Aug 2020, 14:42
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Fahrzeug-Restwertermittlung mittels Regression

Beitragvon bele » Do 20. Aug 2020, 22:33

herrklingtgeil hat geschrieben:Trotzdem wäre es auch eine Möglichkeit, eine weitere Spalte als "% Abschreibung" auf Basis Potenzieller Neupreis (Nettolistenpreis+ Pauschale für Sonderausstattung) MINUS Restwert anzuhängen.


Bin nicht sicher, ob ich das Minus verstehe. Ich hätte jetzt gedacht, dass man den Anteil des Restwerts am mutmaßlichen Neupreis, also einfach nur eine Division ausprobiert.

Die Frage ist, ob man das so machen "darf".


Ja, man darf sinnvolle Größen ausrechnen und in die Regression einsetzen, solange es nicht zum ungezielten Rechenzeichen-Würfeln wird.

Ich hatte im Vorfeld auch mal Folgendes gemacht:
Die unterschiedlichen Laufleistungen klassifiziert (Intervall von 150.000 - 250.000 entsprechen 200.000 usw.) und aus den Klassen die durchschnittlichen Restwerte gebildet.


Klar wird das R² besser, wenn man die Schwankungen wegmittelt. Das ändert aber nichts daran, dass Du zwar einen durchschnittlichen Preisverlust errechnest, dieser aber im konkreten Einzelfall bedeutungslos ist. Ich vermute mal, dass bei beiden Regressionen ein ähnlicher durchschnittlicher Wertverlust pro tausend Kilometer herausgekommen ist?


Wäre dies auch ein gängiges Mittel?

Ich würde lieber das Modell mit den 8% R² nehmen. Deine Laufleistungsklassen sind völlig beliebig gewählt und daher unnötig kompliziert zu rechtfertigen.

Schlussendlich brauche ich lediglich eine Restwertabschätzung nach 5 Jahren Regelnutzung, die Laufleistung-sensitiv ist, da ich hier unterschiedliche KM-Szenarien in meiner Wirtschaftlichkeitsberechnung heranziehe.


Einen durchschnittlichen Restwert kannst Du ja bestimmen. Der Einzelfall schert sich halt nicht um diesen Durchschnitt.

UPDATE: Markentechnisch hat sich nichts verbessert - leider. Ich ziehe mir nun nochmal einen Datenschnitt, um die Anzahl der Datensätze zu erhöhen (letzer Datenschnitt von der Handelsplattform wurde vor 3 Monaten gemacht).
In letzter Instanz sollte ich nicht nur nach Marken filtern, sondern auch nach expliziter Sonderausstattung. Spätestens dann sollte eigentlich eine Abhängigkeit des Restwertes von der Laufleistung erkennbar sein. Ansonsten ;-(


Geh doch nochmal in Dich, ob Du nicht irgendwen ansprechen kannst, der was vom Handel mit alten LKW versteht und der Dir sagen kann, was den Restwert ausmacht. Für mich als PKW-Fahrer ist schwer vorstellbar, dass Sonderausstattung soviel ausmachen soll, aber vielleicht stehen Aspekte im Vordergrund, an die wir nicht denken? Zugkraft, Zulassungsvoraussetzungen in verschiedenen Ländern, Steuermodelle, Vorhandensein einer Duschmöglichkeit, Geländergängigkeit, ..??

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: Fahrzeug-Restwertermittlung mittels Regression

Beitragvon herrklingtgeil » Fr 21. Aug 2020, 12:17

Ob man nun Restwert oder Werteverzehr (was ich mit % Abschreibung meinte) hinzuzieht ist ja am Ende des Tages egal.

Also gewisse Dinge, die entsprechend wichtig sind für den Erlös eines Lkws sind grundsätzlich schon mit einbezogen. Dazu zählen u.a.
- Abgasnorm (EU5 kaum noch im Gebrauch)
- Achsen
- Motorleistung
- Kabinengröße

Ich bin nun dabei die 2 Datensätze zu vereinen, um die Datenbasis zu vergrößern, um dann wiederum eine höhere Dichte zu erzählen, sobald ich nach entsprechenden Kriterien wie Marke filter.

Mein Ziel ist es nun, mithilfe der dann erzielten Datenwolke eine Trendfunktion zeichnen zu können, die die Datenbasis am besten beschreibt. Höchstwahrscheinlich wird das R nicht über 20% kommen, aber mit entsprechenden positiven/negativen Szenarien (Sensitivitätsanalysen im Nachgang) könnte ich die Streuung zumindest teilweise einbeziehen.

Worauf ich allerdings noch nicht kam, ist, wie ich solch eine Trendfunktion zeichnen kann? Am besten scheint sich eine logarithmierte Trendfunktion zu eignen, allerdings finde ich beim Programm Orange (Phyton Tool) lediglich lineare Regressionsanalysen. Bei Exel ja leider genauso.

Viele Grüße und vorab ein sonniges WE,
Dennis
herrklingtgeil
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Do 20. Aug 2020, 14:42
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Fahrzeug-Restwertermittlung mittels Regression

Beitragvon herrklingtgeil » Do 27. Aug 2020, 20:13

Hallo zusammen,

ich wollte nun nochmal ein kleines Update geben.
Ich hatte nun noch einmal alle Daten nach verschiedenen Marken ebenbürtiger Modelle gefiltert (die auch in einschlägigen Zeitschriften verglichen werden und preislich nahe sind) und die Marken entsprechend metrisch skaliert,
um eine multiple Regression erstellen zu können.

Gleichzeitig hatte ich das Alter der Fahrzeuge auf 5 gesetzt (zuletzt hatte ich aufgrund der größeren Datenbasis oftmals 4-6Jahre alte Lkws).
Demzufolge komme ich auf eine Datenbasis von 77 Stück.

Somit komme ich nun immerhin auf Folgendes:

R Square 0,154977026
Adjusted R Square 0,131825711
Signifikanz 0,002141415


Wie ich gehört habe, sollte man bei multiplen Regressionen auf das adjustierte Bestimmtheitsmaß achten.
Meint ihr, das wäre mit 13,2 % ausreichend hoch?
herrklingtgeil
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Do 20. Aug 2020, 14:42
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste