Wie Ähnlichkeit zweier Datenreihen bewerten?

Fragen, die sich auf kein spezielles Verfahren beziehen.

Wie Ähnlichkeit zweier Datenreihen bewerten?

Beitragvon Paul20 » Di 14. Apr 2015, 01:18

Hi,

ich suche nach einer Möglichkeit, die "Ähnlichkeit/Gleichheit" zweier Datenreihen (bzw. stückweise definierter Funktionen) zu quantifizieren. Ich habe eine Datenreihe (x,y-Werte), welche ich mit verschiedenen Verfahren auf Basis anderer Daten so gut wie möglich annähern möchte. Hierzu werden historische Daten genutzt; in der eigentlichen Anwendung ist die anzunähernde Datenreihe unbekannt, sodass es sich letztendlich um die Erzeugung einer bestmöglichen Prognose handelt. Um eine Prognosemethodik auszuwählen möchte ich historisch prognostizierte Datenreihen mit der letztendlich eingetroffenen vergleichen und die jeweilige "Güte" der Prognose berechnen.

Meine erste Idee ist die Nutzung eines Distanzmaßes wie bspw. der euklidischen Norm. Spricht da aus eurer Sicht etwas gegen oder habt ihr andere Vorschläge?

Danke und viele Grüße!
Paul20
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mo 6. Apr 2015, 22:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wie Ähnlichkeit zweier Datenreihen bewerten?

Beitragvon strukturmarionette » Di 14. Apr 2015, 01:58

Hi,

- eine 'euklidische Norm' anzuwenden, scheint etwas ungewöhnlich.

Ich habe eine Datenreihe (x,y-Werte), welche ich mit verschiedenen Verfahren auf Basis anderer Daten so gut wie möglich annähern möchte.


- zuallerallermindest könntest Du diese anderen Daten als Basis irgendwie benennen /konkretisieren.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4356
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 587 mal in 584 Posts

Re: Wie Ähnlichkeit zweier Datenreihen bewerten?

Beitragvon Paul20 » Di 14. Apr 2015, 10:51

Es handelt sich um die Angebotskurve in einer wiederkehrenden Auktion, d.h. mit steigender Menge steigt der Preis. Als Anhaltspunkt für die Form der Angebotskurve möchte ich den Durchschnitt der (bekannten) Angebotskurven der letzten 'x' Auktionen nehmen. Anhand historischer Auktionen möchte ich vergleichen, welcher Wert 'x' in der Vergangenheit zum "besten" Ergebnis geführt hätte, d.h. die tatsächlich eingetretenen Angebotskurven am besten angenähert hat.

Gruß
Paul20
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mo 6. Apr 2015, 22:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wie Ähnlichkeit zweier Datenreihen bewerten?

Beitragvon DHA3000 » Di 14. Apr 2015, 11:55

Im Grunde genommen geht dies mit einer symmterischen Verlustfunktion, wie dem Mean Squarred/Absolut Error.

Aber in deinem Fall würde sich auch eine asymmetrische Funktion anbieten, die die Forecast-Errors entsprechend gewichtet. Kommt aber eher auf deinen
Anwendungbereich an.
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

Re: Wie Ähnlichkeit zweier Datenreihen bewerten?

Beitragvon Paul20 » Di 14. Apr 2015, 13:30

Danke für den Ratschlag, den MSE zu nehmen macht wahrscheinlich mehr Sinn. Nun möchte ich für ca. 50 Auktionen mit verschiedenen 'x' jeweils eine Prognose erstellen, d.h. ich erhalte für jedes 'x' ebenfalls 50 Mal einen MSE. Gibt es eine sinnvolle Möglichkeit, diese 50 MSE der einzelnen Prognosen für jedes 'x' zu einem Wert zu kondensieren, quasi als aggregierten MSE? Sodass die Performance der verschiedenen 'x' über alle Prognosen verglichen werden kann und sich letztlich möglicherweise ein bestimmtes 'x' aufgrund des niedrigsten MSE empfiehlt?

Danke für eure Hilfe!
Paul20
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mo 6. Apr 2015, 22:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 5 Gäste

cron