Gruppierung von Zeitreihen (Ähnlichkeit)

Fragen, die sich auf kein spezielles Verfahren beziehen.

Gruppierung von Zeitreihen (Ähnlichkeit)

Beitragvon fablink26 » Di 25. Sep 2012, 11:01

Hallo zusammen,

ich stehe vor folgendem Problem, zu dem ich auf Anhieb noch nichts gefunden habe: Ich habe etwa 15000 Zeitreihen mit Stundenwerten über mehrere Jahre (händische oder graphische Auswertungen fallen also definitiv raus!). Die Zeitreihen sind weitestgehend stationär und haben auch typische Zyklen (Jahres, Monats, Tageszyklen). Ohne es getestet zu haben, kann aufgrund von Vorüberlegungen von unabhängigen Zeitreihen ausgegangen werden. Was ich nun herausfinden möchte, ist, inwiefern es typische, ähnliche Zeitreihen gibt. Optimal wäre also, wenn ich sehr ähnliche Zeitreihen (mit z.B. Peaks zur gleichen Tageszeit, einer gleichen Amplitude etc.) zusammengefasst werden, so dass am Ende vielleicht 5-20 typische Gruppen von Zeitreihen herauskommen könnten.
Mein Problem ist, dass - soweit ich mal mein Grundwissen, einführende Literatur v.a. zu Methoden der Datenanalyse (stochastische Prozesse bzw. Zeitreihenanalyse) sich vornehmlich auf einzelne Zeitreihen stürzen und deren jeweilige Struktur (Trend, Statinarität, Autokorrelation etc. etc.). Das ist zwar nett, interessiert mich aber nicht vornehmlich.
2 Ideen hätt ich, aber das scheint mir beides nur so halbgar:
1) Anpassungstests: Ich nehme 2 Zeitreihen, teste die gegeneinander, wenn H0 zutrifft, werden sie zusammengelegt. Allerdings müsste ich dann ja ähnlich der Clusteranalyse alle Zeitreihen gegeneinander testen und dann die mit dem größten p zusammenlegen, dann daraus eine neue berechnen (über die Mittel?) usw. usf., was mit großem Programmieraufwand und zweifelhaftem Ergebnis bewandert wäre.
2) Ich mache direkt eine Clusteranalyse, indem ich die einzelnen Tages(mittel)werte (bei Stundenwerten hätte ich auf jedem fall autokorrelierte, abhängige Werte, was die Voraussetzungen der CA verletzt) quasi als einzelne Datenpunkte betrachte und danach gruppiere. Also würde die Zeitreihen zusammengefasst, die im Mittel die geringsten Abstände zueinander haben. Was mir daran so gar nicht gefällt, ist, dass mir der Tagesverlauf sehr wichtig ist. Vielleicht könnte man stattdessen auch Mittel der einzelnen Stunden bilden (also jeweils die 365 Werte der Stunde 1 etc.) und dies dann verwursteln, aber so richtig gefällt mir das auch nicht.

Sooo, alle Klarheiten beseitigt?

Für Hilfe aller Art ("machs doch so", "das geht gar nicht" über "les doch mal nach bei") freu ich mich sehr!! :P

mfG
fablink26
fablink26
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 25. Sep 2012, 10:39
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Gruppierung von Zeitreihen (Ähnlichkeit)

Beitragvon STATWORX » Mi 26. Sep 2012, 09:52

Hallo,

das Clustern von Zeitreihen ist nicht trivial, insb. auch in Deinem Fall die Dimensionalität des Problems.
Es gibt div. Ansätze um ähnliche Zeitreihen zu Gruppen zusammenzufassen, diese sind allerdings meistens nicht in Standard-Softwarepakete implementiert.

google: similarity time series

Eine "einfache" Möglichkeit, die mir spontan einfallen würde, wäre ein sog. Variable Clustering durchzuführen, sprich, nicht die einzelnen Fälle (Zeilen) zu clustern sondern die einzelnen Variablen (Zeitreihen, Spalten). Dies ist bspw. mit R möglich.

google: variable clustering r

Ich hoffe, das hilft Dir, bei Fragen einfach melden.

VG
STATWORX
STATWORX
Foreninhaber
Foreninhaber
 
Beiträge: 85
Registriert: Di 14. Jun 2011, 19:45
Danke gegeben: 0
Danke bekommen: 18 mal in 18 Posts

Re: Gruppierung von Zeitreihen (Ähnlichkeit)

Beitragvon fablink26 » Mi 26. Sep 2012, 10:10

Hallo,

danke schonmal für die schnelle Antwort! Der Hinweis für R ist prima, damit bin ich ein wenig vertraut und ich hatte sowieso vor, R zu verwenden. Ich habe auch noch ein paar andere Quellen "angezapft" (statistische Beratung der mathematischen Fak. unserer Uni z.B.) und werde die nächste Zeit auch mal berichten, wies nun funktioniert hat. Falls ich überhaupt nicht klar komme, werde ich auch nochmal hier fragen.

mfG
fablink26
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 25. Sep 2012, 10:39
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 14 Gäste