Hallo zusammen,
ich stehe vor folgendem Problem, zu dem ich auf Anhieb noch nichts gefunden habe: Ich habe etwa 15000 Zeitreihen mit Stundenwerten über mehrere Jahre (händische oder graphische Auswertungen fallen also definitiv raus!). Die Zeitreihen sind weitestgehend stationär und haben auch typische Zyklen (Jahres, Monats, Tageszyklen). Ohne es getestet zu haben, kann aufgrund von Vorüberlegungen von unabhängigen Zeitreihen ausgegangen werden. Was ich nun herausfinden möchte, ist, inwiefern es typische, ähnliche Zeitreihen gibt. Optimal wäre also, wenn ich sehr ähnliche Zeitreihen (mit z.B. Peaks zur gleichen Tageszeit, einer gleichen Amplitude etc.) zusammengefasst werden, so dass am Ende vielleicht 5-20 typische Gruppen von Zeitreihen herauskommen könnten.
Mein Problem ist, dass - soweit ich mal mein Grundwissen, einführende Literatur v.a. zu Methoden der Datenanalyse (stochastische Prozesse bzw. Zeitreihenanalyse) sich vornehmlich auf einzelne Zeitreihen stürzen und deren jeweilige Struktur (Trend, Statinarität, Autokorrelation etc. etc.). Das ist zwar nett, interessiert mich aber nicht vornehmlich.
2 Ideen hätt ich, aber das scheint mir beides nur so halbgar:
1) Anpassungstests: Ich nehme 2 Zeitreihen, teste die gegeneinander, wenn H0 zutrifft, werden sie zusammengelegt. Allerdings müsste ich dann ja ähnlich der Clusteranalyse alle Zeitreihen gegeneinander testen und dann die mit dem größten p zusammenlegen, dann daraus eine neue berechnen (über die Mittel?) usw. usf., was mit großem Programmieraufwand und zweifelhaftem Ergebnis bewandert wäre.
2) Ich mache direkt eine Clusteranalyse, indem ich die einzelnen Tages(mittel)werte (bei Stundenwerten hätte ich auf jedem fall autokorrelierte, abhängige Werte, was die Voraussetzungen der CA verletzt) quasi als einzelne Datenpunkte betrachte und danach gruppiere. Also würde die Zeitreihen zusammengefasst, die im Mittel die geringsten Abstände zueinander haben. Was mir daran so gar nicht gefällt, ist, dass mir der Tagesverlauf sehr wichtig ist. Vielleicht könnte man stattdessen auch Mittel der einzelnen Stunden bilden (also jeweils die 365 Werte der Stunde 1 etc.) und dies dann verwursteln, aber so richtig gefällt mir das auch nicht.
Sooo, alle Klarheiten beseitigt?
Für Hilfe aller Art ("machs doch so", "das geht gar nicht" über "les doch mal nach bei") freu ich mich sehr!!
mfG
fablink26