Hallo zusammen,
ich suche eine Lösung für ein praktisches Problem. Es geht um die Prognose der aktuellen Stärke eines Fußballteams anhand diverser Daten aus der Vergangenheit. Hier gibt es den Konflikt zwischen "je mehr Daten, desto besser die Prognose für die Stärke des Teams" und "je älter die Daten, desto weniger aussagekräftig sind diese für die aktuelle Stärke des Teams". Es müsste somit eine „optimale“ Gewichtung von älteren und neueren Daten geben.
Konkretes Beispiel (bezogen auf die Fußball-Bundesliga):
Die Stärke eines Teams X in einer Saison sei eine normalverteilte Zufallsvariable.
Die Daten aus der letzten Saison (34 Spieltage) ergeben für das Team X einen Stichprobenmittelwert von µ1 = 0,80 für die Teamstärke bei einer Standardabweichung von σ1 = 0,60/Wurzel(34)
Die Daten aus der aktuellen Saison (nach 17 Spieltagen) ergeben für das Team X einen Stichprobenmittelwert von µ2 = 0,40 für die Teamstärke bei einer Standardabweichung von σ2 = 0,60/Wurzel(17)
Zusätzlich sei noch die Info gegeben, dass die Veränderung der Stärke eines (beliebigen) Teams zwischen der letzten Saison und der aktuellen Saison auch eine normalverteilte Zufallsvariable sei mit µ3 = 0 und σ3 = 0,20.
Nun geht es mir darum, eine saubere Formel-Lösung für die optimale prozentuale Gewichtung zwischen µ1 und µ2 zu finden. Auf jeden Fall müsste gelten: Je größer σ3, desto mehr Gewicht müsste die neue Saison erhalten. Für das obige Beispiel habe ich in einem früheren eher iterativen bzw. simulationstechnischen Ansatz (den ich heute allerdings von der Logik her nicht mehr wirklich nachvollziehen kann) folgende Werte erhalten:
Gewichtung µ1 = ca. 0.295
Gewichtung µ2 = ca. 0.705
Würde mich interessieren, ob es für das geschilderte Problem eine saubere analytische (Formel)Lösung gibt. Und vorab schon mal sorry, falls ich mich als Laie an der ein oder anderen Stelle unsauber ausgedrückt habe.
Danke im Voraus für euer Interesse und Bemühen.