Liebe Community
Ganz grob ist die Situation wie folgt:
Wir beziehen Impulse von zahlreichen (> 500) verschiedenen Quellsystemen, auf die wir keinen Zugriff haben. D.h. wir nehmen entgegen, was eingeliefert wird, wir können aber keine Einlieferung eines Impulses anfordern oder beeinflussen. In Summe sind es ca. 40 Mio. Impulse pro Tag, die über den Tag nicht gleichverteilt sind. Unsere Zielsetzung ist nun, dass wir sehr schnell erkennen (nach Möglichkeit im Minutenbereich), wenn eine (oder mehrere) unserer Quellen nicht mehr liefert.
Den Eingang der Impulse in einem fixen Zeitraum t-fix (etwa 30 oder 60 Sekunden) können wir als Poisson-verteilt annehmen und wegen der grossen Volumen durch die Normalverteilung annähern.
Nehmen wir nun die Nullhypothese an, die besagt, dass wir im Zeitraum t-fix mindestens 40'000 Impulse erreichen/erwarten (und alles wäre ok), dann wäre die Alternativhypothese, dass wir zu wenig Impulse haben bzw. (zumindest) eine Quelle nicht (ausreichend) liefert. Die Verteilungsfunktion der Normalverteilung besagt, dass bei einem Erwartungswert von 40'000 99,75% der Messwerte im Intervall zwischen 39485 = 40'000 - 515 (2,576 * Sigma mit Sigma = 200 = Wurzel von 40'000) und unendlich liegen. Nach meinem Verständnis ist das in diesem Fall auch die Irrtumswahrscheinlichkeit, d.h. mit einer Wahrscheinlichkeit von 0,25% verwerfe ich die Nullhypothese und suche nach einer nichtliefernden Quelle, obwohl alles in Ordnung ist.
In der Praxis ergeben sich nun aber mehrere Herausforderungen:
1. Der Erwartungswert lässt sich nicht mit dieser Präzision abschätzen. Wenn ich oben 40'000 Impulse genannt habe, dann können es auch 37'000 sein. dann aber wären die 39485 als untere Grenze völlig daneben.
2. Der Erwartungswert verhält sich im Tagesverlauf ähnlich einer Sinuskurve (halbe Periode). D.h. es gibt nur sehr kurze Zeiträume, in denen der Erwartungswert vergleichbar hoch ist.
3. Den Untersuchungszeitraum t-fix kann ich nicht beliebig verlängern. Ich will bekanntlich im Minutenbereich (10-20 Minuten) reagieren.
Und hier bin ich mit meinem Latein am Ende. Hat jemand eine Idee, wie ich die Problematik in den Griff bekommen kann?
Vielen Dank im Voraus für alle anregenden und konstruktiven Beiträge.