Hallo,
für meine anstehende Bacherlorarbeit benötige ich etwas Hilfe.
Statistik hatten wird damals im 1. Semester und war ein "Statistics 101" Kurs. Ein Blick in die alten Unterlagen hilft mir bei meinem Problem nicht weiter.
Problemstellung (abgeändert):
Beim Arbeitsamt wird unter den Mitarbeitern eine anonymer und freiwilliger Test durchgeführt, wie lange sie für die Bearbeitung einer bestimmten Kategorie von Personaldaten benötigen. Sinn der Befragung ist, die zeitliche Dauer des Vorgangs zu erfassen und für die zukünftige Personalbedarfsplanung zu nutzen. Dabei ist zu beachten, dass die Bearbeitung der Personaldaten zum Teil aufgrund Dritter zu einer erheblichen Verlängerung des Bearbeitungszeitraums um den Faktor 4-5 kommen kann.
Eine simple Ermittlung des Mittelwerts als alleinige zeitliche Basis zukünftiger Planungen ist natürlich unzureichend und realitätsfern. Auf die Idee ist man früher schon gekommen und kläglich gescheitert. Durch den Einfluss Dritter in den Zeitbedarf, ist die Personalplanung eine Schätzung und kann nicht wie bei einer Fließbandproduktion exakt errechnet werden. Als Idee schweben mir zeitliche Puffer zusätzlich zum im Schnitt ermittelten Zeitaufwand vor. Ergänzend ist zu erwähnen, dass die Datensätze gem. K-S Test parametrisch sind.
Diese Puffer würde ich gerne dynamisch anlegen. Angenommen es erfolgt eine stetige Erfassung der Bearbeitungszeiten, dann soll sich auch dieser Puffer mit der wachsenden Datenmenge anpassen. Dabei soll der Puffer so weit wie möglich ausgeschöpft werden, aus Verrechnungsgründen sollte aber nicht überschritten werden.
Beispiel:
Datensatz 1:
Bearbeitungszeit Mittelwert: 22,7min
95% Konfidenzintervall: 17,6-27,9min
auf 5% getrimmter Wert: 21,4min
Median: 16,5
Standardabweichung 13,7min
Datensatz 1+2(neue Daten):
Bearbeitungszeit Mittelwert: 25,3min
95% Konfidenzintervall: 21,3-29,3min
auf 5% getrimmter Wert: 24,4min
Median: 17
Standardabweichung 15min
Datensatz 1+2+3
Bearbeitungszeit Mittelwert: 22,4min
95% Konfidenzintervall: 19,2-25,6min
auf 5% getrimmter Wert: 21,2min
Median: 16
Standardabweichung 13,9min
Da meine Statistik Kenntnisse nun recht begrenzt sind, meine Frage an die Experten. Gibt es vielleicht schon sinnvolle Methoden in der Richtung, oder habt ihr Ideen/Anregungen, wie diese Problemstellung weiter angegangen werden kann?