Hallo,
ich arbeite in einem Chemieunternehmen. Ich habe eine statistische Fragestellung. Leider habe ich nicht viel Ahnung von Statistik. Das statistische Wissen dazu habe ich mir im Internet angelesen, also bitte nicht wundern, wenn da ein paar grobe Schnitzer drin sind.
Zur Fragestellung:
In der Chemieindustrie zählt Sicherheit sehr viel. Die wichtigste Kennzahl dazu ist die Unfallzahl. Eigentlich eher die Anzahl der Unfälle (eines bestimmten Schweregrads) pro Mitarbeiterstunden bezogen auf das Unternehmen oder einzelne Abteilungen und einen bestimmten Zeitraum davon und normiert auf 200.000h (Total Recordable Incident Rate = TRIR). Aber wenn diese Daten näherungsweise gleich bleiben, können wir der Einfachheit halber mal bei der Unfallzahl bleiben.
Die Zahl wird für das Gesamtunternehmen, aber auch für einzelne Abteilungen erhoben um diese untereinander zu vergleichen (und den Bonus der Mitarbeiter zu bestimmen). Die Unfallzahlen konnten in den letzten 20 Jahren allerdings soweit gesenkt werden, dass in einer Abteilung nur noch wenige Unfälle pro Jahr passieren. Meine These ist daher, dass Änderungen in dieser Zahl keine Aussage über die tatsächliche „Sicherheitsleistung“ der Abteilung sind, sondern normale statistische Schwankungen. Die Kennzahl mag für das gesamte Unternehmen Sinn machen, aber nicht, mehr wenn man das auf einzelne Abteilungen runterbricht. Wenn beispielsweise die Unfallzahl von 120 auf 100 im Gesamtunternehmen sinkt, ist es etwas anderes als in einer Abteilung von 12 auf 10 Unfälle.
Nehmen wir mal an, die Unfallzahlen für die letzten 11 Jahre sehen in einer Abteilung so aus:
2006: 12
2007: 7
2008: 14
2009: 8
2010: 12
2011: 17
2012: 11
2013: 4
2014: 10
2015: 7
2016: 9
Meine These ist also, dass dies einer zufälligen Verteilung folgt. Begründen würde ich das mit einem Chi-Quadrat-Test als Anpassungstest auf eine Poissonverteilung. Also:
Die beobachtete Häufigkeit wird zunächst in einer Tabelle aufgelistet:
Anzahl Unfälle Häufigkeit des Auftretens
1 0
2 0
3 0
4 1
5 0
6 0
7 2
8 1
9 1
10 1
11 1
12 2
13 0
14 1
15 0
16 0
17 1
Anschließend werden die Werte in Klassen zusammengefasst und den erwarteten Werten nach einer Poissonverteilung gegenübergestellt:
Anzahl Unfälle Beobachtete Werte Erwartete Werte (Poissonverteilung)
1 bis 3 0 0,11
4 bis 6 1 1,26
7 bis 9 4 3,54
10 bis 12 4 3,70
13 bis 15 1 1,82
16 bis 18 1 0,48
Mit einem Chi-Quadrat-Test als Anpassungstest wird überprüft ob die beobachteten Werte einer poissonverteilt sind. Es ergibt sich eine Wahrscheinlichkeit von 95% dass dies der Fall ist.
Ist meine Schlussfolgerung richtig? Habe ich Fehler gemacht? Gibt es bessere Wege meine These zu überprüfen?
Viele Dank im Voraus