STATISTIK-FORUM.de

Hay fever · von **Hay fever** » Do 6. Apr 2017, 09:49

Hallo,

ich arbeite in einem Chemieunternehmen. Ich habe eine statistische Fragestellung. Leider habe ich nicht viel Ahnung von Statistik. Das statistische Wissen dazu habe ich mir im Internet angelesen, also bitte nicht wundern, wenn da ein paar grobe Schnitzer drin sind.

Zur Fragestellung:
In der Chemieindustrie zählt Sicherheit sehr viel. Die wichtigste Kennzahl dazu ist die Unfallzahl. Eigentlich eher die Anzahl der Unfälle (eines bestimmten Schweregrads) pro Mitarbeiterstunden bezogen auf das Unternehmen oder einzelne Abteilungen und einen bestimmten Zeitraum davon und normiert auf 200.000h (Total Recordable Incident Rate = TRIR). Aber wenn diese Daten näherungsweise gleich bleiben, können wir der Einfachheit halber mal bei der Unfallzahl bleiben.

Die Zahl wird für das Gesamtunternehmen, aber auch für einzelne Abteilungen erhoben um diese untereinander zu vergleichen (und den Bonus der Mitarbeiter zu bestimmen). Die Unfallzahlen konnten in den letzten 20 Jahren allerdings soweit gesenkt werden, dass in einer Abteilung nur noch wenige Unfälle pro Jahr passieren. Meine These ist daher, dass Änderungen in dieser Zahl keine Aussage über die tatsächliche „Sicherheitsleistung“ der Abteilung sind, sondern normale statistische Schwankungen. Die Kennzahl mag für das gesamte Unternehmen Sinn machen, aber nicht, mehr wenn man das auf einzelne Abteilungen runterbricht. Wenn beispielsweise die Unfallzahl von 120 auf 100 im Gesamtunternehmen sinkt, ist es etwas anderes als in einer Abteilung von 12 auf 10 Unfälle.

Nehmen wir mal an, die Unfallzahlen für die letzten 11 Jahre sehen in einer Abteilung so aus:

2006: 12
2007: 7
2008: 14
2009: 8
2010: 12
2011: 17
2012: 11
2013: 4
2014: 10
2015: 7
2016: 9

Meine These ist also, dass dies einer zufälligen Verteilung folgt. Begründen würde ich das mit einem Chi-Quadrat-Test als Anpassungstest auf eine Poissonverteilung. Also:

Die beobachtete Häufigkeit wird zunächst in einer Tabelle aufgelistet:
Anzahl Unfälle Häufigkeit des Auftretens
1 0
2 0
3 0
4 1
5 0
6 0
7 2
8 1
9 1
10 1
11 1
12 2
13 0
14 1
15 0
16 0
17 1

Anschließend werden die Werte in Klassen zusammengefasst und den erwarteten Werten nach einer Poissonverteilung gegenübergestellt:
Anzahl Unfälle Beobachtete Werte Erwartete Werte (Poissonverteilung)
1 bis 3 0 0,11
4 bis 6 1 1,26
7 bis 9 4 3,54
10 bis 12 4 3,70
13 bis 15 1 1,82
16 bis 18 1 0,48

Mit einem Chi-Quadrat-Test als Anpassungstest wird überprüft ob die beobachteten Werte einer poissonverteilt sind. Es ergibt sich eine Wahrscheinlichkeit von 95% dass dies der Fall ist.

Ist meine Schlussfolgerung richtig? Habe ich Fehler gemacht? Gibt es bessere Wege meine These zu überprüfen?

Viele Dank im Voraus

bele · von **bele** » Do 6. Apr 2017, 13:31

Hallo,

Hay fever hat geschrieben:Mit einem Chi-Quadrat-Test als Anpassungstest wird überprüft ob die beobachteten Werte einer poissonverteilt sind. Es ergibt sich eine Wahrscheinlichkeit von 95% dass dies der Fall ist.

Woher nimmst Du die 95%?

Hay fever hat geschrieben:Meine These ist daher, dass Änderungen in dieser Zahl keine Aussage über die tatsächliche „Sicherheitsleistung“ der Abteilung sind, sondern normale statistische Schwankungen.

Und wenn die erhobenen Daten gut zu einer Poissonverteilung passen, warum bedeutet das, dass die Mitarbeiter im letzten Jahr nicht besonders gut oder besonders schlecht aufgepasst haben?

Ich kann Dein Vorgehen in etwa nachvollziehen, frage mich aber doch, ob Du die Aussagekraft Deines Vorgehens nicht überbewertest.

LG,
Bernhard

Hay fever · von **Hay fever** » Fr 7. Apr 2017, 12:00

bele hat geschrieben:Woher nimmst Du die 95%?

Die hat mir Excel so ausgegeben. Stimmen die nicht?

bele hat geschrieben:Und wenn die erhobenen Daten gut zu einer Poissonverteilung passen, warum bedeutet das, dass die Mitarbeiter im letzten Jahr nicht besonders gut oder besonders schlecht aufgepasst haben?
Ich kann Dein Vorgehen in etwa nachvollziehen, frage mich aber doch, ob Du die Aussagekraft Deines Vorgehens nicht überbewertest.

Genau das ist ja der Punkt den ich mich auch Frage (oder jetzt eben Euch). Ich möchte meine These "Die Änderungen in den Unfallzahlen machen keine Aussage über die tatsächliche „Sicherheitsleistung“ der Abteilung, sondern sind normale statistische Schwankungen." mit statistischen Methoden beweisen (oder auch widerlegen).

Habt Ihr eine andere Idee wie man diese These sonst beweisen oder widerlegen könnte?

bele · von **bele** » Fr 7. Apr 2017, 14:55

Hay fever hat geschrieben:
bele hat geschrieben:Woher nimmst Du die 95%?

Die hat mir Excel so ausgegeben. Stimmen die nicht?

Excel hat bestimmt nicht geschrieben, dass die Wahrscheinlichkeit, dass die Daten aus ein und derselben Poissonverteilung stammen 95% ist. Excel hat wahrscheinlich geschrieben, dass der p-Wert 0,942 ist. Das wiederum zeigt an, dass Du nicht verstanden hast, was ein p-Wert ist und deshalb aus dem p-Wert Schlussfolgerungen ziehen willst, die man aus ihm nicht ziehen kann.

p = 0,94 zeigt an, dass man die Nullhypothese nicht verwerfen kann. Wenn die Nullhypothese gilt, dann ist der p-Wert eine Zufallszahl aus einer Gleichverteilung zwischen 0 und 1. Die Wahrscheinlichkeit eines Zusammenhangs einer gleichverteilten Zufallsvariable entnehmen zu wollen ist offensichtlich Quatsch.

Du kannst also aus Deiner Untersuchung folgendes ableiten: Die Möglichkeit, dass alle diese Zahlen einer einzigen Poissonverteilung entnommen sind, kann ich anhand der wenigen und kleinen vorliegenden Zahlen nicht abstreiten.

Du würdest gerne ableiten: Alle diese Zahlen entstammen einer einzigen Poissonverteilung.

Das ist logisch nicht das gleiche.

Nehmen wir an, die Unfallszahlen sähen wie folgt aus:

2007: 4
2008: 7
2009: 7
2010: 8
2011: 9
2012: 10
2013: 11
2014: 12
2015: 12
2016: 14
2017: 17

Dann würdest Du die Hände über dem Kopf zusammenschlagen und sagen "es wird ja immer schlimmer". Dein Chiquadrat-Anpassungtest würde aber immer noch das gleiche p = 0,94 ergeben, weil er mit den gleichen Zahlen rechnen würde.

Meines Erachtens wird daraus klar, dass Du entweder die Fragestellung oder den Lösungsweg ändern musst.

LG,
Bernhard

Hay fever · von **Hay fever** » Mi 12. Apr 2017, 13:56

OK, das mit der Poisson-Nummer war vielleicht der falsche Weg. Aber ich schrieb ja bereits oben, dass ich mich mit Statistik nicht gut auskenne. Ich versuche noch mal das Problem anders zu fassen:

Das praktische Problem besteht darin: Wenn wir in einem Jahr relativ wenige Unfälle (sagen wir zum Beispiel 7) haben, sind wir sehr stolz auf unsere "Sicherheitsleistung" bekommen einen höheren Bonus und feiern uns. Wenn wir dann im nächsten Jahr mehr Unfälle (sagen wir mal 11) haben sind alle sehr besorgt, es werden Arbeitskreise gegründet und unter Umständen Manager ausgetauscht. Im ersten Quartal dieses Jahres haben wir beispielsweise 4 Unfälle (der typische Manager interpretiert das als 2017: 12, es kommen ja noch drei Quartale) und der Druck von oben ist entsprechend groß. Die momentane Unfallzahl prägt sehr stark das Handeln. Passieren 2 oder 3 Unfälle in einem Monat, ist die ganze Abteilung wie ein aufgescheuchter Hühnerhaufen.
Meine These ist also (unwissenschaftliche ausgedrückt): Die Schwankungen die wir in den Unfallzahlen haben sind normal und kein Grund zur Unruhe. Eine Unfallzahl von 7 bedeutet nicht, dass wir Weltklasse sind und eine Unfallzahl von 11 nicht, dass wir ein Riesenproblem haben. Die Unfallzahl ist bei so niedrigen Zahlen einfach kein guter Indikator für die Sicherheitsleistung.

Meine Idee war, diese These mit statistischen Methoden zu untermauern. Wie könnte man das angehen?

bele · von **bele** » Mi 12. Apr 2017, 15:45

Hallo Hay fever,

bitte nicht falsch verstehen: Ich finde die Idee der Modellierung mit einem Poissonverteilung nicht schlecht, aber etwas kurzsichtig. Wahrscheinlich können relevante Steigerungen von Unfällen auftreten, ohne dass Dein System anspringt. Man könnte Dir dann von Seiten der Firma entgegen halten, dass es besser sei, umsonst nach einem Sicherheitsproblem zu suchen, als ein Sicherheitsproblem zu übersehen.

Wie mein Beispiel mit den umsortierten Unfallszahlen zeigt, solltest mehr Informationen in die Frage einbeziehen und die Zeitreihe auch als solche und nicht nur als eine ungeordnete Menge von Zahlen betrachten.

Nun sind Zeitreihenstatistiken hier nicht immer mit furchtbar vielen guten Antworten gesegnet und es gibt bestimmt kompetentere als mich. Bis sich jemand meldet, könntest Du mal nach den Stichworten "change point analysis" suchen (z. B. das hier finden: https://www.jstatsoft.org/article/view/v058i03 und das: https://cran.r-project.org/web/packages ... es/ecp.pdf ). Ich weiß nicht wie lesbar oder übertragbar das ist, aber schau auch hier mal hinein: http://journals.plos.org/plosone/articl ... 0041010#s5

Viel Glück bei der Suche nach einem geeigneten Ansatz, der nicht nur spezifisch, sondern auch sensitiv ist.

LG,
Bernhard

STATISTIK-FORUM.de

Statistische Auswertung von Unfallzahlen

Statistische Auswertung von Unfallzahlen

Re: Statistische Auswertung von Unfallzahlen

Re: Statistische Auswertung von Unfallzahlen

Re: Statistische Auswertung von Unfallzahlen

Re: Statistische Auswertung von Unfallzahlen

Re: Statistische Auswertung von Unfallzahlen

Wer ist online?