Hallo zusammen
Zurzeit mache ich eine Analyse von Bauteilen bei denen ich feststellen möchte, wie groß der Zusammenhang zwischen meinen identifizierten Einflussgrößen ist.
Dafür habe ich die Daten von 6000 Teilen, von denen ich jeweils weiß:
- ausgefallen (ja/nein)
- Anzahl von Vorreparaturen (keine/eine/zwei)
- gelaufene Stunden (10 verschiedene Unterteilungen)
Und noch ein paar Einflüsse mehr.
Am Ende soll es das Ziel sein einen Bauteilausfall vorhersagen zu können.
Bsp.: Ein Teil hat bereits eine Vorreparatur erhalten und ist danach 15000 Stunden gelaufen. Dieser Zusammenhang soll mit hoher Wahrscheinlichkeit als Bauteilausfall prognostiziert werden.
Mein Problem ist, dass die Daten eher qualitativer Natur sind, als quantitativer. Deswegen habe ich den Chi-Quadrat-Test gewählt.
Meine Herangehensweise wäre damit wie folgt:
- quadratische Kontingenz bestimmen
- mittlere quadratische Kontingenz bestimmen
- Cramersches Kontingenzmaß bestimmen
- quadratische Matrix der Kontingenzmaße aufstellen, in der die Cramerschen Kontingenzmaße für jede Kombination aus Einflüssen ersichtlich sind.
Beim Chi-Quadrat-Test bin ich mir jedoch schon nicht sicher was ich wählen soll. Schaue ich mir zuerst nur die ausgefallenen Bauteile an? Also z.B. 1000 ausgefallene Teile. Matrix aufstellen: von links nach rechts die Anzahl der Vorreparaturen die zum Ausfall geführt haben und von oben nach unten die Stundenklassen, bei denen es zum Ausfall kam? Oder betrachte ich die komplette Anzahl von Bauteilen und muss die Anzahl der Ausfälle mit jeder Einflussgröße seperat untersuchen?
Vielen Dank schon mal