Hallo zusammen,
ich bräuchte noch mal eure Hilfe. Es geht meines Erachtens um eine einfaktorielle (Co)Varianzanalyse, evtl sogar multivariat. In der Entscheidung bräuchte ich eure Hilfe.
Zum Studiendesign: Es wurden in 9 Betrieben Messungen der Körperbelastungen durchgeführt. Diese 9 Betriebe wurden klassifiziert in 3 Gruppen mit je 3 Betrieben, seien es die Faktorstufe A, B, C. Die Messungen liefen mehrere Stunden, wurden später in verschiedene Intervalle unterteilt, sodass sich für die verschiedenen Faktorstufen auch unterschiedlich viele Messintervalle bildeten (267+218+162=647). In jedem Intervall gibt es zu jedem Parameter einen Mittelwert, aber auch die prozentuale Verteilung in neutrale, moderate und ungünstige Winkelbereiche. Insgesamt wurden 10 Parameter erfasst.
Zeigen möchte ich jetzt, dass die Belastungen in A höher/niedriger sind als in B. Es soll also der Einfluss der Klassifizierung auf die gemessenen Belastungsparameter getestet werden, mit anderen Worten: Ob man allein von der Klassifizierung (ordinal) schon auf eine höhere Belastungen (skalenniveau) schließen kann.
Nimmt man die Parameter der Rückenbelastung (Rumpfvor- und Rumpfseitneigung, die Rückentorsion sowie die Momente und Kompressionskräfte) zusammen, sind dies 5 Parameter. Das könnte ich jetzt in einzelnen univariaten oder in einer multivariaten Varianzanalyse rechnen, ist das richtig? Ich habe öfter gelesen, dass es ohnehin oft auf die einzelnen univariaten Analysen hinausläuft und die multivariate keine großen Vorteile bietet.
Eine weitere Frage zu meinen Skalenniveaus: Nehme ich die Mittelwerte der Parameter von jedem Intervall so sind diese annähernd normalverteilt (auch wenn die Signifikanztests .000 ergeben, ist das ein Problem oder reicht die Robustheit der AN(C)OVA aus?), wenn ich aber die prozentualen Verteilungen nehme bin ich darin weit von einer Normalverteilung entfernt, auch in den QQ-Plots (annähernd die Form von e^x, öfter auch mit vielen Werten gleich 0 oder 100, also mit Geraden links/rechts). Zum Beispiel die Rumpfseitneigung, hier beginnt bei +20 bzw -20 Grad der ungünstige Winkelbereich. Aufgrund der Symmetrie kann ich hier nicht mit dem Mittelwert rechnen, der keine Aussagekraft hat. Oft wurde in den einzelnen Intervallen aber zu 0, aber auch zu 100 Prozent in den verschiedenen Winkelklassen gearbeitet, sodass die Normalverteilungsannahme hier nicht annähernd greift. Wie gehe ich damit um, kann ich mit den Daten trotzdem eine Varianzanalyse durchführen, bzw was wäre meine Alternative?
Zum letzten Punkt der aus dem ganzen ein CoVarianzanalyse machen würde: Ich könnte die Unterschiede noch auf Kovariaten wie das Alter der Probanden zurückführen, den BMI, der Mitarbeiteranzahl und vielem mehr. Allerdings gab es pro Betrieb nur 2 Probanden, also 9*2=18 Probanden. Kann man bei der Anzahl schon signifikante Ergebnisse finden? Dann müsste ich diese Zahlen einfach als Kovariaten in das Modell aufnehmen?!
Vielen Dank für eure Hilfe.