Hallo in die Runde,
ich habe zwei Fragen, auf die ich selbst bisher keine Antwort gefunden habe und hoffe nun hier eine helfende Antwort zu finden.
Die erste Frage ist recht allgemein. Und zwar fange ich gerade an mit der Bereinigung und Identifikation meiner Daten auf Extremwerte und Ausreißer, bevor es dann zur Voraussetzungsprüfung meiner geplanten Analysen übergehen soll.Ich habe verschiedene Analysen geplant, in denen ich auch verschiedene Kontrollvariablen einbeziehen möchte/muss. Nun frage ich mich, ob ich richtig gehe in der Annahme, dass ich auch Kontrollvariablen auf Ausreißer und Extremwerte prüfe und letztere ggf. entferne. (Denn statistisch betrachtet beziehe ich diese ja beispielsweise als "normale" Prädiktoren neben meinen relevanten UV's mit ein.) Stimmt das?
Meine nächste Frage bezieht sich dann auf eine meiner Kontrollvariablen. Dafür versuche ich kurz auszuholen:
Ich habe drei verschiedene Zeitpunkte (vor, während, danach), an denen ich im Zuge der Pandemie Daten zu Belastungen und Burnout erhoben habe. Nun möchte ich beispielsweise mit Hilfe einer multiplen Regressionsanalyse rausfinden, ob sich Belastungen während der Pandemie auf Burnoutwerte nach der Pandemie ausgewirkt haben. Da mein Erhebungs-Zeitraum während der Pandemie aber 9 Monate lang war, will ich darauf kontrollieren, wann meine Probanden in diesem Zeitraum die Fragebögen ausgefüllt haben. Denn theoretisch könnte man vermuten, dass z.B. durch die Lockerungen mit der Zeit eventuell Unterschiede darauf zurückzuführen sind, was ich ausschließen möchte.
Da der Zeitraum wie gesagt 9 Monate lang war ergeben sich Werte von 1-9 für die Probanden. Und weil ich davon ausging, dass hinter der Variable ja eindeutig definierte Zeitabstände, die aufeinander folgen, stehen, habe ich sie ursprünglich als metrische Kontrollvariable betrachtet.
Ist das denn richtig, oder handelt es sich dabei doch eher um eine ordinale Variable?
Wenn die besagte Kontrollvariable metrisch ist und ich sie ebenfalls auf Extremwerte und Ausreißer prüfen muss, dann bin ich etwas verunsichert, denn dabei zeigt sich, dass alle Probanden, die im 1. Monat des Zeitraumes abgegeben haben sowie im 9. Monat abgegeben haben, Extremwerte sind und ich diese nach Absprache mit meiner Betreuerin eigentlich entfernen kann/soll. Aber diesen Zeitraum habe ich ja bewusst genau so gewählt, damit mir bei dem Messwiederholungsdesign der Studie auch genügend Probanden in meine Stichprobe fallen und diese Zeiträume auch zum Ablauf der Pandemie passen. (Ich hoffe man versteht, wie ich es meine.)
Ich würde mich freuen, hätte jemand eine Anregung oder hilfreiche Antwort für mich.
Ansonsten allen schon einmal einen guten Rutsch!
Mit freundlichen Grüßen,
Er.Es.