Datenbereinigung und Kontrollvariable

Fragen, die sich auf kein spezielles Verfahren beziehen.

Datenbereinigung und Kontrollvariable

Beitragvon Er.Es. » Sa 30. Dez 2023, 15:55

Hallo in die Runde,

ich habe zwei Fragen, auf die ich selbst bisher keine Antwort gefunden habe und hoffe nun hier eine helfende Antwort zu finden.

Die erste Frage ist recht allgemein. Und zwar fange ich gerade an mit der Bereinigung und Identifikation meiner Daten auf Extremwerte und Ausreißer, bevor es dann zur Voraussetzungsprüfung meiner geplanten Analysen übergehen soll.Ich habe verschiedene Analysen geplant, in denen ich auch verschiedene Kontrollvariablen einbeziehen möchte/muss. Nun frage ich mich, ob ich richtig gehe in der Annahme, dass ich auch Kontrollvariablen auf Ausreißer und Extremwerte prüfe und letztere ggf. entferne. (Denn statistisch betrachtet beziehe ich diese ja beispielsweise als "normale" Prädiktoren neben meinen relevanten UV's mit ein.) Stimmt das?

Meine nächste Frage bezieht sich dann auf eine meiner Kontrollvariablen. Dafür versuche ich kurz auszuholen:
Ich habe drei verschiedene Zeitpunkte (vor, während, danach), an denen ich im Zuge der Pandemie Daten zu Belastungen und Burnout erhoben habe. Nun möchte ich beispielsweise mit Hilfe einer multiplen Regressionsanalyse rausfinden, ob sich Belastungen während der Pandemie auf Burnoutwerte nach der Pandemie ausgewirkt haben. Da mein Erhebungs-Zeitraum während der Pandemie aber 9 Monate lang war, will ich darauf kontrollieren, wann meine Probanden in diesem Zeitraum die Fragebögen ausgefüllt haben. Denn theoretisch könnte man vermuten, dass z.B. durch die Lockerungen mit der Zeit eventuell Unterschiede darauf zurückzuführen sind, was ich ausschließen möchte.
Da der Zeitraum wie gesagt 9 Monate lang war ergeben sich Werte von 1-9 für die Probanden. Und weil ich davon ausging, dass hinter der Variable ja eindeutig definierte Zeitabstände, die aufeinander folgen, stehen, habe ich sie ursprünglich als metrische Kontrollvariable betrachtet.
Ist das denn richtig, oder handelt es sich dabei doch eher um eine ordinale Variable?

Wenn die besagte Kontrollvariable metrisch ist und ich sie ebenfalls auf Extremwerte und Ausreißer prüfen muss, dann bin ich etwas verunsichert, denn dabei zeigt sich, dass alle Probanden, die im 1. Monat des Zeitraumes abgegeben haben sowie im 9. Monat abgegeben haben, Extremwerte sind und ich diese nach Absprache mit meiner Betreuerin eigentlich entfernen kann/soll. Aber diesen Zeitraum habe ich ja bewusst genau so gewählt, damit mir bei dem Messwiederholungsdesign der Studie auch genügend Probanden in meine Stichprobe fallen und diese Zeiträume auch zum Ablauf der Pandemie passen. (Ich hoffe man versteht, wie ich es meine.)

Ich würde mich freuen, hätte jemand eine Anregung oder hilfreiche Antwort für mich.
Ansonsten allen schon einmal einen guten Rutsch!

Mit freundlichen Grüßen,
Er.Es.
Er.Es.
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Mo 10. Jul 2023, 21:01
Danke gegeben: 10
Danke bekommen: 0 mal in 0 Post

Re: Datenbereinigung und Kontrollvariable

Beitragvon PonderStibbons » Sa 30. Dez 2023, 19:39

Und zwar fange ich gerade an mit der Bereinigung und Identifikation meiner Daten auf Extremwerte und Ausreißer, bevor es dann zur Voraussetzungsprüfung meiner geplanten Analysen übergehen soll.Ich habe verschiedene Analysen geplant, in denen ich auch verschiedene Kontrollvariablen einbeziehen möchte/muss. Nun frage ich mich, ob ich richtig gehe in der Annahme, dass ich auch Kontrollvariablen auf Ausreißer und Extremwerte prüfe und letztere ggf. entferne. (Denn statistisch betrachtet beziehe ich diese ja beispielsweise als "normale" Prädiktoren neben meinen relevanten UV's mit ein.) Stimmt das?

Du solltest in aller Regel weder das eine noch das andere tun. Mit welcher inhaltlicher und statistischer Begründung
willst Du Deinen Datensatz auf diese Weise manipulieren?

Ist das denn richtig, oder handelt es sich dabei doch eher um eine ordinale Variable?

Zunächst mal intervallskaliert. Allerdings fragt sich, ob die Veränderung von z.B. Monat 2 zu 4 tatsächlich dasselbe
bedeutet wie von Monat 6 zu 8? Je nachdem, um welche Jahreszeit/Phase des Pandemiegeschehens es sich handelt,
kann es in einem Fall einen starken Unterschied (und gegebenenfalls Effekt auf die AV) bedeuten, im anderen einen
geringen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Er.Es.


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste