Guten Tag zusammen,
für meine Arbeit muss ich den Zusammenhang von 10 unabhängigen Variablen auf 1 abhängige Variable prüfen.
Nun habe ich in meinen Daten zu den unabhängigen Variablen festgestellt, dass einige der unabhängigen Variablen eine starke, teils extreme, Streuung aufweisen (Sehr hoher Variationskoeffizient und auch Grafisch sichtbar). Die starke Streuung der Daten basiert nicht auf Eingabefehlern, sondern kann wahrscheinlich logisch begründet werden (Frage polarisiert stark oder es gibt aus guten Gründen wenige Werte in der Mitte). Eine der Variablen hat bspw. zwei starke Ausprägungen an beiden Enden der Skala.
Nun ist die Frage, wie ich mit diesen Daten am besten umgehe. Schließe ich diese von vornherein aus der Regression aus? Vergleiche ich die Regression mit diesen Daten und ohne diese Daten per Hand oder führe gleich eine Schrittweise Regressionsanalyse statt einer "Einschluss" Analyse durch? Oder sollte ich die Daten mit einem Verfahren (muss ich mir noch durchlesen, was es da so gibt) transformieren?
Vielen Dank im Voraus für eure Hilfe!