Multiple lineare Regression - Umgang mit starker Streuung

Alle Verfahren der Regressionanalyse.

Multiple lineare Regression - Umgang mit starker Streuung

Beitragvon Xoha » Fr 4. Okt 2024, 12:05

Guten Tag zusammen,

für meine Arbeit muss ich den Zusammenhang von 10 unabhängigen Variablen auf 1 abhängige Variable prüfen.
Nun habe ich in meinen Daten zu den unabhängigen Variablen festgestellt, dass einige der unabhängigen Variablen eine starke, teils extreme, Streuung aufweisen (Sehr hoher Variationskoeffizient und auch Grafisch sichtbar). Die starke Streuung der Daten basiert nicht auf Eingabefehlern, sondern kann wahrscheinlich logisch begründet werden (Frage polarisiert stark oder es gibt aus guten Gründen wenige Werte in der Mitte). Eine der Variablen hat bspw. zwei starke Ausprägungen an beiden Enden der Skala.

Nun ist die Frage, wie ich mit diesen Daten am besten umgehe. Schließe ich diese von vornherein aus der Regression aus? Vergleiche ich die Regression mit diesen Daten und ohne diese Daten per Hand oder führe gleich eine Schrittweise Regressionsanalyse statt einer "Einschluss" Analyse durch? Oder sollte ich die Daten mit einem Verfahren (muss ich mir noch durchlesen, was es da so gibt) transformieren?

Vielen Dank im Voraus für eure Hilfe!
Xoha
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 11. Jul 2024, 20:51
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Multiple lineare Regression - Umgang mit starker Streuun

Beitragvon strukturmarionette » Fr 4. Okt 2024, 12:30

Hi,

1 abhängige Variable prüfen.

- ?

- N?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4349
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 584 mal in 581 Posts

Re: Multiple lineare Regression - Umgang mit starker Streuun

Beitragvon bele » Fr 4. Okt 2024, 13:33

Hallo xoha,

herzlich willkommen im Forum. Wenn eine unabhängige Variable zu wenig Variation hat, dann ist das ein großes Problem, weil sie dann auch nur wenig Information tragen kann. Im Umkehrschluss ist viel Streung etwas gutes. Weshalb denkst Du, dass viel Streuung in Deinen Daten ein Problem sein sollte?

Oder ist das eine Variation von "meine Daten sind nicht normalverteilt"?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5894
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1391 mal in 1377 Posts

Re: Multiple lineare Regression - Umgang mit starker Streuun

Beitragvon Xoha » Fr 4. Okt 2024, 15:09

yes, ich meine, dass die Daten nicht wirklich normalverteilt sind.
Die eine Variable ist bspw. eine Angabe von Jahreszahlen. Die Daten zu der Anzahl der Jahre sind einmal bei einer geringen und bei einer hohen Anzahl stark ausgeprägt, dazwischen liegen kaum Fälle. Das arithmetische Mittel liegt dazwischen und die Standardabweichung ist dementsprechend sehr hoch (fast so groß wie das arithmetische Mittel selbst). Um diese beiden Punkte herum verteilt sich jeweils der Rest. Bei den anderen beiden Variablen habe ich eine stark Schiefe Verteilung.

Oder verwechsel ich da allgemein was, und die Normalverteilung der unabhängigen Variablen ist grundsätzlich nicht erforderlich?
Xoha
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 11. Jul 2024, 20:51
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Multiple lineare Regression - Umgang mit starker Streuun

Beitragvon bele » Fr 4. Okt 2024, 16:50

In der Tat, Normalverteilung ist hier unerheblich. Ich habe hier mal einen Literaturbeleg hinterlegt: nutzung-des-forums-f44/gelman-hill-vehtari-normalverteilung-lineare-regression-t13567.html

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5894
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1391 mal in 1377 Posts

folgende User möchten sich bei bele bedanken:
Xoha

Re: Multiple lineare Regression - Umgang mit starker Streuun

Beitragvon Xoha » Fr 4. Okt 2024, 18:37

Vielen Dank! Das hilft mir wirklich sehr weiter :) Dann kann ich jetzt weiter verfahren wie gedacht!
Xoha
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 11. Jul 2024, 20:51
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste