Lineares Modell erstellen mit nicht normal verteilten Daten?

Alle Verfahren der Regressionanalyse.

Re: Lineares Modell erstellen mit nicht normal verteilten Da

Beitragvon brus22 » So 27. Feb 2022, 00:49

2. Zwei gute Antworten verstecken sich hier: https://corporatefinanceinstitute.com/r ... actor-vif/


Danke für die Antworten. Die Inhalte in dem Link habe ich drei mal durchgelesen.

In dem Link steht u.a, dass wenn der VIF-Wert höher als 10 oder die Toleranz niedriger als 0,1 ist, eine signifikante Multikollinearität vorliegt, die korrigiert werden muss.

Die erste beschriebene Methode habe ich bereits ausprobiert, ohne Erfolg. Ergebnis: Die Variable Brand hat immernoch einen ViF-Wert über 200, weist demnach Multikollinearität auf, die laut der Quelle „korrigiert werden muss“.

Die zweite Methode beschreibt: „In PCA werden neue unkorrelierte Variablen erstellt“

Die zweite Methode sagt aus, dass mit PCA neue unkorrelierte Variablen erstellt werden. Bedeutet das, dass die Variablen die ich für das lm() verwendet habe allesamt verworfen werden, nur um neue Variablen zu finden, bei der die Variable Brand keine Multikollinearität aufweist??

Das würde bedeuten, dass alle bisherigen Analysen verworfen werden, nur damit in PCA neue Variablen erstellt werden die mit Brand nicht korrelieren.
brus22
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Mi 23. Feb 2022, 11:23
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Lineares Modell erstellen mit nicht normal verteilten Da

Beitragvon bele » So 27. Feb 2022, 20:34

Hallo Brus,

die zwei Antworten, die ich gefunden hatte, waren

With multicollinearity, the regression coefficients are still consistent but are no longer reliable since the standard errors are inflated. It means that the model’s predictive power is not reduced


Was ich ja auch schon geschrieben hatte: Wenn es Dir nur um gute Vorhersage geht stört die Multikollinearität nicht. Deshalb bleibt brand im Modell.

und das andere, was mir auch nicht bewusst war:

However, there are also situations where high VFIs can be safely ignored without suffering from multicollinearity. The following are three such situations:
[...]
3. When a dummy variable that represents more than two categories has a high VIF, multicollinearity does not necessarily exist. The variables will always have high VIFs if there is a small portion of cases in the category, regardless of whether the categorical variables are correlated to other variables.


Dieser Teil drei dürfte auf Deine Aston Martins zutreffen. Noch ein Grund, brand nicht einfach aufgrund eines hohen VIF aus dem Modell zu schmeißen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Lineares Modell erstellen mit nicht normal verteilten Da

Beitragvon brus22 » So 27. Feb 2022, 21:57

Hi bele,

herzlichen Dank für alles! :)
brus22
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Mi 23. Feb 2022, 11:23
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Vorherige

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 8 Gäste