Multikollinearität im Multivariaten Regressionsmodel

Alle Verfahren der Regressionanalyse.

Multikollinearität im Multivariaten Regressionsmodel

Beitragvon SirofFinance » Di 2. Jan 2018, 12:51

Sehr geehrte Mitleser,

ich versuche gerade Haus Preise über verschieden Variablen zu erklären. Gegeben Variablen sind z.B. "Anzahl der Bäder", "Quadrat-Meter", "Anzahl der Garagen" usw.

Beim rumspielen habe ich eine neue Variable zusammengestellt, "Preis pro Quadratmeter". Konsequenz ist, dass alle Variablen die davor signifikant waren, mit p-values < 0.01, jetzt insignifikant sind, mit p-values > 0.10. Mein Adjusted R-Square ist von 0.83 auf 0.98 gestiegen. Die Kombination dieser Ereignissen hinterlässt bei mir den bitteren Beigeschmack, dass die Variable "Preis pro Quadratmeter" gegen irgendein statistisches Konzept verstößt, das diese nur eine lineare Transformation der zu erklärenden Variable ist. Wäre dies ein Fall von Multikollinearität oder eine andere Statistische Sünde? :twisted:
SirofFinance
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 2. Jan 2018, 12:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Multikollinearität im Multivariaten Regressionsmodel

Beitragvon strukturmarionette » Di 2. Jan 2018, 12:59

Hi,

- es fehlen u.a. Stichproben- und konkrete Variablenbeschreibungen.

Beim rumspielen habe ich eine neue Variable zusammengestellt,

- hmm?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Multikollinearität im Multivariaten Regressionsmodel

Beitragvon SirofFinance » Di 2. Jan 2018, 13:14

Hallo,
- es fehlen u.a. Stichproben- und konkrete Variablenbeschreibungen.


Alle gegeben Variablen, abgesehen vom Haus-Preis, sind:

1. Quadrat-Meter
2.Anzahl der Bäder
3.Anzahl der Garagen
4.Anzahl der Zimmer
5.Alter des Hauses
6.Größe des Grundstückes

Variablen 3,4 und 5 konnte ich eliminieren, da diese riesige p-values hatten (>0.80). Die übrigen Variablen haben alle sehr kleine P-Values. Zu diesem Moment habe ich dann auch einen adjusted R-Square von 0.83

Ich habe für die die neue Variable "Preis pro Quadratmeter", einfach den "Preis des Hauses" durch die "Quadrat-Meter" geteilt. D.h. ich teile die zu erklärende Variable durch eine erklärende Variable.

Ich arbeite mit einem Sample Size von n=60.

Liebe Grüße.
SirofFinance
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 2. Jan 2018, 12:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Multikollinearität im Multivariaten Regressionsmodel

Beitragvon strukturmarionette » Di 2. Jan 2018, 14:14

Hi,

- Was ist (sind) jetzt Deine konkrete(n) Frage(n)?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Multikollinearität im Multivariaten Regressionsmodel

Beitragvon bele » Di 2. Jan 2018, 18:55

strukturmarionette hat geschrieben:
Beim rumspielen habe ich eine neue Variable zusammengestellt,

- hmm?

Das heißt nicht "rumspielen", das heißt "explorative Datenanalyse" :lol:

Stell Dir mal vor, alle Häuser hätten die gleiche Wohnfläche, die Quadratmeter wären also konstant. Dann würdest Du den Preis vorhersagen aus dem Preis geteilt durch eine Konstante. Das führt zu 100% Varianzaufklärung, macht aber keinen schlauer. Wenn Du nicht irrsinnig viel Varianz in der Wohnfläche hast oder einen sehr guten inhaltlichen Grund, warum Dich diese Berechnung interessiert, dann würde ich es tatsächlich für eine Statistiksünde halten, den Preis auf beiden Seiten der Gleichung, also sowohl bei den Prädiktoren als auch als Zielvariable einzusetzen.

Grundsätzlich geht es aber nicht um die Frage, was eine Sünde ist, sondern um die Frage, wem eine Regression nützt, die den Preis vorhersagt, wenn man sowohl Preis pro Fläche als auch Fläche kennt. Dafür braucht man keine Regressionsrechnung, dafür reicht Rechnen Klasse 5 oder 6 völlig aus.

Hast Du mal einen Interaktionsterm aus Preis pro Fläche und Fläche ins Modell aufgenommen? :lol:

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: Multikollinearität im Multivariaten Regressionsmodel

Beitragvon strukturmarionette » Di 2. Jan 2018, 22:26

Hi,

im Multivariaten Regressionsmodel

- Was ist das Deiner Meinung nach?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron