Sehr geehrte Mitleser,
ich versuche gerade Haus Preise über verschieden Variablen zu erklären. Gegeben Variablen sind z.B. "Anzahl der Bäder", "Quadrat-Meter", "Anzahl der Garagen" usw.
Beim rumspielen habe ich eine neue Variable zusammengestellt, "Preis pro Quadratmeter". Konsequenz ist, dass alle Variablen die davor signifikant waren, mit p-values < 0.01, jetzt insignifikant sind, mit p-values > 0.10. Mein Adjusted R-Square ist von 0.83 auf 0.98 gestiegen. Die Kombination dieser Ereignissen hinterlässt bei mir den bitteren Beigeschmack, dass die Variable "Preis pro Quadratmeter" gegen irgendein statistisches Konzept verstößt, das diese nur eine lineare Transformation der zu erklärenden Variable ist. Wäre dies ein Fall von Multikollinearität oder eine andere Statistische Sünde?