Hallo Lupo,
Lupo123 hat geschrieben:Das heißt, Prognosen mit einer Regression sind auch mit einer Variable, die nur einen geringen Anteil der abhängigen Variable erklärt, zulässig?
Was ein geringer und was ein großer Anteil der erklärten Varianz ist hängt immer von Thema, Fragestellung, Messmethoden etc. ab. Ein Prozent Varianzaufklärung kann nobelpreisverdächtig sein, 99% Varianzaufklärung können zum Gähnen sein.
Stell Dir vor, Du hättest 1915 , dem Jahr nachdem die Spezielle Relativitätstheorie publiziert wurde, mit "nur" 1% Varianzaufklärung aber hoher Sicherheit zeigen können, dass eine Uhr in der nähe einer großen Masse langsamer läuft als entfernt von allen Massen. Die Einstein-Lupo-Theorie wäre mindestens dem Namen nach jedem bekannt. Wenn Du nun aber aus dem Datum die Jahreszeit vorhersagen könntest, würde das mutmaßlich keinen interessieren. Schon gar nicht bei "nur" 93% Varianzaufklärung.
bele hat geschrieben:Ich würde jetzt erstmal eine Punktwolke plotten (Streudiagramm) und schauen, ob die Punkte auf einer Linie liegen, durch die mal plausibel eine Funktion legen kann oder ob das wirklich eine "Wolke" ist, die durch eine Linie nur schlecht zu beschreiben ist.
Das habe ich in der Tat schon letzte Woche gemacht, wobei das hier rausgekommen war:
[...]
Ich möchte das aber für meine Gemeinde berechnen, und da sind in diesen letzten Jahren nunmal nur diese 19 Baugrundstücke verkauft worden.
Denkt ihr also, ich kann ohne Zweifel die Regression zur Prognose heranziehen?
Statistik ist dazu da, mit natürlich verbleibenden Zweifeln rational umzugehen. Wenn man etwas "ohne Zweifel" annehmen kann, braucht man keine Statistik. Es sind aber nicht die 24% Varianzaufklärung an denen ich zweifeln würde. Da hat jemand 2017 fast 600€/qm bekommen, alle anderen aber nur maximal 400€/qm. Dieser eine Fall hat mutmaßlich erheblichen Einfluss auf die Steigung Deiner Geraden. Versuch herauszufinden, wer das war und was das für ein Grundstück war. War es ein Grundstück mit Seeblick? Oder hat das der Sohn des Bürgermeisters an die Gemeinde verkauft? Wenn ja, gibt es nur das eine Grundstück mit Seeblick oder werden in der Zukunft noch weitere Grundstücke mit Seeblick verkauft werden? Warum hat im Juli 2018 ein Grundstück für nur 200€/qm den Besitzer gewechselt? Hat das die Gemeinde an den Sohn des Bürgermeisters verkauft oder hat sich da eine riesige landwirtschaftliche Nutzfläche in die Baugrundstücksliste eingeschlichen, weil man auf den Acker einen Schuppen ohne Anschluss an die Wasserversorgung stellen darf?
Mindestens für diese beiden Extremfälle, vielleicht auch noch für den im März 2017 und den im Februar 2020 solltest Du
erstens Recherchen anstellen, ob das begründete Einzelfälle waren, die in die Prognose nicht hinein gehören und
zweitens die Regression nochmal ohne sie rechnen und schauen, ob die Regressionsgerade erheblich abweicht.
Wenn man nur 19 Beobachtungen hat und die Punkte, so wie bei Dir, leidlich auf einer Geraden liegen, ist lineare Regression eine insgesamt vernünftige Entscheidung. Es muss Dir nur klar sein, dass die Wahrheit nicht linear ist und dass Du nicht von den Jahren 2017 bis 2020 Vorhersagen machen kannst, was Dein Grundstück in 20 Jahren Wert sein wird.
LG,
Bernhard