Hallo zusammen!
Ich gehe gerade Uni-Folien zur multiplen linearen Regression durch, und komme nicht drauf, wie man die Regressionskoeffizienten (konkret: Die Steigungen für die jeweiligen Variablen) für multiple Regressionen berechnet. Bei einer einfachen bivariaten Regression ist mir alles klar.
Noch mal der Reihe nach: Wir haben eine Tabelle mit drei Variablen: Eine abhängige Variable Y ("Zufriedenheit"), und zwei unabhängige Variablen X1 ("Einkommen") und X2 ("Gesundheit"). Diese seien in dieser Tabelle abgebildet:
Angenommen wir hätten X2 nicht, und es würde sich um eine bivariate lineare Regression handeln, dann würden wir diese Formel anwenden:
Damit wäre die Steigung der Geraden festgestellt.
Das Resultat für diese bivariate Regression (Zufriedenheit Y + Einkommen X1) würde dann so aussehen:
In den Folien kommt jetzt aber noch die unabhängige Variable X2 hinzu (also Zufriedenheit Y + Einkommen X1 + Gesundheit X2) und hier komme ich nicht weiter. Ich weiß nämlich nicht, wie ich b2 berechnen soll. Ich habe versucht, die gleiche Formel anzuwenden (natürlich alle Daten für X durch alle für X2 ersetzt), bekomme aber nicht das richtige Ergebnis.
Hier zwei weitere Ausschnitte aus den Folien:
Der Prof bekommt also für b2 = 0,0296 und ich bekomme b2 = 0,0356 (mit der obigen Formel für b1 berechnet, zweites Bild im Beitrag). Außerdem haben sich die restlichen Regressionskoeffizienten für b0 und b1 bei ihm ebenfalls verändert.
Hier noch ein Bild der Ebene:
Ich sehe hier auch nicht, wo denn genau z.B. b0 (= 2,66) sein sollte. Wo befindet sich dieser Punkt? Für mich total unklar.
Wie kommt er zu diesen Resultaten für b0, b1 und b2? Was mache ich falsch? Leider schreibt er nirgends, wie er das gemacht hat. Das ist immer wieder ärgerlich bei Lehrenden, aus didaktischer Sicht geht so etwas nicht! Seine Ergebnisse müssen allerdings richtig sein, denn Excel spuckt mir über "Daten" > "Datenanalyse" die gleichen Zahlen heraus.
Würde mich freuen, wenn jemand einen Tipp für mich hat.
Bis dahin, alles Gute!
Lupo