Hallo Toevre,
Toevre hat geschrieben:Es freut mich sehr, dass du dafür sofort eine "Lösung" parat hast. Dazu stellen sich mir nun zwei Fragen:
1. Würdest du in der zu untersuchenden Tatsache eine logistische Regression empfehlen oder fällt dir zufällig ein anderer Weg ein um eine klassische multivariate
Regression durchführen zu können? (Mir fällt spontan leider keine andere Möglichkeit ein)
Es gibt meistens mehrere Wege, wie man sich einem Problem nähern kann. In diesem Fall (Regression mit mehreren unabhängigen und einer dichotomen abhängigen) ist die logistische Regression aber das Standardverfahren und wer was anderes machen will, muss das begründen. Das Prinzip der logistischen Regression hast Du nach drei Youtube-Videos darüber verstanden und dann brauchst Du nur noch ein Computerprogramm.
2. Ist das Ergebnis der logistischen Regression ähnlich interpretierbar bzw. bietet es ein ähnlich hochwertiges Ergebnis für eine Empirische Analyse?
So hochwertig wie eine nicht passende Regressionsform, die anstelle von Ja/Nein Werte von Minus-unendlich bis plus-unendlich produziert?
Die logistische Regression ist anders zu interpretieren als eine kleinste-Quadrate-Regression. Beispielsweise gibt es das klassische R² nicht. Das muss man sich halt anlesen.
Wie es mir scheint (bitte korregiere mich falls ich falsch liege), ist das Ergebnis einer logistischen Regression als Wahrscheinlichkeit zu interpretieren,
während eine "normale" Regression die tatsächliche Änderung der abhängigen Variable durch die unabhängigen Variablen im Vergleich zum Mittelwert angibt.
Die logistische Regression gibt Dir für jede Konstellation von unabhängigen Variablen eine Wahrscheinlichkeit aus, dass die Weiterbildungsentscheidung "Ja" lautet. Was gibt Dir denn die kleinste-Quadrate Regression aus? "Wird Annika sich für eine Weiterbildung entscheiden?" Antwort: "2,3" -- ich kann Dir versichern, dass 2,3 keinesfalls die tatsächliche Änderung der Weiterbildungsentscheidung ist.
Wäre es hierbei einfacher die Regression sowohl mit männlichen als auch mit weiblichen Personen durchzuführen und im Nachhinein die unterschiedlichen Ergebnisse zu vergleichen oder kann man dadurch noch keine direkten Rückschlüsse auf den Einfluss des Geschlechts auf die Entscheidung sich weiterzubilden ziehen?
Nehmen wir an, Du hast "Wohneigentum" als Prädiktor im Modell und vermutest, dass Wohneigentum beim Männern und Frauen einen ähnlichen Effekt hat. Dann kann Dein Modell den Einfluss von Wohneigentum im einen Fall aus allen vorhandenen Datensätzen lernen und im anderen Fall nur aus den Männer- bzw nur aus den Frauendatensätzen. Wenn Du vielleicht nur wenige Frauen mit Weiterbildungsentscheidung hast, wäre es blöd, nur aus den wenigen Frauen den Effekt von Wohneigentum zu schätzen, obwohl der doch geschlechtsunspezifisch sein soll. Das ist für mich der wichtigere Punkt, alles in ein Modell zu packen. Daneben hast Du Recht: In einem gemeinsamen Modell ist die Beurteilung der Signifikanz von Geschlechtsunterschieden sehr viel einfacher.
Ich habe selber versucht diese Regression schriftlich durch zu rechnen
Vielleicht ist das der Grund, warum Du eine "einfache" Regression rechnen willst? Rechne die Regressionen lieber mit einem Computer und investier Deine geistige Kraft in das Verstehen und verständnisvolle interpretieren von Interaktionstermen und logistischen Regressionen!
LG,
Bernhard