Nachdem ich hier ja darauf hingewiesen wurde, dass es nicht sinnvoll ist, Beta-Werte von Variablen, die unterschiedlich gemessen wurden, miteinander zu vergleichen [...] weiss ich ehrlich gesagt nicht, wie ich denn sonst eine Aussage darüber machen soll, welche Prädiktoren viel Varianz der aV erklären können.
Wie Ponder in einem anderen thread so treffend formulierte, ist
"Möglichst viel Varianz aufklären" [...] kein wissenschaftliches Ziel
Darüber schreibt auch der bereits zitierte
King. Wenn das wirklich Dein Ziel ist, dann bist Du mit standardisierten Koeffizineten vielleicht gar nicht so schlecht dran.
Besse wäre es wohl, wenn Du uns vielleicht klar sagen könntest welche Frage(n) Du mit Deiner Analyse beantworten möchtest. Vielleicht kannst Du auch Deine Hypothesen darstellen? Unter Umständen ist es dann möglich sinnvollere Hinweise zu geben. Vor dem Hintergrund dessen, was ich von Deiner Situation im Kopf habe, würde ich Dir raten die "Theorien" die Du hast mal auf systematische Zusammenhänge oder auch Kontradiktionen zu prüfen und einen Integrationsversuch zu starten. Auf dieser Basis kannst Du dann theoreigeleitete Hypothesen ableiten und prüfen. Das ist vermutlich eine anspruchsvolle theoretische Arbeit, ohne die Dein Vorhaben aber vermutlich dazu verdammt ist schnell in der sog. "Variablensoziologie" (Esser 1996) zu enden. Meine weiteren Vorschläge sind daher vorerst lediglich als eine Art "Schadensbegrenzung" anzusehen, die Möglichkeiten aufzeigen den bereits eingeschlagenen, meiner Einschätzung nach wenig fruchtbaren, Weg weiterzugehen.
Mein Vorgehen ist jetzt das Folgende: Ich nehme meine Prädiktoren einfach "blockweise" (z.B. erst alle soziodemographischen, dann diverse Variablen nach verschiedenen Theorien) ins Modell auf und betrachte dann die Veränderung von R² (korrigiert). Wenn R² dann stark ansteigt im vergleich zum vorhergehenden Modell, nehme ich an, dass die hinzugefügten Variablen bedeutsam sind. Ist das OK?
Dazu zwei Anmerkungen, eine theoretische, eine methodische. Theoretisch muss gefragt werden: Bedeutsam wofür? Im Hinblick auf was? Wenn z.B. Geschlecht einen Effekt hat, dann ist das für mögliche Interventionsmaßnahmen zunächst bedeutungslos, da Geschlecht nicht manipulierbar ist. Zeigt sich dagegen ein Einfluss von TV Konsum, so kann zumindest nach potentiellen Maßnahmen gesucht werden, diesen zu manipulieren. Die Frage nach der "Bedeutsamkeit" ist demnach zusätzlich unabhängig von Modellanpassung und Effektstärken auch praxisorientiert/theoretisch zu beantworten.
Methodisch würde ich ein volles Modell schätzen. Alle nicht signifikanten Faktoren haben dann offenbar keinen Einfluss mehr auf das outcome, wenn andere Variablen kontrolliert sind. Für die verbleibenden Variablen kannst Du Dir dann inkrementelle Effekte anschauen, indem Du die Veränderung in Maßen der Modellanpassung bei Einbezug einzelner Prädikatoren unter gleichzeitiger Kontrolle aller andren Faktoren betrachtest. Eine weitere Möglichkeit wäre ein Vergleich der minimalen und maximalen Varianzaufklärung durch einzelne Prädikatoren. Dein jetziges vorgehen scheint ungeeignet, da das Varianzaufklärungspotential jedes Prädikators von den bereits im Modell vorhandenen Pärdikatoren abhängt. Damit ist nicht nur die tatsächliche Prognosekraft eines Prädikators relevant sondern die Reihenfolge in der die Prädikatoren ins Modell aufgenommen werden. Das willst Du i.d.R. nicht.
Anzumerken wäre noch, dass der bereits zitierte
King auch versucht klarzustellen, was R-Quadrat ist und wozu es alles nicht taugt.
Wie stellt man so etwas am besten dar? Ich hab es nun als Tabelle dargestellt. In den Zeilen stehen die Variablen und in den Spalten die verschiedenen Modelle. In die Zellen hab ich nun einfach die Signifikanzniveaus mit den üblichen Bezeichnungen (., *, **, ***) eingetragen, aber irgendwie scheint mir das auch nicht besonders sinnvoll zu sein, da ja die Signifikanzen keine Aussagen über die Prädiktoreneffekte zulassen. Was meint ihr?
Gute Erkenntnis.
Esser, H. (1996). What is wrong with "Variable Sociology"? European Sociological Review 12: 159-166.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.