Logistische Regression - Vergleich von Effektgrößen

Alle Verfahren der Regressionanalyse.

Logistische Regression - Vergleich von Effektgrößen

Beitragvon Metropolis » Mi 29. Apr 2015, 15:58

Hallo zusammen, ich bin gerade ein wenig verzweifelt, weil ich in der Literatur widersprüchliche Angaben darüber finde, wie man bei einer binären logistischen Regression die Effektgrößen der einzelnen Regressoren mit einander vergleichen kann.

Wie bereits in einem anderen Thread erläutert, führe ich eine binäre logistische Regression mit der abhängigen Variable "Wahlteilnahme" (0 = Ja, 1 = Nein) durch. Die unabhängigen Variablen sind alle nominal skaliert. Variablen mit mehr als zwei Kategorien werden von SPSS in Dummys transformiert. Die Anzahl der Variablen habe ich im Nachgang des letzten Threads drastisch reduziert, so dass nach der Dummy-Codierung 20 Regressoren in das Modell integriert werden (Enter). Die logistische Regression kommt zu dem Ergebnis, dass insgesamt 11 Variablen signifikant sind.

Wie kann ich jetzt beurteilen, welche signifikanten Variablen die Wahrscheinlichkeit der Nichtwahl am stärksten beeinflussen und welche dagegen nur einen vergleichsweise geringen Einfluss haben? In einer Studie habe ich z.B. gesehen, dass einfach die exp (b) Werte miteinander verglichen wurden. Woanders hab ich gelesen, dass dies aufgrund der Dummy-Codierung nicht möglich sei und stattdessen auf die Wald-Statistik zurückgegriffen werden solle. Nach Kühnel und Krebs ließe sich wiederum der relative Gesamteffekt von zwei erklärenden Variablen vergleichen, indem der Anstieg bei Pseudo-R-Quadrat berechnet wird, der sich ergibt, wenn die jeweils betrachtete Regressor zusätzlich in das Regressionsmodell aufgenommen wird (müssten man dazu die logistische Regression 20 mal durchführen oder gibt es in SPSS ein einfaches Verfahren, um dies zu berechnen?)

Ich hoffe ihr könnt mir mein großes Fragezeichen nehmen. Vielen Dank im Voraus!
Zuletzt geändert von Metropolis am Mi 29. Apr 2015, 17:02, insgesamt 1-mal geändert.
Metropolis
Beobachter
Beobachter
 
Beiträge: 12
Registriert: So 26. Jan 2014, 21:25
Danke gegeben: 7
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression - Vergleich von Effektgrößen

Beitragvon PonderStibbons » Mi 29. Apr 2015, 16:31

Wenn die Prädiktoren markant überlappen, also viele gemeinsame Anteile haben,
ist der Sinn so einer Aktion häufig gering. Konkret welche "signifikanten" Variablen
sind denn im Modell?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Metropolis

Re: Logistische Regression - Vergleich von Effektgrößen

Beitragvon Metropolis » Mi 29. Apr 2015, 17:02

Höchst signifikant (p < 0,001):

Bildung: Niedrig (Referenz Hoch)
Alterskohorte: 19-39 (Referenz Ü60)
Wahlnorm: Schwach (Referenz Stark)
Wahlnorm: Mittel (Referenz Stark)
Bewertung Parteienspektrum: Schlecht (Referenz Gut)
Werden durch eine Partei meine Interessenvertreten: Nein (Referenz Ja)

Hoch signifikant (p < 0,01):

Interesse an Politik: Schwach (Referenz Stark)
Arbeitslosigkeit: Ja (Referenz Nein)
Bildung: Mittel (Referenz Hoch)

Signifikant (p < 0,05):

Geschlecht: Weiblich (Referenz Männlich)
Interesse an Politik: Mittel (Referenz Stark)
Metropolis
Beobachter
Beobachter
 
Beiträge: 12
Registriert: So 26. Jan 2014, 21:25
Danke gegeben: 7
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression - Vergleich von Effektgrößen

Beitragvon PonderStibbons » Mi 29. Apr 2015, 20:30

Demnach hast Du Bildung, Alter (wieso "Kohorte", das ist doch eine intervallskalierte Variable?),
Wahlnorm, Allgemeine Parteienbewertung, Sichvertretenfühlen, Politikinteresse,
Arbeitslosigkeit, Geschlecht als "signifikante" Prädiktoren. Wie gesagt, das überlappt aller
Wahrscheinlichkeit stark miteinander. Koeffizientenvergleich bringt daher nicht viel,
es ginge dabei immer um Koeffizient-der-Variable-in-Gegenwart-aller-anderen-Variablen.
Bei einer so kleinen Stichprobe wie Deiner sind die Standardfehler der Koeffizienten im
Modell auch so groß, dass ich nicht glaube, ein Vergleich hätte praktische Relevanz.
Zumal Du kein theoretisches Modell hast, sondern es auf 28 Paarvergleiche hinaus zu
laufen scheint. Hättest Du ein theoretisches Modell, so könntest Du testen, ob "über die
bekannten Variablen v1, v2 und v3 die Variablen v4 und v5 einen zusätzlichen Beitrag
leisten", und/oder einige Variablen als "Kontrollvariablen" aus dem Vergleich rauslassen.

Just my 2pence

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Metropolis

Re: Logistische Regression - Vergleich von Effektgrößen

Beitragvon Metropolis » Mi 29. Apr 2015, 22:35

Wie ließen sich die Einflussstärken denn vergleichen, wenn die Stichprobengröße ausreichend groß wäre?
Metropolis
Beobachter
Beobachter
 
Beiträge: 12
Registriert: So 26. Jan 2014, 21:25
Danke gegeben: 7
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression - Vergleich von Effektgrößen

Beitragvon PonderStibbons » Do 30. Apr 2015, 09:12

Man müsste erstmal standardisierte Koeffizienten berechnen, um sie überhaupt
vergleichbar zu machen, wobei ich nicht weiß, ob das bei Variablen, die aus
mehreren dummies bestehen, überhaupt sinnvoll möglich ist. Siehe z.B. als
einen Ansatz http://tinyurl.com/kvj2gmx

Modern sind Ansätze unter dem Stichwort "relative importance analysis" bzw.
"dominance analysis". Falls Du R oder SAS benutzt, gibt es dafür auch schon
Prozeduren.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Metropolis

Re: Logistische Regression - Vergleich von Effektgrößen

Beitragvon Metropolis » Mi 6. Mai 2015, 21:06

Noch eine ergänzende Frage: Kann man anhand der unterschiedlichen Signifikanzen ein "Ranking" der Variablen erstellen? Oder muss ich den Einfluss einer signifikanten Variable (p < 0,05) und einer höchst signifikanten Variable (p < 0,001) als gleichwertig betrachten?
Metropolis
Beobachter
Beobachter
 
Beiträge: 12
Registriert: So 26. Jan 2014, 21:25
Danke gegeben: 7
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 11 Gäste