Probleme mit Klassifizierungstabelle

Alle Verfahren der Regressionanalyse.

Probleme mit Klassifizierungstabelle

Beitragvon Deterakete » So 31. Jul 2022, 14:39

Hallo liebes Forum!

Ich bin leider sehr unerfahren in Statistik und habe mich etwas überhoben. Ich analysiere ein Datenset zur Bundestagswahl 2021. Ich möchte prüfen, ob die Koalitionspräferenz einen Einfluss auf die Wahlabsicht hat. (z.B. Wählende, die Schwarz-Gelb unterstützen wählen wahrscheinlicher FDP/CDU). n ~ 2800, je nach Partei. Mit SPSS schätze ich dann eine logistische Regression.

Hier gibt mir SPSS dann aus, in wiefern die Schätzung mit den beobachteten Werten übereinstimmt.

Bild

Wie hier zu sehen schätzt SPSS zwar alle Stimmen, die nicht für die Linke abgegeben wurden (0), aber auch alle Stimmen für die Linken (1) werden falsch geschätzt. Am Ende liegt es dann 94,3% richtig, aber halt auch nur weil so wenig Menschen für die Linke gestimmt haben.

Wie kann ich das nun interpretieren? Ist das Regressionsmodell nutzlos, bzw. heißt das, dass der Effekt zu klein ist, um richtig geschätzt zu werden?

Über jede Hilfe wäre ich sehr dankbar!

LG
Dete
Deterakete
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: So 31. Jul 2022, 11:59
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Probleme mit Klassifizierungstabelle

Beitragvon bele » So 31. Jul 2022, 16:31

Naja die Linke hat halt kaum einer gewählt, ohne die Direktmandate wären die an der 5%-Grenze gescheitert. Vielleicht war es immer die wahrscheinlichere Option, dass jemand die nicht wählt. Auch wenn es ein paar Wähler gab, trennen die Prädiktoren halt nicht. Von welchem Prädiktor hast Du denn angenommen, dass er Linkenwähler prognostiziert und wie hoch war da der Koeffizient?

LG, Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5906
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1395 mal in 1381 Posts

Re: Probleme mit Klassifizierungstabelle

Beitragvon Deterakete » So 31. Jul 2022, 17:22

Also der Prädiktor ist die Koalitionsbewertung (in diesem Fall Rot-Rot-Grün). Meine Annahme ist: Menschen, die Rot-Rot-Grün mögen, wählen wahrscheinlicher die Linke. Bei anderen Parteien analog (Menschen finden Jamaika, Schwarz-Gelb, Schwarz-Grün gut und wählen eher Union). In diesem Fall war b= 0,346. Wenn ich das richtig verstanden habe sagt mir b aber auch nicht viel mehr, als ob es einen positiven oder einen negativen Effekt hat?

Wenn ich eine ROC-Analyse mache, dann habe ich da einen akzeptablen AUC-Wert (0,798).
Deterakete
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: So 31. Jul 2022, 11:59
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Probleme mit Klassifizierungstabelle

Beitragvon bele » Mo 8. Aug 2022, 18:02

Ich versuch mich doch nochmal, was zu erklären.

Deterakete hat geschrieben: In diesem Fall war b= 0,346. Wenn ich das richtig verstanden habe sagt mir b aber auch nicht viel mehr, als ob es einen positiven oder einen negativen Effekt hat?


Das beschreibt ein tiefes Unverständnis für die logistische Regression. Dieses b ist Teil des linearen Modells in der logistischen Regression und mit Kenntnis der anderen Koeffizienten, vor allem des Intercepts, lässt sich damit eine konkrete Wahrscheinlichkeit berechnen. Nehmen wir an, der Intercept für "wählt Linke" in einer gegebenen Population ist -0,5 und wenn man für eine rot-rot-grüne Koalition ist, dann kommen da 0,346 drauf, also zusammen dann -0,154.

Die Wahrscheinlichkeit, Die Linke zu wählen ist im einen Fall .
Im anderen Fall ist sie .
Na gut, da habe ich meinen Intercept wohl zu hoch angenommen, aber das Prinzip bleibt: Die Wahrscheinlichkeit ist klar gestiegen, aber sie überschreitet halt 50% nicht und deshalb erscheinen in der Konfusionsmatrix ausschließlich Fälle, in denen "Linke wählen" nicht prognostiziert wird.

Ich hoffe, das macht klar, dass die Kenntnis des Koeffizienten viel wertvoller ist als nur um zu schauen, wie das Vorzeichen ist. Zum anderen, dass so eine Entscheidungsmatrix nicht unbedingt ein guter Weg ist, eine logistische Regression zu beurteilen. Sich die Vorhersagen auf Wahrscheinlichkeitsebene anzeigen zu lassen wäre wahrscheinlich wertvoller. Sollte das in SPSS nicht mit einem Mausklick zu machen sein, dann hilft es, sich die Formeln beispielsweise auf Wikipedia anzuschauen und ggf. selbst zu rechnen: https://de.wikipedia.org/wiki/Logistisc ... zifikation

HTH,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5906
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1395 mal in 1381 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 14 Gäste

cron