Wahrscheinlichkeitsberechnung für kategorische Variablen

Alle Verfahren der Regressionanalyse.

Wahrscheinlichkeitsberechnung für kategorische Variablen

Beitragvon Reichenbacher » Do 21. Jan 2016, 10:48

EDIT: Hat sich erledigt, es sind keine weiteren Antworten nötig. Danke nochmal an PonderStibbons.




Ein freundliches Hallo an alle, die diesen Eintrag lesen.

All jenen, die gleich denken, Moment, diese Frage kenne ich doch bereits, sei gesagt: Ihr liegt vermutlich richtig. Wie von PonderStibbons angeregt, habe ich auf Grundlage meines ursprünglichen Posts http://www.statistik-forum.de/regressionanalyse-f11/wahrscheinlichkeit-eines-wertes-einer-dichotomen-variable-t6061.html ein neues Thema eröffnet und meine Angaben ergänzt.

Es geht um eine allgemeine Frage zur Wahrscheinlichkeitsberechnung bei binärer logistischer Regression. Die Stichprobengröße beträgt, je nach Modell, zwischen 700 und 3000 Fällen, die verwendete Software ist SPSS.

Ich untersuche, inwiefern eine spezifische Wahlentscheidung bei politischen Wahlen mit verschiedenen unabhängigen Variablen korreliert ist. Neben zwei intervallskalierten Variablen befinden sich darunter auch ein paar ordinale Variablen, die ich entsprechend als kategorisch implementiert habe. Die Regressionsanalyse an sich hat mir keine Probleme bereitet, jedoch bin ich mir unsicher, ob und wie ich für die Fälle, die lediglich eine der kategorischen Ausprägungen erfüllen, die Eintrittswahrscheinlichkeit der zu erklärenden Wahlentscheidung berechnen kann. Für die metrischen Variablen habe ich bereits die separaten Eintrittswahrscheinlichkeiten also bei Konstanthaltung der anderen Variablen für die Minimal- und Maximalwerte berechnet.

Geht das auch mit den kategorischen Variablen? ich bin hier unsicher, weil diese ja keine Werte enthält, sondern sich die Koeffizienten auf die jeweilige Referenzkategorie beziehen.
Bislang habe ich für jede Kategorie den Wert 1 gesetzt und mit dem jeweiligen B-Koeffizienten multipliziert. Ist das korrekt? Und bedeutet dies, dass der Koeffizient für die Referenzkategorie gleich 0 ist, die Eintrittswahrscheinlichkeit also für diese Ausprägung (bei Konstanthaltung der anderen Variablen) gleich der Wahrscheinlichkeit der Konstanten ist? Oder ist die Referenzkategorie unabhängig von der Konstanten?

Zur Veranschaulichung hier ein Screenshot https://imgur.com/C5u265J der B-Koeffizienten und der Odds ratios meiner unabhängigen Variable. Ich habe die gleiche Analyse für drei verschiedene Fallgruppen durchgeführt. Die kategorischen Variablen heißen "Approval UK" und Approval EU".

Für eine Antwort in den nächsten Tagen wäre ich überaus dankbar!

Freundliche Grüße,
Reichenbacher
Zuletzt geändert von Reichenbacher am Fr 22. Jan 2016, 21:27, insgesamt 1-mal geändert.
Reichenbacher
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 21. Jan 2016, 09:00
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Wahrscheinlichkeitsberechnung für kategorische Variablen

Beitragvon PonderStibbons » Do 21. Jan 2016, 15:06

Ich weiß nicht, ob ich Deine Frage richtig verstanden habe, aber
vielleicht schaust Du Dir die verschiedenen Möglichkeiten in SPSS
einmal an, wie die Kontraste bei kategorialen Variablen in SPSS
codiert werden können http://www-01.ibm.com/support/knowledge ... eg_cat.htm

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11365
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Reichenbacher

Re: Wahrscheinlichkeitsberechnung für kategorische Variablen

Beitragvon Reichenbacher » Do 21. Jan 2016, 20:53

EDIT: Hat sich erledigt, es sind keine weiteren Antworten nötig. Danke nochmal an PonderStibbons.



Danke für den Hinweis. Ich habe mir die verschiedenen Möglichkeiten angeschaut und bin zu dem Schluss gekommen, dass als Kontrast die voreingestellte Indikator-Variante am meisten Sinn macht.

Zur Klarstellung: Es geht mir nicht nur um die Berechnung der Eintrittswahrscheinlichkeit des untersuchten Ereignisses für das Gesamtmodell, sondern auch um die Wahrscheinlichkeit, die sich z.B. für einen Fall ergibt, der nur in einer der kategorischen Variablen eine Ausprägung aufweist, während alle anderen Variablen quasi nicht zutreffen oder, für die intervallskalierten, den Minimalwert aufweisen, sodass alle anderen Variablen in der Regressionsfunktion und somit auch im Logit-Wert nicht mehr enthalten sind.

Allgemein formuliert möchte ich gerne wissen, wie die Referenzkategorie im Gesamtmodell zu interpretieren ist. Diese wird ja in der Kovariatenmatrix als Null-Zeile angezeigt. Hat diese dann auch den B-Koeffizienten Null? Falls ja, würde ich als Laie davon ausgehen, dass die Eintrittswahrscheinlichkeit von der Referenzkategorie nicht beeinflusst wird, bei Wegfall aller anderen Variablen also gleich der konstanten Wahrscheinlichkeit des Modells ist. Fasse ich das richtig auf? Oder ergibt eine separate Berechnung des Einflusses von kategorischen Kovariaten auf die Eintrittswahrscheinlichkeit keinen Sinn?

Ich hoffe, dass ich die Fragestellung verdeutlichen konnte.

Die Berechnung der Eintrittswahrscheinlichkeit nehme ich manuell anhand der Formel (e^logit /(1+e^logit)) vor.

Für eine klärende Antwort wäre ich sehr dankbar.

Freundliche Grüße,
Reichenbacher
Reichenbacher
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 21. Jan 2016, 09:00
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste

cron