Logistische Regression: Wechsel d. Referenzkategorie?

Alle Verfahren der Regressionanalyse.

Logistische Regression: Wechsel d. Referenzkategorie?

Beitragvon milisha » Fr 23. Okt 2015, 13:27

Hallo zusammen, ich hoffe jemand hat eine Erklärung für den vorliegenden Sachverhalt.
Ich habe eine binäre logistische Regression gerechnet (mit SPSS, falls relevant), insgesamt 7 Modelle. Für die gewählten Referenzkategorien werden dabei keine b-Koeffizienten ausgegeben, da ich aber für meine Hypothesen teilweise Ergebnisse für alle Ausprägungen einer Variablen brauche, habe ich das Ganze nochmals mit veränderten Referenzkategorien gerechnet (ich habe dabei jeweils entweder die erste oder letzte Ausprägung als Referenz gesetzt, Kategorien wie "Sonstiges" kommen nicht vor).
Das Problem (falls es denn eines ist): für eine der Variablen werden bei Wechsel der Referenzkategorie plötzlich Ausprägungen signifikant, die es vorher nicht waren. Die Einflussrichtung passt immerhin, dennoch macht es für meine Hypothesen einen Unterschied, ob die einzelnen Ausprägungen bedeutungslos oder signifikant sind.

Hat jemand von euch eine Erklärung dafür?

Schon einmal vielen Dank vorab!
milisha
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 23. Okt 2015, 12:28
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression: Wechsel d. Referenzkategorie?

Beitragvon Leviathan » Fr 23. Okt 2015, 15:45

Hallo Milisha!

Für die Referenzkategorie an sich brauchst Du ja keine Koeffizienten; sie ist ja gleich 1 und dient dem Wertvergleich mit den Ergebnissen in den anderen Kategorien. Des Weiteren bringt Dir der b-Koeffizient eher weniger, so dass Du den Effektkoeffizienten Exp(B) zur Interpretation Deiner Ergebnisse verwenden solltest!

Deine unterschiedlichen Ergebnisse und Signifikanzniveaus sind eigentlich völlig normal. Nimm' einfach das beste Ergebnis oder das am besten für Dich geeignete! Im Übrigen kannst Du mit der Syntax die Referenzkategorie einer unabhängigen Variablen beliebig auswählen und musst nicht immer die erste oder letzte Kategorie nehmen. Und letztendlich ist die Syntax auch nicht viel schwieriger anzuwenden.

Hier ein Bsp.:

LOGISTIC REGRESSION schulab
/METHOD= fstep(cond) geschw alter_gr vaterab mutterab geschl ethgr religion konsistenz
/contrast (alter_gr)=Indicator(1)/CONTRAST (vaterab)=Indicator(1) /CONTRAST
(mutterab)=Indicator(1) /CONTRAST (ethgr)=Indicator(1) /contrast (religion)=
indicator(1) /contrast (konsistenz)=indicator(1)
/CLASSPLOT /CASEWISE OUTLIER(2)
/PRINT = summary CI(95)
/CRITERIA = PIN(.05) POUT(.10) ITERATE(20) CUT(.26).

Quelle: https://www.uni-bamberg.de/fileadmin/un ... g-BBES.pdf (Seite 16)

Mit den Unterbefehlen contrast und indicator legst Du die auszuwählende kategoriale Variable sowie ihre Referenzkateorie fest. Beachte, dass dieser Wert nicht immer der im Datansatz gemachten Beschriftung entspricht. Also, wenn die erste Kategorie mit 0 beschriftet ist, dann ist das die Referenzkategorie 1!

Hoffe, ich konnte helfen! ;-)
Leviathan
Power-User
Power-User
 
Beiträge: 66
Registriert: Mo 14. Apr 2014, 02:42
Danke gegeben: 9
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression: Wechsel d. Referenzkategorie?

Beitragvon milisha » Fr 23. Okt 2015, 17:14

Hallo Leviathan, vielen Dank schonmal für deine Antwort :)

Was die Effektkoeffizienten angeht, sind diese für meine Analyse überflüssig, weil es mir reicht, Aussagen über Einflussrichtungen treffen zu können. Ich halte mich hier ehrlich gesagt lieber strikt an die Veröffentlichungen meiner Professorin, sie verwendet nie den Effektkoeffizienten. Ich denke, es wird nicht schaden wenn sie ein gewohntes Bild in der Arbeit vorfindet ;)
Als Referenzkategorien jeweils die erste oder letzte Kategorie zu setzen, war für meine Zwecke sinnvoll, ich kenne aber die Möglichkeit das über die Syntax in jede beliebige Kategorie zu ändern.

Um die Problematik einmal konkret zu benennen: ich habe im Modell das Haushaltseinkommen, eingeteilt in "sehr niedrig", "niedrig", "mittel", "hoch" (metrisch gings leider nicht, weil ich es gruppiert vorliegen habe). Setze ich "sehr niedrig" als Referenz, wird ein hohes Einkommen hoch signifikant (negativ), "niedrig" und "mittel" haben keinen Einfluss.
Setze ich "hoch" als Referenz, werden alle drei Kategorien signifikant (positiv), d.h. auch "niedrig" und "mittel" haben plötzlich einen Einfluss.
Um meine Hypothese in Bezug auf das Einkommen eindeutig bestätigen oder verwerfen zu können, brauche ich die Ergebnisse für alle vier Ausprägungen des Einkommens. Und da wäre es schon gut, wenn sie übereinstimmen würden :lol:

Ich bin gerade relativ ratlos, was ich damit anstellen soll. Die quick&dirty Version wäre, meine Hypothese umzuformulieren... ;)
milisha
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 23. Okt 2015, 12:28
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression: Wechsel d. Referenzkategorie?

Beitragvon PonderStibbons » Fr 23. Okt 2015, 18:03

Es gibt doch immer einen Test für die kategoriale Variable als Ganzes, warum nimmst Du den nicht?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Logistische Regression: Wechsel d. Referenzkategorie?

Beitragvon milisha » Fr 23. Okt 2015, 18:21

Was meinst du mit Test? Wo muss ich in SPSS ein Knöpfchen drücken? :D
Oder meinst du das Signifikanzniveau, das im SPSS Output auch hinter der ganzen Variablen steht? Falls ja, würde mir das auch nicht weiterhelfen, weil ich eine Hypothese formuliert habe, die explizit Einflussrichtungen der verschiedenen Einkommenshöhen beschreibt. Daher muss ich auch zu allen Einkommenskategorien eine Aussage treffen.

Wie gesagt, mich irritiert einfach, weshalb mehrere Kategorien bei Wechsel der Referenz plötzlich signifikant werden. Die Einflussrichtung stimmt zumindest, aber entweder etwas ist signifikant oder halt nicht :?:
milisha
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 23. Okt 2015, 12:28
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression: Wechsel d. Referenzkategorie?

Beitragvon Leviathan » Fr 23. Okt 2015, 18:25

milisha hat geschrieben:Hallo Leviathan, vielen Dank schonmal für deine Antwort :)

Was die Effektkoeffizienten angeht, sind diese für meine Analyse überflüssig, weil es mir reicht, Aussagen über Einflussrichtungen treffen zu können. Ich halte mich hier ehrlich gesagt lieber strikt an die Veröffentlichungen meiner Professorin, sie verwendet nie den Effektkoeffizienten. Ich denke, es wird nicht schaden wenn sie ein gewohntes Bild in der Arbeit vorfindet ;)
Als Referenzkategorien jeweils die erste oder letzte Kategorie zu setzen, war für meine Zwecke sinnvoll, ich kenne aber die Möglichkeit das über die Syntax in jede beliebige Kategorie zu ändern.

Um die Problematik einmal konkret zu benennen: ich habe im Modell das Haushaltseinkommen, eingeteilt in "sehr niedrig", "niedrig", "mittel", "hoch" (metrisch gings leider nicht, weil ich es gruppiert vorliegen habe). Setze ich "sehr niedrig" als Referenz, wird ein hohes Einkommen hoch signifikant (negativ), "niedrig" und "mittel" haben keinen Einfluss.
Setze ich "hoch" als Referenz, werden alle drei Kategorien signifikant (positiv), d.h. auch "niedrig" und "mittel" haben plötzlich einen Einfluss.
Um meine Hypothese in Bezug auf das Einkommen eindeutig bestätigen oder verwerfen zu können, brauche ich die Ergebnisse für alle vier Ausprägungen des Einkommens. Und da wäre es schon gut, wenn sie übereinstimmen würden :lol:

Ich bin gerade relativ ratlos, was ich damit anstellen soll. Die quick&dirty Version wäre, meine Hypothese umzuformulieren... ;)


Wie gesagt, nimm' doch einfach die besten (signifikanten) Ergebnisse!
Aber im Bezug auf die Koeffizienten-Wahl bringt Dir glaube ich das B nicht viel. Mit dem Exp(B) kannst Du jedenfalls Deine Hypothese beibehalten und die Einkommenskategorien in Relation zueinander setzen.

Wenn zum Beispiel gemessen werden soll, mit welchem Bildungsgrad Männer umziehen (Umzug nein/ Umzug ja), dann setzt Du z.B. in der niedrgisten Bildungsgruppe die Referenzkategrie. Ergebnisse könnten dann für Exp(B) sein: Mittel = 1,24, hoch = 3,45. Das heißt, Männer mit mittlerem Bildungsgrad haben eine um 24% höhere Eintrittswahrscheinlichkeit zum Umzug und Männer mit hohem eine um 245% höhere.

Vielleicht verdeutlicht das ja den Sinn und die Funktionsweise von Exp(B).....
Leviathan
Power-User
Power-User
 
Beiträge: 66
Registriert: Mo 14. Apr 2014, 02:42
Danke gegeben: 9
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression: Wechsel d. Referenzkategorie?

Beitragvon PonderStibbons » Fr 23. Okt 2015, 19:37

Falls ja, würde mir das auch nicht weiterhelfen, weil ich eine Hypothese formuliert habe, die explizit Einflussrichtungen der verschiedenen Einkommenshöhen beschreibt.

Vielleicht schreibst you deine Hypothese(n) jetzt einfach mal hin.
Wie gesagt, mich irritiert einfach, weshalb mehrere Kategorien bei Wechsel der Referenz plötzlich signifikant werden.

Wenn ich Gruppe a mit Referenzgruppe b vergleiche, kann der Unterschied inferenzstatistisch signifikant sein, wenn ich aber a mit Einer anderen ReferenzgruppeReferenzgruppe c vergleiche, dann vielleicht wieder nicht. Ich verstehe leider nicht, wieso der Vergleich a mit c dasselbe Ergebnis haben muss wie der Vergleich a mit b.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Logistische Regression: Wechsel d. Referenzkategorie?

Beitragvon milisha » Sa 24. Okt 2015, 08:14

PonderStibbons hat geschrieben:Vielleicht schreibst you deine Hypothese(n) jetzt einfach mal hin.

Falls es zur Aufklärung beiträgt...Die Hypothese lautet, dass eine bestimmte staatliche Transferleistung von einkommensschwachen Familien stärker in Anspruch genommen wird als von Familien mit mittleren oder hohen Einkommen.
So. In Fall 1 (Ref. ist 'sehr niedrig') wird ein hohes Einkommen signifikant mit negativem Vorzeichen, niedrige und mittlere Einkommen sind nicht signifikant. D.h. ein hohes Einkommen senkt die Wahrscheinlichkeit einer Inanspruchnahme zwar, aber damit ist die Hypothese noch nicht bestätigt. Streng genommen wäre sie sogar zu verwerfen, da niedrige und mittlere Einkommen ja gerade nicht signifikant sind.
In Fall 2 (Ref, ist 'hoch'), werden sehr niedrige, niedrige und mittlere Einkommen signikifant (positiv), was die Hypothese bestätigen würde (aber ohne das Vorzeichenverhältnis auch hier streng genommen noch nichts im Vergleich zu hohen Einkommen aussagt).

Vielleicht habe ich gerade einen Denkfehler oder sehe die Sache zu eng, aber ich kann mir hier nicht aussuchen was mir besser passt, weil es zu verschiedenen Ergebnissen führt :?:
Die Effektkoeffizienten habe ich mir natürlich angeschaut, im Grunde sind die Ergebnisse in beiden Versionen auch eindeutig und bestätigen die Hypothese. Da ich aber die Effektkoeffizienten nicht reporten werde, kann ich damit nicht argumentieren (ich möchte mich hier wirklich an die Vorlagen aus den Veröffentlichungen der Prof halten und nicht querschießen, die vollständigen Outputs kommen nur in den Anhang).
milisha
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 23. Okt 2015, 12:28
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression: Wechsel d. Referenzkategorie?

Beitragvon PonderStibbons » Sa 24. Okt 2015, 09:51

Falls es zur Aufklärung beiträgt..

Ja sicher. Das ist es doch, worum es sich hier dreht.
In Fall 2 (Ref, ist 'hoch'), werden sehr niedrige, niedrige und mittlere Einkommen signikifant (positiv), was die Hypothese bestätigen würde (aber ohne das Vorzeichenverhältnis auch hier streng genommen noch nichts im Vergleich zu hohen Einkommen aussagt).

Die zweite Rechnung betrifft deine Hypothese nicht, weil es Vergleiche mit der höchsten Einkommensgruppe durchführt, nicht der niedrigsten. Die Ergebnisse sind aber stimmig, weil natürlich die Differenz der sehr niedrigen Einkommen und der sehr hohen weiter signifikant ist.
Vielleicht habe ich gerade einen Denkfehler oder sehe die Sache zu eng, aber ich kann mir hier nicht aussuchen was mir besser passt, weil es zu verschiedenen Ergebnissen führt :?:

Rechnung 1 entspricht deiner Hypothese und verwirft sie.

Die Effektkoeffizienten habe ich mir natürlich angeschaut, im Grunde sind die Ergebnisse in beiden Versionen auch eindeutig und bestätigen die Hypothese.

Was die Koeffizienten bedeuten, ist ohne Angabe derselben sowie vor allem auch der Stichprobengrößen und der tatsächlichen p-Werte allerdings von hier aus zu beurteilen. Der Augenschein jedenfalls reicht nicht, deswegen macht man ja diese ganze Signifikanztesterei. Und dessen Ergebnis Gestattet nicht die Hypothese zu verwerfen, dass der Unterschied (in der Grundgesamtheit) zwischen sehr niedrigen und mittleren Einkommen gleich Null ist. Alles im Lot.

Mit freundlichen Grüßen
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Logistische Regression: Wechsel d. Referenzkategorie?

Beitragvon milisha » Sa 24. Okt 2015, 16:52

Ich danke dir vielmals, ich glaube, jetzt habe ich es halbwegs verstanden.
Ich habe die Hypothese nun umformuliert, da die Ergebnisse dem Grundgedanken der Hypothese entsprechen (je höher das Einkommen, desto niedriger die Inanspruchnahme...aber je-desto funktioniert bei der binär logistischen Regression ja nicht). Daher wäre es doof sie aufgrund einer Ungenauigkeit/Dummheit bei der Formulierung verwerfen zu müssen.

Die Stichprobengröße liegt übrigens je nach Modell bei ca. 500 und p=0,05 oder kleiner. Irrtumswahrscheinlichkeiten > 5% betrachte ich als nicht signifikant.

Vielen Dank für eure Zeit :)
milisha
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 23. Okt 2015, 12:28
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 10 Gäste

cron