Logistische Regression vs. Phi/Fisher

Alle Verfahren der Regressionanalyse.

Re: Logistische Regression vs. Phi/Fisher

Beitragvon klaus82 » Di 9. Apr 2013, 23:05

Hi Aziz, alles klar bei Dir? Das Wetter war ja am Sonntag schon vielversprechend, oder?

Ich würde Dich gerne nochmals um Rat fragen:

Im Anhang zwei logistische Regressionsmodelle:

Als AV die Umweltänderung (0=schlechter, 1=nicht schlechter)

Bei Modell 1 habe ich die 3 Kategorien als UV Brennholzangebot. Ist ja eigentlich ordinal, deswegen habe ich sie mit dem Button Kategorien als solche definiert. Oder hätte ich sie als metrische gar nicht als kategoriale Variable eingeben müssen. Dann wird pseudo -R² kleiner...

Bei Modell zwei habe ich zu den 3 Kategorien noch eine 0er-Kategorie für die Familien, die kein Holz nutzen, hinzugefügt. Die ist nominal.

Die Interpretationen sind etwas verschieden. Welches Modell würdest Du bevorzugen?


LD und LG Klaus
Zuletzt geändert von klaus82 am Do 2. Mai 2013, 13:10, insgesamt 1-mal geändert.
klaus82
User
User
 
Beiträge: 47
Registriert: Mi 20. Feb 2013, 13:15
Danke gegeben: 32
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression vs. Phi/Fisher

Beitragvon aziz » Mi 10. Apr 2013, 15:15

Hallo Klaus,

klaus82 hat geschrieben:Hi Aziz, alles klar bei Dir? Das Wetter war ja am Sonntag schon vielversprechend, oder?

Das stimmt, aber jetzt...
Es soll ja Montag wieder schöner werden.

klaus82 hat geschrieben:Bei Modell 1 habe ich die 3 Kategorien als UV Brennholzangebot. Ist ja eigentlich ordinal, deswegen habe ich sie mit dem Button Kategorien als solche definiert. Oder hätte ich sie als metrische gar nicht als kategoriale Variable eingeben müssen. Dann wird pseudo -R² kleiner...

Das sollte passen.

klaus82 hat geschrieben:Welches Modell würdest Du bevorzugen?

Von den Kenngrößen der Modellanpassung scheint Modell 1 ein bisschen besser zu sein. Beim zweiten Modell stört mich die zusätzliche Kategorie Kein Brennholz. Die übrigen Kategorien zeigen eine Veränderung des Brennholzangebots an. Diese Kategorie zeigt nur an, dass kein Brennholz genutzt würde. War das be den Untersuchungseinheiten schon immer so? Ich persönlich würde diese Kategorie raus lassen. Weiterhin könnte man die Referenz in deinem ersten Modell ändern und zwar auf gleiches Brennholzangebot. So könntest du bei deiner Interpretation den Einfluss, falls das Brennholzangebot von gleich auf besser oder schlechter verändert.

Gruß
A
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

folgende User möchten sich bei aziz bedanken:
klaus82

Re: Logistische Regression vs. Phi/Fisher

Beitragvon klaus82 » Mi 10. Apr 2013, 16:01

Prima, danke Dir, Aziz.

Weiterhin könnte man die Referenz in deinem ersten Modell ändern und zwar auf gleiches Brennholzangebot. So könntest du bei deiner Interpretation den Einfluss, falls das Brennholzangebot von gleich auf besser oder schlechter verändert.


Muß mal sehen wie ich das mache. Man kann nur die erste oder letzte Kategorie als Referenz angeben. Soll ich die Kodierung einfach ändern? 1=Gleich 2=Besser 3=Schlechter?

Ich bin nur irritiert, daß pseudo-R² sinkt,wenn man die Variable als rangskalierte behandelt, die es ja zweifelsohne ist. Hier wird auf Seite 6 angegeben, daß nominale Variablen im Menü Kategorial zu definieren sind. Von ordinalen steht da nichts, aber die sind ja genauso kategorial:
http://www.google.de/url?sa=t&rct=j&q=s ... vg&cad=rja

Außerdem ist ja nur eine Kategorie signifikant, aber Du sagtest ja, dass sei ok.

LG Klaus
klaus82
User
User
 
Beiträge: 47
Registriert: Mi 20. Feb 2013, 13:15
Danke gegeben: 32
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression vs. Phi/Fisher

Beitragvon aziz » Mi 10. Apr 2013, 16:29

klaus82 hat geschrieben:Muß mal sehen wie ich das mache. Man kann nur die erste oder letzte Kategorie als Referenz angeben. Soll ich die Kodierung einfach ändern? 1=Gleich 2=Besser 3=Schlechter?

Das sollte doch dann passen. 1=Gleich = letzte Kategorie oder seh ich was falsch? ;) Wichtig ist nur, dass du dein Merkmal als nominal skaliert interpretierst. Ein Ändern des Skalenniveaus (in der Variablenansicht) sollte hier nicht vonnöten sein. Es sollten die gleichen Ergebnisse herauskommen

klaus82 hat geschrieben:Ich bin nur irritiert, daß pseudo-R² sinkt,wenn man die Variable als rangskalierte behandelt, die es ja zweifelsohne ist.

Welche Variable?

klaus82 hat geschrieben:Hier wird auf Seite 6 angegeben, daß nominale Variablen im Menü Kategorial zu definieren sind. Von ordinalen steht da nichts, aber die sind ja genauso kategorial:

Nicht ganz richtig: Es wir in Klammern noch kategorial (welches nominale- und ordinal-sklaierte Merkmale zusammenfasst) angegeben.

klaus82 hat geschrieben:Außerdem ist ja nur eine Kategorie signifikant, aber Du sagtest ja, dass sei ok.

Was heißt ok? In dem Modell ist dies nunmal so. Wie ich erwähnt hatte, basiert meine Entscheidung für Modell 1 nur auf den Ergebnissen bezüglich der Anpassungsgüte und den inhaltlichen Überlegungen zu der neuen Kategorie im Modell 2.

Lieben Gruß
Aziz
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

folgende User möchten sich bei aziz bedanken:
klaus82

Re: Logistische Regression vs. Phi/Fisher

Beitragvon klaus82 » Mi 10. Apr 2013, 17:22

Das sollte doch dann passen. 1=Gleich = letzte Kategorie oder seh ich was falsch? ;) Wichtig ist nur, dass du dein Merkmal als nominal skaliert interpretierst. Ein Ändern des Skalenniveaus (in der Variablenansicht) sollte hier nicht vonnöten sein. Es sollten die gleichen Ergebnisse herauskommen


Ich hatte 1=besser, 2=gleich und 3=schlechter definiert. Das ist ordinal. Dann hat SPSS die letzte Kategorie (3) als Referenzkategorie gesetzt. 1 ist also nach wie vor Kategorie besser nehme ich an.

Aber ich denke, daß ich jetzt verstanden habe, daß ich die Variable nur als ordinale interpretieren dürfte, wenn alle Kategorien signifikant wären, so daß man ein je mehr, desto...für die gesamte erklärende Varibale interpretieren dürfte, richtig. In meinem Modell ist nur eine Kategorie signifikant. Also muß ich das ganze als nominal betrachten und kann nur die Abhängigkeit der AV von der entprechenden Kategorie interpretieren. Befragte, die eine Verbesserung des Holzangebots wahrnehmen landen wahrscheinlicher in der Kategorie Umweltverschlechterung, richtig?

Welche Variable?


Die erklärende Holzangebotsvariable. Ich habe schon in Beispielen gesehen, daß solch eine ordinalskalierte Variable wie eine metrische Variable ohne des Kategorienzusatz eingegeben wurde. HAbe ich auch probiert, dann sinkt das pseudo-R² auf 0,3 und die Signifikanz für die ganze Variable ist 0,008.

LG Klaus
klaus82
User
User
 
Beiträge: 47
Registriert: Mi 20. Feb 2013, 13:15
Danke gegeben: 32
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression vs. Phi/Fisher

Beitragvon aziz » Do 11. Apr 2013, 10:45

klaus82 hat geschrieben:Aber ich denke, daß ich jetzt verstanden habe, daß ich die Variable nur als ordinale interpretieren dürfte, wenn alle Kategorien signifikant wären, so daß man ein je mehr, desto...für die gesamte erklärende Varibale interpretieren dürfte, richtig.

Vorsicht
Du musst die Kategorien getrennt betrachten! Jede Kategorie ist durch die Dummykodierung im Modell ihre eigene Variable. Du kannst die Veränderung pro Kategorie immer nur bezüglich der Referenz (und konstant halten der übrigen (Dummy)Variablen) interpretieren. Die Signifikanz zeigt doch nichts über die Richtung des Einflusses aus. Signifkanz im Modell bedeutet nur, dass der wahre Parameter von Null verschieden ist. Nicht mehr. Die Richtung des potentiellen Einflusses ergibt sich aus dem geschätzten Parameter.

klaus82 hat geschrieben:Befragte, die eine Verbesserung des Holzangebots wahrnehmen landen wahrscheinlicher in der Kategorie Umweltverschlechterung, richtig?

Ich würde es vorsichtiger und genauer formulieren. Die Chance für ein schlechteres Umweltbewusstsein ist für Personen die eine Verbesserung wahrnehmen größer als für Personen, die eine Verschlechterung wahrnehmen (Referenz). Du hast doch deine Interpretation auf das Modell 1 bezogen?

Liebe Grüße
Aziz
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

folgende User möchten sich bei aziz bedanken:
klaus82

Re: Logistische Regression vs. Phi/Fisher

Beitragvon klaus82 » Do 11. Apr 2013, 11:21

Du musst die Kategorien getrennt betrachten! Jede Kategorie ist durch die Dummykodierung im Modell ihre eigene Variable.

Super, dann war mein Gedanke richtig!
Ich würde nur gerne noch wissen, ob man eine erklärende Variable, die man sowohl als ordinal als auch als intervallskaliert interpretieren kann (1-3) auch ohne Dummykodierung und Kategorien eingeben kann. Ich glaube, da scheiden sich die Geister, oder?

LG Klaus
klaus82
User
User
 
Beiträge: 47
Registriert: Mi 20. Feb 2013, 13:15
Danke gegeben: 32
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression vs. Phi/Fisher

Beitragvon aziz » Do 11. Apr 2013, 11:47

klaus82 hat geschrieben:
Ich würde nur gerne noch wissen, ob man eine erklärende Variable, die man sowohl als ordinal als auch als intervallskaliert interpretieren kann (1-3) auch ohne Dummykodierung und Kategorien eingeben kann. Ich glaube, da scheiden sich die Geister, oder?

Wie soll eine kategoriale Variable sowohl ordinal- wie auch intervallsklaiert sein. Gib mir mal nen Beispiel für solch eine Variable. Weiterhin ist es zwingend notwendig, eine kategoriale abhängig Variable als Dummyvariable (oder irgendeine andere Kodierung) zu kodieren. Lies dir den Abschnitt zu kategorialen abhängigen Variablen mal durch. Hier werden die Probleme die dadurch entstehen durch ein Beispiel verdeutlicht.

Gruß
A
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

folgende User möchten sich bei aziz bedanken:
klaus82

Re: Logistische Regression vs. Phi/Fisher

Beitragvon klaus82 » Do 11. Apr 2013, 14:28

Wie soll eine kategoriale Variable sowohl ordinal- wie auch intervallsklaiert sein. Gib mir mal nen Beispiel für solch eine Variable.


Ich kannte das Beispiel mit den Schulnoten. Die sind ordinalskaliert. Trotzdem rechnet man mit ihnen (Durschnitte=Mittelwert etc.) intervallskaliert.

Das hatte mich etwas verunsichert. Ich hätte ja auch sagen können, ich verteile Punkte. Der Befragte, der mit 1 Wortet erhält einen Punkt, der die 2 ankreuzt 2 Punkte etc.

Ich lese mir mal den Beitrag durch, lieben Dank Aziz!

LG Klaus
klaus82
User
User
 
Beiträge: 47
Registriert: Mi 20. Feb 2013, 13:15
Danke gegeben: 32
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression vs. Phi/Fisher

Beitragvon aziz » Do 11. Apr 2013, 16:22

klaus82 hat geschrieben:Ich kannte das Beispiel mit den Schulnoten. Die sind ordinalskaliert. Trotzdem rechnet man mit ihnen (Durschnitte=Mittelwert etc.) intervallskaliert.

Das ist richtig. Es wird in diesem Zusammenhang weiterhin angenommen, dass die Abstände zwischen den Schulnoten gleich sind. Also: Sehr gut ist soweit von gut entfernt, wie ausreichend von mangelhaft, zum Beispiel. Deswegen kann das arithmetische Mittel ("gewöhnliche Mittelwert") verwendet werden, obwohl es für kategoriale Merkmale eigentlich nicht geeignet ist. Das Merkmal ist weiterhin kategorial bzw. ordinal. Es ist nicht kategorial, wie auch intervallskaliert.

klaus82 hat geschrieben:Das hatte mich etwas verunsichert. Ich hätte ja auch sagen können, ich verteile Punkte. Der Befragte, der mit 1 Wortet erhält einen Punkt, der die 2 ankreuzt 2 Punkte etc.

Da seh ich jetzt grad den Zusammenhang nicht, sorry.

Gruß
Aziz
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

folgende User möchten sich bei aziz bedanken:
klaus82

VorherigeNächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 8 Gäste