logistische Regression

Alle Verfahren der Regressionanalyse.

logistische Regression

Beitragvon loni » Mo 18. Feb 2013, 15:49

Hallo,

ich muss in meiner MA eine logistische Regression rechnen mit Daten, die ich mittels eines Fragebogens von 20 UN eingesammelt habe. Ich bin ein ziemlicher Anfänger, was das angeht und habe leider nicht so viel Ahnung. :roll:
In meiner Arbeit geht es darum Wirkungen einer bestimmten Wissensform auf dessen Transfer (bei steigender Tazitheit gibt es positive/negative Einflüsse auf den Transfer) zu untersuchen, da meinte mein Betreuer, dass eine hierarchisch logistische Regression sich am besten eignet.
Ich habe nach einer Literaturanalyse einige Hypothesen herausgearbeitet und möchte diese nun überprüfen. Ich habe schon die Konstrukte mittels EFA und Reliab.analyse operationalisiert, zum. die, die aus mehreren Items bestanden und in ihrer Dimension reduziert werden sollten.
Ich habe nun einige abh. Variablen ( in Form von Monaten, Geldbeträgen, sowie Skalen (7-Point-Likert-Scala). Bei den unabhängigen Variablen handelt es sich meist um Variablen, die mittels Skalen abgefragt wurden.

Meine Frage ist nun, wie ich es am Besten anstelle bzw. was die nächsten Schritte wären, um die Daten für die Regression brauchbar zu machen. Eine binäre log. Regression macht ja hier keinen Sinn, da meine abh. Variablen nicht dichotom sind.Da wäre ja nur die multinominale log. Regression. Ich bin hier total am verzweifeln und komme nicht weiter. Muss ich meine Variablen bzw. Faktoren noch irgendwie transformieren, damit ich sie in die Regression aufnehmen kann?

Ich hoffe, ich habe mein Problem einigermaßen verständlich darstellen können.
Ich danke für jede Hilfe.
Viele Grüße,
Loni
loni
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: So 17. Feb 2013, 23:27
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: logistische Regression

Beitragvon aziz » Mo 18. Feb 2013, 18:06

Hallo loni,

multinomiale logistische Regression könntest du u. a. dann anwenden, wenn die abhängige Variable kategorial skaliert ist.

Unterliegen die Kategorien einer Rangfolge, so solltest du die ordinale Regression verwenden. Ich glaube, dass dein Dozent mit hierarchischer logistischen Regression jene meinte.

Kategoriale unabhängige Variable baruchst du nicht zu transformieren. Eine Sonderbehandlung benötigen sie hingegen schon. So musst du eine Kodierung für jenen Typus Variable verwenden. Beispielsweise eine Dummykodierung, bei welcher für Kategorien Dummyvariablen in das Modell aufgenommen werden. Wobei jede Dummyvariable die Ausprägungen 0 (Referenzkategorie liegt vor) und 1 (Kategorie liegt vor) besitzt.

Alle hier erwähnten Modelle gehören der Klasse der verallgemeinerten linearen Modelle. Diese Modellklasse zeichnet sich durch den Fakt aus, dass im eigentlichen Sinne nicht-lineare Zusammenhänge modelliert werden, diese Modelle sich durch mathematische Transformationen (In der Regel übernimmt das eine Software für uns) aber auf einen linearen Zusammenhang zurückführen lassen. In diesem Zusammenhang muss die sog. Link-Funktion erwähnt werden, welche angewandt auf die Modellgleichung , diese linearisiert. Ein Beispiel wäre ein exponentiel-multiplikativer Zusammenhang . Wählen wir hierfür den natürlichen Logarithmus als Link-Funktion, dann ergibt sich die Gleichung zu . Die Exponential- und die Logarihmusfuntion heben sich gegenseitig auf und mit den Rechenregeln für Logarithmen folgt für unsere Modellgleichung: . Du siehst, in dieser Situation modellieren wir nicht die Beobachtungen selbst, sondern eine Funktion der Beobachtungen. Weiterhin gibt es nicht nur eine Link-Funktion die verwendet werden könnte, sondern mehrere, welche abhängig von der Datenlage verwendet werden kann.

Warum habe ich das nun alles gesagt? Nun ja, um auf das Transformieren von metrischen unabhängigen Variablen einzugehen. Dies wird in der Regel gemacht, um die Annahme der Linearität zu prüfen, z. B. mit Scatterplots zwischen . In unserem Fall müssen wir Scatterplots von die Link-Funktion angewandt auf und betrachten. Also: und .

Hab ich dich richtig verstanden? Dein Stichprobenumfang beträgt 20? Das wird bei vielen erklärenden Variablen dann schnell zu einem ernst zunehmenden Problem.

Gruß
Aziz
Zuletzt geändert von aziz am Di 12. Mär 2013, 01:46, insgesamt 1-mal geändert.
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

folgende User möchten sich bei aziz bedanken:
bleichmittel, loni

Re: logistische Regression

Beitragvon loni » Mo 18. Feb 2013, 20:15

Hallo Aziz,
danke für deine Antwort und die Ausführungen.
Mein Problem besteht ja darin, dass ich nicht weiß wie ich die kategorialen Variablen in SPSS einspeisen soll, d. h. wie ich diese Variablen erfassen kann, damit SPSS damit arbeitet. Ich habe ja nicht nur die Monatsangaben, sondern auch ganze Faktoren, die aus mehreren Items bestehen. Mein Problem ist, dass ich nicht weiß, wie ich diese erfassen kann.Soll ich diese als Mittelwert oder Gesamtscore in % transformieren, oder gar eine neue Variable erzeugen...einfach keine Ahnung.
Ich möchte ja die Effekte von best. unabh. Variablen auf meine 3-4 abh. Variablen untersuchen, welche ich in Anlehnung an die Literatur in Hypothesen herausgearbeitet habe, um dann zu bestätigen oder abzulehnen, ob die Effekte wirklich positiv oder negativ sind. Da frage ich mich natürlich, ob es mittels log. oder ordinaler Regression überhaupt Sinn macht?
Es macht ja keinen Sinn, wenn ich nur einzelne Variablen (welche eigentlich zu einem Faktor aus z.B. 4 Items gehören) rauspicke und diese in die Regression aufnehme.
Ja, die Stichprobe umfasst 20 UN..wobei keine Signifikanzen gegeben sein können. Das ist jedoch nicht schlimm, ich soll an den Stellen qualitativ ausführen und begründen.
loni
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: So 17. Feb 2013, 23:27
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: logistische Regression

Beitragvon bleichmittel » Mi 6. Mär 2013, 01:20

Hallo ihr beiden,

erstmal an Loni: Dein Problem ist eigentlich unabhängig von der logistischen Regression, oder? Dir geht es im Moment noch darum, die unabhängigen Variablen zu bilden. Leider verstehe ich hier nicht wirklich was gemeint ist: "(einer bestimmten Wissensform auf dessen Transfer (bei steigender Tazitheit gibt es positive/negative Einflüsse auf den Transfer)". Allgemein: Es macht meistens wirklich keinen Sinn, Variablen, die zu Faktoren gehören, einzeln aufzunehmen. Aber laut deiner Aussage, weißt du ja schon, welche Variablen zusammengehören. Die Scorebildung hängt jetzt auch von deinen Variablen ab. Sind das etablierte psychologische Tests z. B.? Die haben oft angegeben, wie der Score gebildet werden soll. Was mir bisher am häufigsten begegnet ist und wahrscheinlich auch für dich die einfachste Variante wäre, sind einfach Summenscores. D. h. entweder alle Werte addieren oder den Mittelwert nehmen (ist in der Bedeutung ja gleichbedeutend, sollte für die Regression auch keinen Unterschied machen, außer in der Interpretation der Effekte). Du könntest auch die Scores aus der Faktorenanalyse zum Weiterrechnen nehmen. Vielleicht kann dazu jemand anderer noch mehr sagen. Eventuell wäre das auch ein eigenes Topic (?)

@Aziz: Könntest du dazu vielleicht noch kurz etwas sagen (wenn es hier stört, kann ich auch gerne einen eigenen Thread eröffnen)?
Warum habe ich das nun alles gesagt? Nun ja, um auf das Transformieren von metrischen unabhängigen Variablen einzugehen. Dies wird in der Regel gemacht, um die Annahme der Linearität zu prüfen, z. B. mit Scatterplots zwischen x und y. In unserem Fall müssen wir Scatterplots von die Link-Funktion angewandt auf y und x betrachten.

Gibt es im Netz eventuell irgendwo ein Beispiel für diese Plots (bevorzugt für R)? Was genau würde ich für meine unabhängigen metrischen Variablen bei einer logit-Regression mit dichotomer abhängiger Variable plotten?
bleichmittel
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Fr 30. Nov 2012, 13:01
Danke gegeben: 7
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: Google [Bot] und 5 Gäste

cron