Kategoriale Variablen als unabhängige Variablen integrieren

Alle Verfahren der Regressionanalyse.

Kategoriale Variablen als unabhängige Variablen integrieren

Beitragvon StefanTrautmann » Do 10. Jan 2013, 13:42

Hallo zusammen,

ich habe über SPSS die "Automatisch lineare Modellierung" genutzt und festgestellt, dass (neben einigen metrisch skalierten Variablen) auch einige kategoriale Variablen maßgeblichen Einfluss auf die zuerklärende Variable, welche ebenfalls metrisch skaliert ist, nehmen.

Nun würde ich diese kategorialen Variablen gerne in die lineare Regression einbinden. Allerdings erlaubt mir SPSS 21 nicht, diese hinzuzufügen, weil SPSS beim Hinzufügen folgendes meldet: "String-Variablen sind in der Liste nicht zulässig". Wie ist es mir möglich, die kategorialen Variablen wie in der"Automatisch linearen Modellierung" von SPSS bereits automatisch geschehen, in die lineare Regression einzubinden? Über Dummy-Variablen?

Falls es der bestmögliche Weg wäre, die kategoriale Variable (z.B. "Land") als zahlreiche Dummy-Variablen einzubinden: z.B."Dummy1Deutschland", "Dummy2Italien", ... habe ich meines Erachtens zwei Probleme:
1. Arbeitsaufwand: Der Arbeitsaufwand ist relativ groß, da es zahlreiche verschwindene Ausprägungen der katogrialen Variable LAND gibt.
2. Interpretation: Ich könnte in den ausgeworfenen Statistiken meines Wissens immer nur separierte Effekte für einzelne Dummy-Variablen interpreiteren, z.B. Dummy1Deutschland. Ziel ist es allerdings, zu bewerten wie stark der Einfluss der Variable "Land" (und nicht der einzelnen Dummy-Variablen) auf die abhängige Variable ist. Sehe ich das richtig, dass dies hierdurch nicht gegeben wäre?

Freundlichen Grüße
Stefan
StefanTrautmann
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 10. Jan 2013, 13:31
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Kategoriale Variablen als unabhängige Variablen integrie

Beitragvon daniel » Do 10. Jan 2013, 16:47

Das sind alles "technische" Fragen, die im SPSS Forum sicher besser beantwortet werden können.

Soviel vorweg. Das Problem, das SPSS hat, ist nicht, dass die Variable kategorial ist, sondern, dass sie vom Typ "string" ist, also nur Text/Zeichen enthält -- keine Zahlen. Damit kann SPSS natürlich nicht rechnen. Es gibt bestimmt (wäre ein weiteres Armutszeugnis für SPSS, falls nicht) Möglichkeiten diese Variable automatisiert in eine Reihe von Dummies umzuwandeln. Aber das wird Dir im SPSS Foum sicher eher gezeigt, als hier.

Zur einzigen inhaltllichen Frage

Ziel ist es allerdings, zu bewerten wie stark der Einfluss der Variable "Land" (und nicht der einzelnen Dummy-Variablen) auf die abhängige Variable ist.


eine (provokative) Gegenfrage: Was genau verstehst Du denn unter der "Stärke" der Variable Land?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Kategoriale Variablen als unabhängige Variablen integrie

Beitragvon StefanTrautmann » Do 10. Jan 2013, 17:10

Hallo Daniel,

danke für Deine Antwort.

Zu Deiner Frage: Es geht mir um die Bedeutsamkeit der Prädikatoren hinsichtlich ihrer Verbesserung von R-Quadrat. Wenn ich alles richtig verstanden habe, dürfte sich diese in den "Standardisierten Koeffizienten" ausdrücken.
Über die Sinnhaftigkeit meines Bestrebens R-Quadrat verbessern zu wollen, lässt sich selbstverständlich streiten.

Vielleicht kannst du mir noch dabei helfen, ob für mein Ansinnen, der Ansatz über (zahlreiche) Dummy-Variablen grundsätzlich der richtige ist. Für die Generierung der Dummys, also die technische Umsetzung, wende ich mich, wie von Dir erwähnt, an das SPSS-Forum.

Vielen Dank für Deine Hilfe und liebe Grüße
Stefan
StefanTrautmann
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 10. Jan 2013, 13:31
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Kategoriale Variablen als unabhängige Variablen integrie

Beitragvon daniel » Do 10. Jan 2013, 17:24

Die Verbesserung von R Quadrat ist meist ein relativ unsinniges, wissenschaftlich irrelevantes Ziel, aber das ist/war ja nicht die Frage.

Wenn Du die Verbesserung in R-Quadrat wissen willst, schau Dir die Verbesserung in R-Quadrat an. Die standardisierten Koeffizienten helfen da wenig (und sind bei Dummies undiskutabel schlicht unsinnig). Beachte allerdings, dass die Änderung in R-Quadrat von Null-Modell (nur Konstante, R-Quadrat = 0) zum Modell mit allen Länder-Dummies, eine andere sein wird, als die eines bereits relativ vollen Modells (mit allen anderen relevanten Prädikatoren) zu einem Modell mit zusätzlichen Länderdummies. In diesem Zusammenhang berichten einige die "minimale Varianzaufklärung" (letztere) und die "maximale Varianzaufklärung" (erstere) durch die Länderdummies.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 8 Gäste