Nominalskalierte abhängige Variable / mehrere abhängige

Alle Verfahren der Regressionanalyse.

Nominalskalierte abhängige Variable / mehrere abhängige

Beitragvon dawenzi » So 11. Aug 2013, 11:10

Guten Tag miteinander,

Ich hätte 2 Fragen:

Frage 1:
In einer Befragung habe ich eine nominalskalierte Variable mit 3 Ausprägungen (Befragte wählen zwischen 3 verschiedenen Getränken). Dies soll die abhängige Variable sein.
Die Wahl der 3 Ausprägungen möchte ich durch eine Reihe verschiedeneer unabhängige Variablen erklären. Diese liegen in unterschiedliche Skalen vor (metrisch, ordinal).

-> Gibt es ein Regressionsverfahren mit denen ich die Varianz aus den 3 Ausprägungen durch unabhängige Variablen erklären kann? :?

Frage 2:
Die 3 verschiedene Getränke werden in einer anderen Frage von den Befragten jeweils auf einer Skala von 1-5 bewertet. Diese Bewertungen möchte ich ebenfalls durch mehrere unabhängige Variablen erklären (auch hier verschiedene Skalen, metrisch und ordinal).

-> Wäre es sinnvoller 3 seperate, multiple Regressionsmodelle für jede einzelne Bewertung der Getränke zu erstellen oder kann ich auch alle in einem Modell sinnvoll zusammenbringen?
dawenzi
Beobachter
Beobachter
 
Beiträge: 15
Registriert: So 11. Aug 2013, 11:05
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Nominalskalierte abhängige Variable / mehrere abhängige

Beitragvon daniel » So 11. Aug 2013, 11:58

Klingt für mich nach genesterter Struktur. Für die Wahlentscheidung schau mal in Richtung multinominales oder konditionales logistisches Modell (auch: McFaddens choice model) je nachdem ob die Prädikatoren Charakteristika der Befragten oder der Getränke sind. Für die zweite Fragestellung würde ich ein lineares fixed-effects Modell (Getränke genestet in Individuen) vorschlagen.

Das Modell ist aber nicht zuletzt abhängig von Deiner Teorie, über die Du uns nichts verarten hast.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Nominalskalierte abhängige Variable / mehrere abhängige

Beitragvon dawenzi » So 11. Aug 2013, 12:30

Hallo Daniel, Danke schonmal für die Hinweise, auch wenn ich nicht so weiß was ich damit anfangen kann ^^
Aber wegen dem Hintergrund:

Für Fragestellung 1 war der Hintergrund, dass die Wahl aus den 3 Getränken a,b,c durch folgende Prädiktoren begründet werden soll:
- Maß an Wissen des Befragten je über Getränk a, Getränk b, Getränk c (ordinal)
- Maß an Wissen dass der Befragte anderen Menschen aus seinem sozialen Umfeld zuschreibt, ebenfalls je für Getränk a,b,c (ordinal)
- Persönlichkeitssträke des Befragten (metrisch)
- Zugehörigkeit des Befragten zu einer bestimmten Region (nominal)

Fragestellung 2: Bewertung der Getränke a,b,c (ordinal) durch dieselben Prädiktoren ausgenommen der Persönlichkeitsstärke (metrisch)

Glaubst du es wäre sinnvoll für Fragestellung 2 einfach 3 einzelne, multiple Regressionsanalysen machen? Oder ich habe beim googeln was von multivariater, multipler regression gesehen?

Da ich alles andere als ein Pro auf dem Feld Datenanalyse/Methoden bin, gilt für mich eher die Maxime: Das einfachste, noch sinnvolle was geht ^^
dawenzi
Beobachter
Beobachter
 
Beiträge: 15
Registriert: So 11. Aug 2013, 11:05
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Nominalskalierte abhängige Variable / mehrere abhängige

Beitragvon daniel » So 11. Aug 2013, 13:04

Da ich alles andere als ein Pro auf dem Feld Datenanalyse/Methoden bin, gilt für mich eher die Maxime: Das einfachste, noch sinnvolle was geht ^^


Über Sinn und Unsinn kann man lange streiten. Deine Maxime ist verständlich (auch wenn es nicht unbedingt meine ist), allerdings weiß ich nicht, zu was ich raten soll, ohne Kontext der Studie zu kennen. Soll das in einem peer-reviewed journal erscheinen, oder ist das eine Hausarbeit, mit der ein einfacher Schein erworben werden soll? Im ersten Fall schau Dir an, was ander Wissenschaftler in Deiner Disziplin bei ähnlichen Fragestellungen in der anvisierten Zeitschrift gemacht haben, im zweiten Fall setzt Dich mit dem/der Betreuer/in auseinander.

Die "Theorie" zur ersten Fragestellung würde ich, wie gesagt, als choice Modell (konditionales logit Modell) umsetzen. Eine sehr einfache (wenngleich m.E. nicht angemessene) Alternative wären drei getrennte binäre logistische Modelle (jeweil Entscheidung für oder gegen ein bestimmtes Getränk).

Bei der zweiten Fragestellung bleibe ich ebenfalls bei einem FE Ansatz. Analog zur Argumentation oben, kannst Du Dich natürlich auch hier für drei getrennte Modelle entscheiden. Multivariate Regressionsmodelle erlauben dabei die Korrelation der Fehler zwischen diesen Modellen, was die Abhängigkeitsstruktur der drei Getränke zumindest teilweise einfängt.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Nominalskalierte abhängige Variable / mehrere abhängige

Beitragvon dawenzi » So 11. Aug 2013, 17:05

hm.. Danke nochmal für dein feedback!
Das ganze wäre für eine Magisterarbeit, regressionstechnisch ist mir bisher eig. nur die multiple lineare regressionsanalyse bekannt gewesen ^^, nur zur Sicherheit, kann ich mit der multinominalen logistischen Regression auch so etwas wie ein R-Quadrat Wert generieren, der mir sagt wieviel % der Varianz im Wahlverhalten durch die Prädiktoren abgedeckt werden können, also einen Gesamteindruck für die Validität des Modells gibt? Bei den multinominaler logistischer Regression wird ja glaube ich immer (bei 3 Ausprägungen bei der abhängigen Variable) 2 Variablen gegen eine 3te verglichen oder?

zu Frage 1 möchte ich noch etwas hinzufügen, was ich vergessen habe:

Die Persönlichkeitsstärke soll eine moderierende Rolle haben. Je mehr persönlichkeitsstärker der Befragter ist, desto weniger haben die vorigen Variablen (Maß an Wissen des Befragten über die jeweiligen Getränke) auf sein Wahlverhalten.
Im nachhinein ist mir aufgefallen, dass das wahrscheinlich eine von der Regressionsanalyse losgelöste Analyse sein müsste oder ? Die Persönlichkeitsstärke (validiertes Modell aus der Psychologie) wird als Punktesystem erfasst (für jedes von den Befragten ausgewählte Item (z.B. Ich fühle mich sicher, Ich gebe den Ton an, etc., bekommt dieser eine bestimmte Punktzahl) kann aber in 5 Teilgruppen kategorisiert werden (ordinal).

Könntest du etwas empfehlen, den Einfluss dieser Variable auf den Einfluss der anderen unabhängigen Variablen (Maß an Wissen über die Getränke) auf die abhängige Variable (Getränkewahlverhalten) darzustellen?
dawenzi
Beobachter
Beobachter
 
Beiträge: 15
Registriert: So 11. Aug 2013, 11:05
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Nominalskalierte abhängige Variable / mehrere abhängige

Beitragvon daniel » So 11. Aug 2013, 17:35

Das ganze wäre für eine Magisterarbeit, regressionstechnisch ist mir bisher eig. nur die multiple lineare regressionsanalyse bekannt gewesen ^^


Dann sprich das mit mit Deinem/Deiner Betreuer/in ab.

nur zur Sicherheit, kann ich mit der multinominalen logistischen Regression auch so etwas wie ein R-Quadrat Wert generieren, der mir sagt wieviel % der Varianz im Wahlverhalten durch die Prädiktoren abgedeckt werden können, also einen Gesamteindruck für die Validität des Modells gibt?


Diese Frage unterstützt Deine Aussage, dass Du was Regressionstechniken angeht noch eher beim Basis-Kochbuch-Wissen (damit aber in guter Gessellschaft selbst bei vielen post-docs und Profs) bist. R-Quadrat ist i.d.R. das allerletzte, was bei einer Regressionsanalyse interessiert. Über die Modellgüte (was auch immer das sein soll) sagt es nur bedingt etwas aus. Zudem ist es keine Schätzung eines "wahren" Parameters der Grundgesamtheit oder eines kausalen Mechnaismus, sodass eine über die konkret vorliegende Stichprobe hinausgehende Interpretation irreführend und im Prizip unsinnig ist. Genau dies ist aber häufig der Grund überhaupt eine Regression zu schätzen. Eine "Varianz" im Wahlverhalten gibt es m.E. nicht wirklich, oder was verstehst Du daraunter? Ich könnet noch Seitenweise über den Unsinn von R-Quadrat (oder sonstiger skalarer Maße der "Modellgüte") schreiben, aber um die wichtigen Punkte zu nennen:

1. Kannst Du kein mutlinomisches Modell schätzen, weil Deine Prädikatoren mit Ausnahmen (Persönlichkeitssträke des Befragten) über die Alternativen variieren. Multinomische Modelle können lediglich mit Prädikatoren gefüttert werden die ausschließlich über Untersuchungseinheiten (hier: Personen) variieren, nicht aber mit den Wahlmöglichkeiten.

2. Es gibt diverse Pseusdo-R-Quadrat Maße, die bei nicht linearen Modellen berechnet werden können.

Bei den multinominaler logistischer Regression wird ja glaube ich immer (bei 3 Ausprägungen bei der abhängigen Variable) 2 Variablen gegen eine 3te verglichen oder?


Ja. Bei drei Alternativen würdest Du jeweils zwei Koeffizienten pro Prädikator bekommen. Wie oben beschrieben, ist ein reines multinomisches Modell hier aber nicht angemessen.

zu Frage 1 möchte ich noch etwas hinzufügen, was ich vergessen habe:

Die Persönlichkeitsstärke soll eine moderierende Rolle haben. Je mehr persönlichkeitsstärker der Befragter ist, desto weniger haben die vorigen Variablen (Maß an Wissen des Befragten über die jeweiligen Getränke) auf sein Wahlverhalten.
Im nachhinein ist mir aufgefallen, dass das wahrscheinlich eine von der Regressionsanalyse losgelöste Analyse sein müsste oder ? Die Persönlichkeitsstärke (validiertes Modell aus der Psychologie) wird als Punktesystem erfasst (für jedes von den Befragten ausgewählte Item (z.B. Ich fühle mich sicher, Ich gebe den Ton an, etc., bekommt dieser eine bestimmte Punktzahl) kann aber in 5 Teilgruppen kategorisiert werden (ordinal).


Moderationen (oder Interaktionen) können in jede Art von Regressionsanalyse eingebaut werden, indem multiplikative Terme der beteiligten Variablen als zusätzliche Prädikatoren aufgenommen werden. Zur Interpretation im linearen Modell vgl. meien post: regressionanalyse-f11/interpretation-interaktion-moderierte-regression-t2455.html

Könntest du etwas empfehlen, den Einfluss dieser Variable auf den Einfluss der anderen unabhängigen Variablen (Maß an Wissen über die Getränke) auf die abhängige Variable (Getränkewahlverhalten) darzustellen?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Nominalskalierte abhängige Variable / mehrere abhängige

Beitragvon dawenzi » So 11. Aug 2013, 22:16

Ohje, ich habe mich im Laufe des Nachmittags mal durch Fixed-Effects und Mc Faddens Choice Model recherchiert und komme zum Schluss, dass mir das in Anbetracht des baldigen Abgabetermins doch nen Tick zu aufwendig erscheint :(
Ich würde mich dann wohl doch auf den Ansatz mit 3 seperaten bivariaten logistischen & 3 multiplen regressionsanalysen stützen. Danke übrigens nochmal für dein Engagement hier! Würd mich gerne ggf nochmal hier zu den Teilen melden wenn die Daten da sind :)
dawenzi
Beobachter
Beobachter
 
Beiträge: 15
Registriert: So 11. Aug 2013, 11:05
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 16 Gäste

cron