Das ganze wäre für eine Magisterarbeit, regressionstechnisch ist mir bisher eig. nur die multiple lineare regressionsanalyse bekannt gewesen ^^
Dann sprich das mit mit Deinem/Deiner Betreuer/in ab.
nur zur Sicherheit, kann ich mit der multinominalen logistischen Regression auch so etwas wie ein R-Quadrat Wert generieren, der mir sagt wieviel % der Varianz im Wahlverhalten durch die Prädiktoren abgedeckt werden können, also einen Gesamteindruck für die Validität des Modells gibt?
Diese Frage unterstützt Deine Aussage, dass Du was Regressionstechniken angeht noch eher beim Basis-Kochbuch-Wissen (damit aber in guter Gessellschaft selbst bei vielen post-docs und Profs) bist. R-Quadrat ist i.d.R. das allerletzte, was bei einer Regressionsanalyse interessiert. Über die Modellgüte (was auch immer das sein soll) sagt es nur bedingt etwas aus. Zudem ist es keine Schätzung eines "wahren" Parameters der Grundgesamtheit oder eines kausalen Mechnaismus, sodass eine über die konkret vorliegende Stichprobe hinausgehende Interpretation irreführend und im Prizip unsinnig ist. Genau dies ist aber häufig der Grund überhaupt eine Regression zu schätzen. Eine "Varianz" im Wahlverhalten gibt es m.E. nicht wirklich, oder was verstehst Du daraunter? Ich könnet noch Seitenweise über den Unsinn von R-Quadrat (oder sonstiger skalarer Maße der "Modellgüte") schreiben, aber um die wichtigen Punkte zu nennen:
1. Kannst Du kein mutlinomisches Modell schätzen, weil Deine Prädikatoren mit Ausnahmen (Persönlichkeitssträke des Befragten) über die Alternativen variieren. Multinomische Modelle können lediglich mit Prädikatoren gefüttert werden die ausschließlich über Untersuchungseinheiten (hier: Personen) variieren, nicht aber mit den Wahlmöglichkeiten.
2. Es gibt diverse Pseusdo-R-Quadrat Maße, die bei nicht linearen Modellen berechnet werden können.
Bei den multinominaler logistischer Regression wird ja glaube ich immer (bei 3 Ausprägungen bei der abhängigen Variable) 2 Variablen gegen eine 3te verglichen oder?
Ja. Bei drei Alternativen würdest Du jeweils zwei Koeffizienten pro Prädikator bekommen. Wie oben beschrieben, ist ein reines multinomisches Modell hier aber nicht angemessen.
zu Frage 1 möchte ich noch etwas hinzufügen, was ich vergessen habe:
Die Persönlichkeitsstärke soll eine moderierende Rolle haben. Je mehr persönlichkeitsstärker der Befragter ist, desto weniger haben die vorigen Variablen (Maß an Wissen des Befragten über die jeweiligen Getränke) auf sein Wahlverhalten.
Im nachhinein ist mir aufgefallen, dass das wahrscheinlich eine von der Regressionsanalyse losgelöste Analyse sein müsste oder ? Die Persönlichkeitsstärke (validiertes Modell aus der Psychologie) wird als Punktesystem erfasst (für jedes von den Befragten ausgewählte Item (z.B. Ich fühle mich sicher, Ich gebe den Ton an, etc., bekommt dieser eine bestimmte Punktzahl) kann aber in 5 Teilgruppen kategorisiert werden (ordinal).
Moderationen (oder Interaktionen) können in jede Art von Regressionsanalyse eingebaut werden, indem multiplikative Terme der beteiligten Variablen als zusätzliche Prädikatoren aufgenommen werden. Zur Interpretation im linearen Modell vgl. meien post:
regressionanalyse-f11/interpretation-interaktion-moderierte-regression-t2455.htmlKönntest du etwas empfehlen, den Einfluss dieser Variable auf den Einfluss der anderen unabhängigen Variablen (Maß an Wissen über die Getränke) auf die abhängige Variable (Getränkewahlverhalten) darzustellen?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.