STATISTIK-FORUM.de

Held der Arbeit · von **Held der Arbeit** » Do 11. Aug 2016, 12:57

Moin,

ich schreibe zur Zeit an meiner Masterarbeit (Psychologie) und habe dafür Interviews zu erlebter Hilfe geführt, in denen die Teilnehmer einen Hilfsakt narrativ beschreiben und anhand verschiedener Kriterien bewerten sollten (z.B. Art des Helfers (Professionell/Freiwillig) oder subjektive helpfulness). Ziel ist es, mithilfe einer Clusteranalyse Typologien von Hilfe zu bestimmen und zu schauen ob die Cluster sich qualitativ und quantitativ unterscheiden. (Sind schonmal ~20 Seiten ANOVAS

)

Zusätzlich möchte mein Betreuer wissen, welcher Faktor in welchem Cluster die AV "helpfulness" jeweils am stärksten vorhersagt. Dafür hat er mir eine "Regression für nominale Werte" empfohlen.

Meine Daten sind in einigen Fällen nominal (z.B. Art des Helfers), in der Regel jedoch ordinalskaliert (7-stufige Likert Skala). Das betrifft auch die AV. Außerdem sind die BLUE-Vorraussetzungen für die meisten Variablen nicht erfüllt (viele Verteilungen sind heteroskedastisch und zweigipfelig statt NV). (Generell sind die Daten wahrscheinlich hoffnungslos konfundiert, da es halt keine Laborstudie sondern Interviews im Feld sind. Mein Betreuer meint aber das ist alles kein Problem

)

Laut Google sollte ich also eine logistische Regression durchführen und zwar aufgrund der hohen Variablenanzahl eine multinomiale. Soweit korrekt?

SPSS gibt mir dafür folgenden Dialog:
Bild

Meine Frage ist jetzt wie ich die Werte anordnen soll um die oben genannte Fragestellung zu beantworten.
(Und wie der Output zu interpretieren ist)

Das Ziel ist sowas wie "In Cluster A besteht ein besonders starker (linearer?) Zusammenhang zwischen dem Wert von helpfulness und dem Wert von Faktor X"

Erste Versuche ergaben (für mich) unsinnige Listen in denen für jede einzelne Ausprägung aller Kovariaten (=UV's?), (also 15 mal 1-7) der Lageparameter geschätzt wurde.
Für helpfulness wurde der Schwellenwert geschätzt, allerdings nur für die Werte 1-6, mit 7 als Referenzkategorie. Ich erinnere mich da dunkel an das Thema Dummy-Kodierungen, aber im großen und ganzen kann ich mit diesen Werten leider nichts (mehr) anfangen

Vor allem ist mir nicht klar wie ich anhand des Outputs die Beziehung zwischen einzelnen Faktoren und helpfulness innerhalb spezifischer Cluster (also einem subset meiner gesamtdaten) nachvollziehen soll

Oder habe ich doch die falsche Methode?

Hoffe sehr, dass mir jemand weiterhelfen kann! Langsam raucht mir echt der Kopf

LG
Jan

PonderStibbons · von **PonderStibbons** » Do 11. Aug 2016, 13:37

Das Ziel ist sowas wie "In Cluster A besteht ein besonders starker

Besonders stark im Vergleich wozu?

(linearer?)

Wie ist die abhängig Variable denn nun skaliert? Ist das die 7er-Skala?

Zusammenhang zwischen dem Wert von helpfulness und dem Wert von Faktor X"

Wie ist Faktor X skaliert? Kommt nur Faktor X in die Vorhersagegleichung? Was soll alles hinein?
Und wie groß ist eigentlich die Stichprobe?

Oder habe ich doch die falsche Methode?

Sieht erstmal so aus.

LG

wtf

Mit freundlichen Grüßen

PonderStibbons

Held der Arbeit · von **Held der Arbeit** » Do 11. Aug 2016, 14:04

PonderStibbons hat geschrieben:
Das Ziel ist sowas wie "In Cluster A besteht ein besonders starker

Besonders stark im Vergleich wozu?

Den anderen Faktoren. Also zB ein stärkerer Zusammenhang in Cluster A zwischen helpfulness und x als zwischen helpfulness und y,z...

(linearer?)

Wie ist die abhängig Variable denn nun skaliert? Ist das die 7er-Skala?

Ja. AV ist helpfulness (bzw "HilfreichNum") skaliert von 1 (minimal) bis 7 (maximal).

Zusammenhang zwischen dem Wert von helpfulness und dem Wert von Faktor X"

Wie ist Faktor X skaliert? Kommt nur Faktor X in die Vorhersagegleichung? Was soll alles hinein?
Und wie groß ist eigentlich die Stichprobe?

Die meisten Faktoren (15Stück) sind ordinalskaliert (auch 1-7). 4 sind nominal (was ja in Regressionen eigentlich nicht geht?) aber mein Betreuer hat mich mit der Ansage stutzig gemacht ich solle "Regressionen machen und zwar solche die nominale Daten vorhersagen."
Die o.g. Faktoren sollten alle in die Vorhersagegleichung

Bezüglich N, es gibt 2 Stichproben mit n=49 und n=48. Die einzelnen Cluster (4-5 pro Stichprobe) sind dementsprechend alle n<30. (teilweise deutlich)

Welche Methode wäre denn angemessen, wenn wir mal bei der Vorgabe bleiben das es ne Regression sein soll?

herzliche Grüße

Jan

PonderStibbons · von **PonderStibbons** » Do 11. Aug 2016, 14:21

Also zB ein stärkerer Zusammenhang in Cluster A zwischen helpfulness und x als zwischen helpfulness und y,z...

Da könntest Du die 7erskalaen als annähernd intervallskaliert annehmen
und Korrelationen rechnen und diese paarweise vergleichen (Vergleich von
korrelierten Korrelationskoeffizienten, correlated correlation coefficients;
das genaue Verfahren habe ich nicht präsent, lässt sich aber recherchieren).

4 sind nominal (was ja in Regressionen eigentlich nicht geht?)

Ein k-stufiger Faktor kann in Form von k-1 dummy-Variaben in eine
Regression aufgenommen werden.

aber mein Betreuer hat mich mit der Ansage stutzig gemacht ich solle "Regressionen machen und zwar solche die nominale Daten vorhersagen."

Das musst Du dann wohl mit ihm besprechen. Ich verstehe den Sinn von hier aus
nicht. Vielleicht ist gemeint, ordinale logistische Regression, für ordinalskalierte
abhängige Variablen.

Die o.g. Faktoren sollten alle in die Vorhersagegleichung

Dann musst Du evtl. recherchieren, ob es einen Test gibt, mit dem sich die Regressionsgewichte
der verschiedenen Prädiktoren aus einem Regressionsmodell miteinander vergleichen lassen.
Ob das Sinn ergit, weiß ich nicht, auch nicht, ob man so den Einfluss kategorialer mit dem anders
skalierter Variablen vergleichen kann.

Allerdings hast Du Teilstichproben mit n < 30, da können sowieso sinnvoll allenfalls 2 bis 3
Prädiktoren rein. Und wegen der massiven Herumtesterei, auf die das anscheinend hinausläuft,
müsste man auch überlegen, ob das Signifikanzniveau nicht konservativer angesetzt werden
müste als die üblichen 5%.

Mit freundlichen Grüßen

PonderStibbons

folgende User möchten sich bei PonderStibbons bedanken:
Held der Arbeit

Held der Arbeit · von **Held der Arbeit** » Do 11. Aug 2016, 14:57

PonderStibbons hat geschrieben:Da könntest Du die 7erskalaen als annähernd intervallskaliert annehmen
und Korrelationen rechnen und diese paarweise vergleichen (Vergleich von
korrelierten Korrelationskoeffizienten, correlated correlation coefficients;
das genaue Verfahren habe ich nicht präsent, lässt sich aber recherchieren).

Ich hatte ursprünglich Korrelationen berechnet (Spearmans Rho, weil das wohl gegenüber heteroskedastizität & co robust ist), aber als Antwort darauf kam stattdessen die Forderung nach Regressionen. Ich schätze ich wäre auch für eine gute Argumentation dankbar warum das mit meinen Daten garnicht sauber geht (dem Prof widerspricht man per se erstmal nicht so gern :/)

Vielleicht ist gemeint, ordinale logistische Regression, für ordinalskalierte
abhängige Variablen.

Gut möglich. Mein Prof ist leider grade im Urlaub und reagiert auf Mails nur mit langer Verzögerung

Dann musst Du evtl. recherchieren, ob es einen Test gibt, mit dem sich die Regressionsgewichte
der verschiedenen Prädiktoren aus einem Regressionsmodell miteinander vergleichen lassen.
Ob das Sinn ergit, weiß ich nicht, auch nicht, ob man so den Einfluss kategorialer mit dem anders
skalierter Variablen vergleichen kann.

Allerdings hast Du Teilstichproben mit n < 30, da können sowieso sinnvoll allenfalls 2 bis 3
Prädiktoren rein. Und wegen der massiven Herumtesterei, auf die das anscheinend hinausläuft,
müsste man auch überlegen, ob das Signifikanzniveau nicht konservativer angesetzt werden
müste als die üblichen 5%.

Das erklärt warum SPSS mir für den Versuch mit allen Prädiktoren ein log-likelihood nahe Null ausspuckt. Zu viele Variablen auf einmal.

Es bleiben noch ein paar Fragen:

- Ich teste also mit ordinaler Regression sukzessive 2-3 Prädiktoren gegen die AV?
- Packe ich die Prädiktoren dann in das Feld für Faktoren, oder für Kovariaten (welche, wie ich an anderer Stelle gelesen habe analog zu UVs sind)?
- Welches Signifikanznveau würdest Du vorschlagen?
- Und wie ist das ganze letztlich zu interpretieren? Ich kenne mich leider nur bei der linearen Regression aus (und auch da nicht sonderlich gut :/)

Hier wäre mal ein Beispiel (3 Faktoren, 2 ordinal, 1 nominal, alle als Faktoren - nicht Kovariaten - definiert), AV helpfulness
Bild

herzliche Grüße
Jan

Held der Arbeit · von **Held der Arbeit** » Do 11. Aug 2016, 15:07

Held der Arbeit hat geschrieben:- Packe ich die Prädiktoren dann in das Feld für Faktoren, oder für Kovariaten (welche, wie ich an anderer Stelle gelesen habe analog zu UVs sind)?

Glaube ich habe mir die Frage selber beantwortet, zumindest sieht der Output für Kovariaten schon mal um einiges sinnvoller aus

Bild

Mal abgesehen davon das ich mit ordinalen & nominalen Daten hier noch Äpfel mit Birnen vergleiche (werde recherchieren ob- und wenn ja wie das zulässig ist) müsste das doch ungefähr das sein was ich berechnen will?

Hiernach hätte Intention in der untersuchten Stichprobe die stärkste Vorhersagekraft auf die AV?
Wie sind die Schwellenwerte der einzelnen AV-ratings zu interpretieren? Bzw kann ich die Aussage nur im Bezug zur Referenzkategorie (HilfreichNum=7) treffen? Wie wäre da die korrekte Formulierung? Das ein linearer Zusammenhang zwischen Intention und helpfulness besteht kann ich hier ja wahrscheinlich nicht einfach behaupten.

Die Cluster würde ich dann vergleichen indem ich die entsprechenden Teilstichproben vorselektiere

STATISTIK-FORUM.de

Multinomiale logistische Regression in SPSS

Multinomiale logistische Regression in SPSS

Re: Multinomiale logistische Regression in SPSS

Re: Multinomiale logistische Regression in SPSS

Re: Multinomiale logistische Regression in SPSS

Re: Multinomiale logistische Regression in SPSS

Re: Multinomiale logistische Regression in SPSS

Wer ist online?