STATISTIK-FORUM.de

ElPresidente · von **ElPresidente** » Mi 7. Dez 2011, 18:38

Hallo,

ich habe ein paar Fragen zur Anwendung der Regressionsanalyse. Und zwar untersuche ich in einem Seminar die Einflussfaktoren von Studierenden, das Unternehmen ihrer Eltern zu übernehmen. Die Datenbasis wurde vom Lehrstuhl gestellt. D.h. die Fragen (Variablen), die ich für die Zusammenhangsanalyse verwende, sind extern gegeben und nicht explizit auf meine Fragestellung angepasst, was meine Arbeit nicht gerade erleichtert. Die nachfolgend aufgeführte Vorgehensweise habe ich geplant und bereits teilweise durchgeführt. Dabei entstanden offene Fragen meinerseits, bei denen ich mich über eure Hilfe freuen würde!

1. Methodenwahl
Da meine abhängige Variable (Neigung das Familien-UN zu übernehmen) ordinal skaliert ist (Frage: Bitte geben Sie an, ob und wie intensiv Sie bereits darüber nachgedacht haben, das Unternehmen Ihrer Eltern zu übernehmen; Antwortmöglichkeiten: nie, flüchtig, wiederholt, relativ konkret, bewusste Entscheidung, konkrete Schritte, mit Realisierung begonnen), habe ich aus meiner, vielleicht etwas beschränkten Sicht zwei Methoden zur Auswahl.
Erstens die ordinale Regression und zweitens eine binäre logistische Regression. Eine lineare Regression kommt nicht in Frage, weil die Abstände zwischen den Kategorien nicht gleich groß sind.
Die binäre logistische Regression möchte ich eigentlich nicht nehmen, weil eine Einteilung der Antwortmöglichkeiten in Neigung ja/nein äußerst subjektiv ist. Könnt ihr meine Einschätzung teilen? Einziger Nachteil: meinem Betreuer ist die ordinale Regression unbekannt, d.h. ich müsste die Methodenbeschreibung ausführlicher gestalten. Oder welche Methode, deren Ergebnisse nachher bestenfalls nicht all zu schwer zu interpretieren sind, würdet ihr in meinem Fall vorschlagen? Ich möchte nachher einen Nachweis erhalten, ob z.B. Selbstvertrauen einen positiven Einfluss auf die Übernahmeneigung von Studierenden hat.

2. Skalenbildung
Meine unabhängigen Variablen haben auch alle ordinales Skalenniveau (7er Likert-Skala, z.B. sehr unwichtig bis sehr wichtig). Da ich mehrere Items zu einer Dimension zusammenfassen will (theoretisch begründbar u. hohes Crohnachs Alpha), stellt sich die Frage, ob ich aus den mehreren ordinalen Variablen eine ordinale od. intervallskalierte Skala bilde. Das Problem ist, dass ich bei sauberer Anwendung lediglich Median verwenden darf. Was würdet ihr mir empfehlen? Ist nachher bei der ordinalen Regression leichter mit intervallskalierten od. ordinal skalierten unabhängigen Variable(n) zu arbeiten?

Viele Grüße und besten Dank im Voraus!

Gianni

daniel · von **daniel** » Do 8. Dez 2011, 00:20

Die binäre logistische Regression möchte ich eigentlich nicht nehmen, weil eine Einteilung der Antwortmöglichkeiten in Neigung ja/nein äußerst subjektiv ist. Könnt ihr meine Einschätzung teilen?

Würde ich auch so, oder ähnlich, sehen.

Oder welche Methode, deren Ergebnisse nachher bestenfalls nicht all zu schwer zu interpretieren sind, würdet ihr in meinem Fall vorschlagen? Ich möchte nachher einen Nachweis erhalten, ob z.B. Selbstvertrauen einen positiven Einfluss auf die Übernahmeneigung von Studierenden hat.

Unter der Annahme, dass es hier lediglich um den Scheinerwerb in einem Seminar geht, in dem es nicht gerade um nicht-lineare Modelle geht, und Du zudem nicht motiviert bist Dich ausführlicher mit der ordinalen Regression auseinander zusetzen (alles gegeben der Aussage: "Einziger Nachteil: meinem Betreuer ist die ordinale Regression unbekannt, d.h. ich müsste die Methodenbeschreibung ausführlicher gestalten." durchaus plausibel anzunehmen), würde ich die lineare Regression vorschlagen. Wenn es Dir lediglich um die Richtung eines Einflusses geht, wird Dir eine ordinale Regression (bei Erfüllung der parallel odds assumption) kaum eine andere Antwort liefern als die lineare Regression. Andere mögen widersprechen.

Meine unabhängigen Variablen haben auch alle ordinales Skalenniveau (7er Likert-Skala, z.B. sehr unwichtig bis sehr wichtig).

Das sind Likert-typ Items, keine Likert-Skalen.

Da ich mehrere Items zu einer Dimension zusammenfassen will

Das Ergebnis wäre dann eine Likert-Skala.

[...] stellt sich die Frage, ob ich aus den mehreren ordinalen Variablen eine ordinale od. intervallskalierte Skala bilde.

Likert-Skalen sind intervall skaliert.

Das Problem ist, dass ich bei sauberer Anwendung lediglich Median verwenden darf.

Darüber lässt sich streiten, aber wer Testtheorien ernst nimmst wird nicht widersprechen, dass Likert-Skalen intervall skaliert sind und damit alle Verfahen zulassen, die diese Art der Skalierung vorrausetzen.

Was würdet ihr mir empfehlen? Ist nachher bei der ordinalen Regression leichter mit intervallskalierten od. ordinal skalierten unabhängigen Variable(n) zu arbeiten?

Das ist analog zur linearen Regression.

folgende User möchten sich bei daniel bedanken:
ElPresidente

ElPresidente · von **ElPresidente** » Do 8. Dez 2011, 19:24

vielen Dank erst mal!

Das Seminar ist durchaus von Relevanz, da es eine Note gibt, die mit 6 ECTS-Punkten im Master gewichtet wird. Reine Scheinseminare gibt es nach dem Bologna-Prozess bei uns nicht mehr. Jede Leistung wird benotet und zählt zum Schnitt.

Die lineare Regression, also eine quasimetrische Behandlung der ordinal skalierten AV, wurde auf Nachfrage vom Betreuer ausgeschlossen, d.h. sie kommt daher nicht mehr in Frage. Somit fällt meine Entscheidung wohl auf die ordinale Regression.

Mein größtes Problem, das ich derzeit noch habe, ist, wie ich mit meinen Dimensionen (UV´s) umgehen soll. Was würdet ihr vorschlagen? Ich habe die Möglichkeiten aus meiner Sicht nachfolgend zusammengefasst.

1. Möglichkeit: den Median bilden aus den beantworteten Items und diesen Wert als metrisch auffassen und in die ordinalen Regression als eine Kovariate einbinden
2. Möglichkeit: wie 1. nur das arithmetische Mittel bilden
3. Möglichkeit: den Median bilden aus den beantworteten Items und diesen Wert als ordinal skaliert auffassen und in die ordinalen Regression als ein Faktor einbinden
4. Möglichkeit: wie 3. nur das arithmetische Mittel bilden

daniel · von **daniel** » Fr 9. Dez 2011, 00:28

ElPresidente hat geschrieben:Mein größtes Problem, das ich derzeit noch habe, ist, wie ich mit meinen Dimensionen (UV´s) umgehen soll. Was würdet ihr vorschlagen?

Fehlende Werte imputieren oder listwise deletion. Du kannst m.E. nicht einfach den Mittelwert (oder sonst was bilden) und dabei einfach ignorieren, dass Du fehlende Werte hast.
Angenommen Du hast 3 Items, Wertebreich jeweils von 1-7. Person A gibt an 1, 2, 6. Person B gibt an 7, missing, 2. Beide haben einen Mitelwert von 9, aber sind sich die beiden Personen hinsichtlich der zu messenden Dimension tatsächlich ähnlich bzw. sogar identisch? Ich hätte da Zweifel und "sauber" ist das m.E. nicht.

Bilde Summenscores oder lass Dir Faktorscores generieren und behandele die resultierende Skala als metrischen Prädikator.

folgende User möchten sich bei daniel bedanken:
ElPresidente

ElPresidente · von **ElPresidente** » Di 13. Dez 2011, 01:29

Beim Prüfen der zentralen Voraussetzungen der ordinalen Regression mit SPSS habe ich festgestellt, dass der Parallelitätstest für Linien signifikant ist. Muss ich mich deshalb für eine andere Methode entscheiden? Der Betreuer hat z.B. nun binäre logistische Regression vorgeschlagen.

daniel · von **daniel** » Di 13. Dez 2011, 12:35

ElPresidente hat geschrieben:[...] Parallelitätstest für Linien signifikant ist. Muss ich mich deshalb für eine andere Methode entscheiden?

Ja.

Eine Möglichkeit ist natürlich die binäre logitische Regression, die allerdings einen Haufen an Informationen verwirft wesshalb man sich zurecht fragen darf, wo dann der große Vorteil zum linearen Modell liegt. Aber Du wirst Dich nicht mit dem Dozenten rumstreiten wollen.

Du könntest auch ein multinomisches Modell schätzen, wobei die Interpretation da eher "hässlich" ist. Es gibt auch "Zwischenlösungen", die die parallel odds assumption für ausgewählte Parameter aufheben, aber ich fürchte sowas ist in SPSS nicht implementiert.

In Deiner Situation würde ich wohl ein binäres Modell schätzen. Mach ein paar Sensitivitätsanalysen (i.e. splitte die AV an verschiedenen Stellen) um die Stabilität der Ergebnisse aubschätzen zu können.

folgende User möchten sich bei daniel bedanken:
ElPresidente

ElPresidente · von **ElPresidente** » Di 13. Dez 2011, 19:31

Da ich die ordinale Regression noch nicht gänzlich abschreiben wollte, habe ich ein paar Variationen am Modell vorgenommen.

Immerhin bin ich darauf gestoßen, dass bei einer bestimmten Auswahl bzw. Kombination von uV´s (es kommen eine Vielzahl in Frage, ich bin auch soweit flexibel) der Parallelitätstest wie gewünscht nicht signifikant ist. Warum auch immer?!

Allerdings weist dann die Tabelle zur Anpassungsgüte (Pearson) eine Signifikanz aus, die nicht erwünscht ist. Ich vermute, dass dies auf die hohe Anzahl leerer Zellen (Null-Häufigkeiten) zurückzuführen ist. Bei mir sind es um die 80 %, was wohl durch die vielen Kovariaten im Modell zu erklären ist. Welche Veränderungen am Modell könnte ich denn noch vornehmen? Die uV´s sind ja MW mehrerer ordinal skalierter Items (s.o.), d.h. ich binde sie als Kovariaten im Modell ein.

P.S.: Ich würde gerne an der ordinalen Regression. Notfalls könnte ich ja auf Litmitationen der Auswertung verweisen. Oder nicht?!

daniel · von **daniel** » Di 13. Dez 2011, 20:28

Immerhin bin ich darauf gestoßen, dass bei einer bestimmten Auswahl bzw. Kombination von uV´s (es kommen eine Vielzahl in Frage, ich bin auch soweit flexibel) der Parallelitätstest wie gewünscht nicht signifikant ist. Warum auch immer?!
[...]
Welche Veränderungen am Modell könnte ich denn noch vornehmen?
[...]
Ich würde gerne an der ordinalen Regression. Notfalls könnte ich ja auf Litmitationen der Auswertung verweisen. Oder nicht?!

Das klingt für mich alles nach schlechter Wissenschaft, deshalb möchte ich dazu auch nicht viel sagen. Nur soviel: die Fragestellung und die Theorie sollten das Modell bestimmen, nicht umgekehrt.

STATISTIK-FORUM.de

Ordinale Regression

Ordinale Regression

Re: Ordinale Regression

Re: Ordinale Regression

Re: Ordinale Regression

Re: Ordinale Regression

Re: Ordinale Regression

Re: Ordinale Regression

Re: Ordinale Regression

Wer ist online?