Vergleich der Mittelwerte verschiedener Items

Univariate Statistik.

Vergleich der Mittelwerte verschiedener Items

Beitragvon MrVodoo » So 7. Jan 2018, 19:42

Hallo,

ich schreibe derzeit eine Abschlussarbeit die einen Fragebogen umfasst und habe dazu drei Fragen zur statistischen Auswertung, die mir durch Lehrbücher nicht ganz klar wurden.
Kurz zur Erhebung:
An der Umfrage haben etwa 40 Unternehmen teilgenommen. Es wurden verschiedene Gründe (12 genau genommen) für eine Investition vorgegeben und die Teilnehmer sollten jeweils auf einer Rating Skala (5 Stufen: von stimme überhaupt nicht zu bis stimme vollkommen zu) einschätzen, welche davon aus Ihrer Sicht für eine Investition sprechen.

Frage 1: Eigentlich habe ich ja nur ordinal skalierte Daten, kann also keine Mittelwerte nutzen. Nun sagen aber viele Lehrbücher, dass man bei einer 5 Stufigen Ratingskala durchaus von intervallskalierten Daten ausgehen könnte (auch wenn mathematisch nicht korrekt). Normalverteilt sind die Daten aber sowieso nicht (wenn ich es richtig verstanden habe geht das bei einer solchen Skala auch gar nicht), ein T-Test fällt somit ohnehin raus (oder?). Daher kommen ja ohnehin nur Tests wie der Wilcoxon-Test in Frage, die gar keine Intervallskalierung brauchen. Ist es dennoch vertretbar Mittelwert und SD anzugeben? Das eine Buch sagt ja, das andere nein?!

Frage 2: Nun möchte ich untersuchen, ob bestimmte Gründe eine stärkere Zustimmung erfahren als andere, also die "Mittelwerte" vergleichen. Daher kommt nach meinem Verständnis ein Test für abhängige Stichproben in Frage. Nehme ich nun aber einen Test für 2 abhängige Stichproben (also Wilcoxon-Test) und teste die verschiedenen Gründe jeweils paarweise (mache den Test also öfter) oder nehme ich einen Test für mehr als 2 Stichproben, d.h. den Friedman-Test?? ANOVA mit Messwiederholung fällt raus wegen fehlender Normalverteilung, oder?

Frage 3 (hat aber nichts mehr mit Mittelwerten zu tun): Neben den Gründen für eine Investition wurde als erstes noch eine allgemeine Einschätzung zur Attraktivität der Investitionsmöglichkeit erfragt, wieder mit einer 5 Stufigen Rating Skala (Gold ist eine attraktive Anlagemöglichkeit --> stimme vollkommen zu bis stimme überhaupt nicht zu). Nun möchte ich gerne ergründen, welcher der Investitionsgründe am meisten dazu beiträgt, dass die Investition als attraktiv wahrgenommen wird. Ist es richtig, dass dazu eine Multiple Regressionsanalyse geeignet ist (Problem auch hier wieder die fehlende Intervallskalierung, oder?) oder gibt es einen anderen Test?
MrVodoo
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 7. Jan 2018, 17:45
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Vergleich der Mittelwerte verschiedener Items

Beitragvon PonderStibbons » So 7. Jan 2018, 21:03

Frage 1: Eigentlich habe ich ja nur ordinal skalierte Daten, kann also keine Mittelwerte nutzen. Nun sagen aber viele Lehrbücher, dass man bei einer 5 Stufigen Ratingskala durchaus von intervallskalierten Daten ausgehen könnte (auch wenn mathematisch nicht korrekt).

Meistens ist damit eine echte Skala gemeint (die aus mehreren Items besteht), nicht die Antwortskala eines einzelnen Items. Allerdings gibt es darüber erschreckend viel Konfusion.

Man könnte einfach den Median verwenden.

Normalverteilt sind die Daten aber sowieso nicht (wenn ich es richtig verstanden habe geht das bei einer solchen Skala auch gar nicht), ein T-Test fällt somit ohnehin raus (oder?).

t-Tests sind für Mittelwerte. Ist die Skala ordinal, gibt es keine Mittelwerte.

Nebenbei verlangen t-Tests keine normalverteilten Variablen. Allenfalls sollen innerhalb der beiden Gruppen die Werte einer Normalverteilung entstammen. Bzw. bei abhängigen Stichproben sollten die Differenzwerte einer Normalverteilung entstammen, nicht die Ausgangsvariablen. Und das alles ist auch nur wichtig, wenn die Gesamtstichprobe klein ist (n < 30).

Nehme ich nun aber einen Test für 2 abhängige Stichproben (also Wilcoxon-Test)

Der erfordert intervallskalierte Variablen, was interessanterweise selten erwähnt wird. Du kannst einen Friedman nehmen und als post-hoc Test für paarweise Vergleiche den Vorzeichentest.
Ist es richtig, dass dazu eine Multiple Regressionsanalyse geeignet ist (Problem auch hier wieder die fehlende Intervallskalierung, oder?)

Ja, mag sein. Ist aber vergleichsweise anspruchsvoll und erfordert mehr als ein Mindestmaß an Vorkenntnissen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
MrVodoo

Re: Vergleich der Mittelwerte verschiedener Items

Beitragvon bele » So 7. Jan 2018, 21:14

Hallo MrVodoo,

ich rate Dir dringend, Dir den Link anzuschauen, den ich in diesem Post gesetzt habe. Da steht nicht nur einiges zum Testen, vor allem ungewöhnliches und gutes zu Grafiken. Da ist bestimmt was für Dich dabei:
nutzung-des-forums-f44/likertskalen-und-anderes-t9192.html#p35642

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

folgende User möchten sich bei bele bedanken:
MrVodoo

Re: Vergleich der Mittelwerte verschiedener Items

Beitragvon MrVodoo » Mo 8. Jan 2018, 14:57

Hallo ihr beiden,

vielen Dank für die Antworten!
Ich habe mir die Links angesehen und verstehe durchaus, dass die Annahme einer Intervallskalierung problematisch ist (auch wenn ich viele Bücher habe, die explizit sagen, es gehe auch, wenn man keine echte Skala hat, sondern nur einzelne Items). Daher würde ich gerne die Daten auch nur als ordinalskaliert behandeln.

Nehme ich nun aber einen Test für 2 abhängige Stichproben (also Wilcoxon-Test)
Der erfordert intervallskalierte Variablen, was interessanterweise selten erwähnt wird. Du kannst einen Friedman nehmen und als post-hoc Test für paarweise Vergleiche den Vorzeichentest.


Reden wir da wirklich vom gleichen Wilkoxon Test (Wilcoxon-Vorzeichen-Rang-Test)? Mein Statistikbuch (Leonhardt: Lehrbuch Statistik, 2013) sagt explizit, es werden nur ordinalskalierte Variablen benötigt und der Test sei "besser" als der Vorzeichentest. Habe ich unter anderem auch hier gefunden: http://www.ipd.uka.de/Tichy/uploads/fol ... lcoxon.pdf oder hier http://www.methodenberatung.uzh.ch/de/d ... koxon.html

Wenn ich nun den Friedman Test für 10 meiner Items nehme, dann wird dieser signifikant (p<.0001), irgendwelche Items unterscheiden sich also. Problematisch dabei ist, dass als Mediane 4 mal eine 3, 5 mal eine 4 und ein mal eine 3,5 raus kommen. So richtig gibt mir das also keinen Anhaltspunkte welche paarweisen Vergleiche ich durchführen sollte. Ich kann aber auch nicht "alles mit allem" vergleichen, da es dann zu einer Kumulierung der Alpha-Fehler kommt (korrekt?). Um das zu umgehen habe ich zwei Verfahren gefunden: Die Bonferroni-Korrektur und die Bonferroni-Holm-Korrektur. Da ich ja recht viele Vergleiche durchführe würde ich jetzt die Bonferroni-Holm-Korrektur nutzen, da weniger konservativ.
Habe ich das soweit alles richtig verstanden? Oder ist es alternativ besser mit Hilfe einer Betrachtung der Perzentile zu versuchen, bestimmte Vergleiche auszuwählen, damit nicht alles mit allem getestet werden muss?


Ist es richtig, dass dazu eine Multiple Regressionsanalyse geeignet ist (Problem auch hier wieder die fehlende Intervallskalierung, oder?)

Ja, mag sein. Ist aber vergleichsweise anspruchsvoll und erfordert mehr als ein Mindestmaß an Vorkenntnissen.


Ja, seh ich ein. Ich lese mich erstmal intensiv ein und komme dann später darauf zu zurück.
MrVodoo
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 7. Jan 2018, 17:45
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Vergleich der Mittelwerte verschiedener Items

Beitragvon PonderStibbons » Mo 8. Jan 2018, 15:18

Reden wir da wirklich vom gleichen Wilkoxon Test (Wilcoxon-Vorzeichen-Rang-Test)? Mein Statistikbuch (Leonhardt: Lehrbuch Statistik, 2013) sagt explizit, es werden nur ordinalskalierte Variablen benötigt und der Test sei "besser" als der Vorzeichentest.

Wenn man sich den Grundgedanken und die Formel zur Berechnung ansieht, wird unmittelbar klar, dass das mit Ordinaldaten gar nicht geht.
Siehe auch z.B. https://stats.stackexchange.com/questio ... -rank-test

Ich kann aber auch nicht "alles mit allem" vergleichen, da es dann zu einer Kumulierung der Alpha-Fehler kommt (korrekt?).

Wenn Du Dir nur die markante Unterschiede zum testen rauspickst, hast Du bereits jede Menge
Paarvergleiche quasi nach Augenschein durchgeführt, insofern bist Du immer bei 45 Paarvergleichen.

Ob man die Kumulierung berücksichtigen muss in Form einer Korrektur des Signifikanzniveaus, ist
Ansichtssache. Bonferroni wäre sehr streng. Manche Experten meinen, es sei wenig sinnvoll, die
post-hoc Paarvergleiche zu korrigieren, wenn der Globaltest "statistisch signifikant" ausfiel. Ich
bevorzuge meist einen Mittelweg (p < 0,01 als statistische Signifikanzschwelle).

Um das zu umgehen habe ich zwei Verfahren gefunden: Die Bonferroni-Korrektur und die Bonferroni-Holm-Korrektur. Da ich ja recht viele Vergleiche durchführe würde ich jetzt die Bonferroni-Holm-Korrektur nutzen, da weniger konservativ.

Das bringt hier vielleicht nicht viel, aber besser als Bonferroni.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Vergleich der Mittelwerte verschiedener Items

Beitragvon MrVodoo » Mo 8. Jan 2018, 16:22

Erneut vielen Dank, so langsam macht Statistik sogar Spaß :-)

Zum Abschluss noch eine kurze Frage, zur Kontrolle ob ich alles verstanden habe:
Ich möchte nicht nur sagen, welche Gründe, sich (signifikant) unterscheiden, sondern auch, welche Gründe die höchste Zustimmung erfahren (und damit am bedeutsamsten sind). Angenommen der Vorzeichen Test ist signifikant: Wenn die Mediane eines Paares sich nun nicht unterscheiden, dann schaue ich mir die Quartile an und wenn die sich auch nicht unterscheiden, dann die Perzentile und begründe so, welchem Grund mehr Zustimmung zu teil wird. Richtig?

Wenn ja, kann ich mich der Korrelation und Regression widmen :-)
MrVodoo
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 7. Jan 2018, 17:45
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Vergleich der Mittelwerte verschiedener Items

Beitragvon PonderStibbons » Mo 8. Jan 2018, 17:02

Du schaust Dir das Vorzeichen der Teststatistik an.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Vergleich der Mittelwerte verschiedener Items

Beitragvon MrVodoo » Sa 20. Jan 2018, 13:35

Hallo,
das Problem der ordinalskalierten Daten lässt mich nicht los.

Nachdem ich mich weiter eingelesen habe, habe ich in vielen Büchern die Aussage gefunden (zumindest habe ich sie so verstanden), dass im Rahmen u.a. einer Regressionsanalyse meine 5 Stufige Skala doch als intervallskaliert betrachtet werden könnte.
Auch online findet man das oft, z.B. hier: http://www.people.vcu.edu/~pdattalo/702 ... asure.html
"In regard to our use of (insert name of procedure), which assumes interval data, with ordinal Likert scale items, in a recent review of the literature on this topic, Jaccard and Wan (1996: 4) summarize, for many statistical tests, rather severe departures (from intervalness) do not seem to affect Type I and Type II errors dramatically (Jaccard & Wan, 1996)."

Ich habe nun auch schon das Vorgehen gesehen, keine Mittelwerte und co. angegeben wurden, aber dennoch likert scale items als Prädiktoren einer multiplen Regressionsanalyse genutzt wurden. Aber ist das nicht irgendwie inkonsistent??
Weiß jemand eine Alternative?
MrVodoo
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 7. Jan 2018, 17:45
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post


Zurück zu Mittelwert, Standardabweichung & Co.

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste