Hilfe für meine Bachelorarbeit (R-Studio)

Hilfe für meine Bachelorarbeit (R-Studio)

Beitragvon Soffelixo » Do 17. Dez 2020, 01:20

Hallo zusammen,

ich sitze gerade an der statistischen Auswertung meiner Online Umfrage und stehe vor einem Rätsel...

Ich vergleiche zwei Gruppen - Jung (Gruppe 1, n= 258) und Alt (Gruppe 2, n=178).
Ich habe die Hypothese aufgestellt: Jüngere Beschäftigte bewerten die Überalterung der Bevölkerung als größere Herausforderung für die Zusammenarbeit zwischen Jung und Alt als ältere Beschäftigte
Somit lautet meine H0: Jüngere Beschäftigte bewerten die Überalterung der Bevölkerung gleichermaßen oder weniger als große Herausforderung für die Zusammenarbeit zwischen Jung und Alt als ältere Beschäftigte
Die möchte ich nun Überprüfen.

Zuerst habe ich anhand des Levene-Tests überprüft, ob die Varianzen gleich sind (ja, da F-Wert=0.5996) um zu prüfen ob ich den t-Test oder den Welch-Test anwenden muss.
Anschließend habe ich dann den t-Test durchgeführt

t.test(UeberalterungHerausforderungJungAlt~Altersgruppe, data=umfrage, var.equal=TRUE, alternative"greater")

und das Ergebnis des p-Werts beträgt: 1.455e-08 (siehe Bildanhang)
Da mein Bild leider nicht auftaucht, hier das Ergebnis abgetippt:

Two Sample t-test
data: UeberalterungHerausforderungJungAlt by Altersgruppe
t = 5.6499, dg = 434, p-value = 1.455e-08
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
0.4323136 Inf
sample estimates:
mean in group 1 / mean in group 2
2.941860 / 2.331461

Damit wäre das Ergebnis ja signifikant.
Nun sagt meine Grafik aber was anderes - dort sieht man, dass Ältere die Überalterung der Bevölkerung als größere Herausforderung für die Zusammenarbeit zwischen Jung und Alt ansehen.

Kann mir jemand sagen, was ich falsch gemacht haben könnte?
Hinter der Tabelle "UeberalterungHerausforderungJungAlt" steckt die Beantwortung 1= Trifft voll zu / 2= Trifft eher zu / 3= Neutral / 4=Trifft eher nicht zu / 5= Trifft gar nicht zu

Ich hoffe ich habe euch alle relevanten Informationen genannt :-)
Ansonsten gerne nochmal nachfragen.

Vielen lieben Dank!!
Soffelixo
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 17. Dez 2020, 01:05
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Hilfe für meine Bachelorarbeit (R-Studio)

Beitragvon bele » Do 17. Dez 2020, 09:29

Soffelixo hat geschrieben:
Code: Alles auswählen
Two Sample t-test
data: UeberalterungHerausforderungJungAlt  by  Altersgruppe
t = 5.6499, dg = 434, p-value = 1.455e-08
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
0.4323136    Inf
sample estimates:
mean in group 1 /  mean in group 2
           2.941860      /      2.331461


Damit wäre das Ergebnis ja signifikant.
Nun sagt meine Grafik aber was anderes - dort sieht man, dass Ältere die Überalterung der Bevölkerung als größere Herausforderung für die Zusammenarbeit zwischen Jung und Alt ansehen.

Kann mir jemand sagen, was ich falsch gemacht haben könnte?


Vordergründig hast Du vielleicht die Zuordnung zu group1 und group2 falsch gemacht oder unter alternative die falsche Option gesetzt. Was die Richtung angeht, würde ich Deiner Grafik trauen oder eben der Ansage von t.test, dass die group1 die höheren Werte hatte. Wahrscheinlich ist Deine Spalte Altersgruppe ein factor mit den Levels "jung" und "alt" und weil "alt" im Alphabet früher kommt hat R das intern als 1 und "jung" intern als 2 codiert während Du "jung" im Kopf als 1 und alt als Gruppe 2 betrachtest. Oder so was in der Art. Könnte man notalls mit relevel() anpassen, ist aber wohl den Aufwand nicht wert.

Der Vollständigkeit halber als Demo:
Code: Alles auswählen
> a <- factor(c("jung", "jung", "alt", "alt"))
> levels(a)
[1] "alt"  "jung"  # alphabetisch sortierte Reihenfolge
> a <- relevel(a, "jung") # setze "jung" als Basislevel
> levels(a)
[1] "jung" "alt"


Wahrscheinlich wichtiger: Aus dem R Output kann man entnehmen, dass Du einen einseitigen t-Test gerechnet hast. Dazu möchte ich Dir gerne einen Link setzen, den sonst PonderStibbons gerne setzt: https://psychologie.uni-graz.at/de/biol ... /faq/#FAQ3 lies dort mal unter FAQ3.
Das zweite was ich gerne anmerken möchte: Du hast da meiner Meinung nach Ordinaldaten und verwendest einen Test für metrische Daten. Da Deine Daten ja anscheinend sehr eindeutig sind würde ich vorschlagen, der Diskussion um angemessene und unangemessene Tests aus dem Weg zu gehen. Lade Dir dazu das Paket "exactRankTests" herunter und verwende die darin erhaltene Funktion wilcox.exact() für einen Rangsummentest.

JMTC,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: Hilfe für meine Bachelorarbeit (R-Studio)

Beitragvon Soffelixo » Do 17. Dez 2020, 14:20

Vielen Dank für die Unterstützung! :-)

Die Gruppen habe ich mit 1 (jung) und 2 (alt) codiert. Daher sollte der Fehler mE nicht daraus resultieren...
Ich frage mich ob die Nutzung "greater" richtig ist. Der Mittelwert der jüngeren Gruppe ist höher, als der Mittelwert der älteren Gruppe. Jedoch sagt höher nicht aus, dass sie der Aussage eher zu stimmen, sondern dass sie dieser eher nicht zustimmen... Vielleicht sollte ich es mal andersherum ausprobieren und "less" auswählen...!?

Denn wie ich schreib sind die Zuordnungen wie folgt:
1= Trifft voll zu / 2= Trifft eher zu / 3= Neutral / 4=Trifft eher nicht zu / 5= Trifft gar nicht zu

Bezüglich dem Rangsummentest habe ich noch eine Frage.
Weil ich eine Likert-Skala auswerte (ordinal), wäre es besser deiner Meinung nach besser die genannte Hypothese mit dem Wilcoxon Test zu testen?
Ist der gewählte t-Test somit falsch? Und sollte ich dann dennoch einen Varianztest durchführen?

Danke!! :-)
Soffelixo
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 17. Dez 2020, 01:05
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Hilfe für meine Bachelorarbeit (R-Studio)

Beitragvon bele » Do 17. Dez 2020, 14:33

Soffelixo hat geschrieben:Die Gruppen habe ich mit 1 (jung) und 2 (alt) codiert. Daher sollte der Fehler mE nicht daraus resultieren...


Ok, dann ist das eine Verwirrungsquelle weniger. Gruppe 1 (jung) hat demnach einen Durchschnitt von 2,9 in dieser Variable und Gruppe 2 (alt) hat einen Durchschnitt von 2,3 in dieser Gruppe.

Ich frage mich ob die Nutzung "greater" richtig ist. [...] Vielleicht sollte ich es mal andersherum ausprobieren und "less" auswählen...!?


Persönlich würde ich keines von beiden auswählen, was Du Dir nach Lesen von FAQ3 ja schon denken konntest.

Weil ich eine Likert-Skala auswerte (ordinal)


Vorsicht Wespennest. Sehr viele würden Dir widersprechen, dass das eine Likert-Skala sein soll. Werd ich jetzt hier nicht erklären, habe ich alles schon da erklärt: nutzung-des-forums-f44/likertskalen-und-anderes-t9192.html

, wäre es besser deiner Meinung nach besser die genannte Hypothese mit dem Wilcoxon Test zu testen?


Ich glaube, das habe ich unmissverständlich geschrieben.

Ist der gewählte t-Test somit falsch? Und sollte ich dann dennoch einen Varianztest durchführen?


Es gibt in der Statistik nicht nur schwarz und weiß. Nach meiner Einschätzung ist der t-Test ebenso falsch wie ein Varianztest, weil Ordinalskalen keine Mittelwerte und keine Varianzen haben. In der klassischen Testtheorie nimmt man dann eher willkürlich Äquidistanz an, um in der Itemanalyse trotzdem sowas zu rechnen, aber das ist glattes Eis. Warum solltest Du auf dieses glatte Eis gehen wollen?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: Hilfe für meine Bachelorarbeit (R-Studio)

Beitragvon Soffelixo » Do 17. Dez 2020, 14:45

Tatsächlich fühl ich mich im Bereich Statistik immer wie die Kuh auf dem Glatteis ... haha :-)
Es gibt so viele verschiedene Dinge zu beachten, unterschiedliche Vorgehensweisen.

Bis gestern dachte ich noch, meine Auswertungsmethode wäre soweit in sicheren Tüchern. Heute sieht es schon wieder anders aus... :-(
Danke für deine Hilfe. Ich werde nochmal mit meiner Betreuerin sprechen müssen.
Soffelixo
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 17. Dez 2020, 01:05
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Hilfe für meine Bachelorarbeit (R-Studio)

Beitragvon Soffelixo » Fr 18. Dez 2020, 21:09

Hallo zusammen,

ich hab tatsächlich nochmal eine Frage... :shock:

Ich habe ja zwei Gruppen (jung- codiert mit 1 /alt -codiert mit 2). Die Aussage meine Umfrage lautete "ich gebe Wissen gern an andere weiter" - die dann mit 1= trifft voll zu bis 5= trifft gar nicht zu beantwortet werden soll.
Nun hab ich die H1 und H0 gebildet:

H1: Jüngere Beschäftigte erhalten Wissen lieber als ältere Beschäftigte.
H0: Jüngere Beschäftigte erhalten gleich gern oder weniger gern Wissen als ältere Beschäftigte.

==> Heißt ich müsste einen einseitigen Wilcoxon Test bei unabhängigen Stichproben wählen.

1. Teste ich dann mit alternative="less" .. denn lieber heißt in diesem Fall ja, dass die Zahl kleiner sein muss.

wilcox.exact(Wissenoftanandere~Altersgruppe, data=umfrage, var.equal=TRUE, alternative="less")

2. Was genau vergleicht der Test? Immer den Median oder kann ich ihn auch hinsichtlich dem Mittelwert testen lassen?
3. Wenn ich die Aussage nun mit den älteren Beschäftigten getätigt hätte, die ja Gruppe 2 sind, hätte ich dann die Hypothese so umdrehen müssen, dass sie für die 1 Gruppe testet? Also Beispiel: Ältere Beschäftigte erhalten Wissen lieber als jüngere Beschäftigte. ==> alternative="greater" denn mit Bezug zur jüngeren Gruppe (1) wäre die Aussage ja, dass sie das Wissen weniger gern erhalten, weshalb die Zahl (median oder mean) größer sein müsste

Vielen lieben Dank für eure Hilfe!!
Soffelixo
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 17. Dez 2020, 01:05
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Hilfe für meine Bachelorarbeit (R-Studio)

Beitragvon PonderStibbons » Sa 19. Dez 2020, 11:39

Der Wilcoxon-Rangsummentest basiert auf Rängen und kann demnach keine
Mittelwerte vergleichen. Er vergleicht auch keine Mediane. Vielleicht suchst
Du eine Seite in R oder im Netz, wo er erklärt wird, die Sache ist ein bisschen
ungewohnt.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts


Zurück zu t-Test

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 14 Gäste

cron