STATISTIK-FORUM.de

Tommo · von **Tommo** » Fr 5. Jan 2024, 10:47

Hallo!
Ich möchte für meine Abschlussarbeit mehrere t-Tests durchfrühren. Es geht um eine Think-Aloud Studie, bei welcher bestimmte Gefühle verbalisiert wurden und ich möchte mir die unterschiedlichen verbalisierten Emotionen in zwei Gruppen angucken. Jetzt habe ich das Problem, dass eine Gruppe bestimmte Emotionen hauptsächlich garnicht verbalisiert haben, aber einzelne Personen 1-2 Äußerungen darüber getätigt haben. Diese Werte werden mir jetzt bei der Boxplot Analyse als Ausreißer angezeigt. Auch die Normalverteilung ist nicht gegeben. Hat jemand eine Idee, was ich stattdessen berechnen könnte? Wäre Bootstrapping hier eine Option (Wegen der Verletzung der Normalverteilung und um den Einfluss der Ausreißer transparent zu machen?) oder wird Bootstrapping bei t-Tests garnicht angewendet?
Wäre sehr Dankbar für Hilfestellungen.

Viele Grüße.

bele · von **bele** » Fr 5. Jan 2024, 11:19

Hallo Tommo,

ich habe noch nicht verstanden, was da genau für Werte anfallen. Ja, man kann auch Mittelwertvergleiche durch Bootstrapping machen, aber das erscheint mir unüblich. Wahrscheinlich deshalb, weil es mit dem Wilcoxon Rangsummentest eine gute Nichtparametrische Alternative zum t-Test für unverbundene Stichproben und mit dem Wilcoxon Vorzeichenrangtest eine gute Alternative zum T-Test für verbundene Stichproben gibt die schon älter als das Bootstrapping und deshalb etablierter sind.
Ändert nichts dran, dass Du das auch bootstrappen kannst.

Ob für Deine Daten ein t-Test die beste Auswertung ist und ob Ausreißer im Boxplot als Problem aufzufassen sind und wie Bootstrapping bei n = 2 aussehen soll, dazu habe ich bewusst nichts geschrieben. Wenn Du dazu mehr wissen willst, musst Du die Studie und die Fragestellung genauer darstellen.

LG,
Bernhard

folgende User möchten sich bei bele bedanken:
Tommo

Tommo · von **Tommo** » Fr 5. Jan 2024, 11:56

Hallo und vielen Dank für die schnelle Antwort! Entschuldigung ich hätte es wahrscheinlich genauer erklären sollen, ich kenne mich mit dem ganzen nicht so aus. Ich habe zwei Gruppen mit jeweils 70 Probandinnen. Diese haben in einer Übung die Aufgabe bekommen die eigenen Gefühle und Gedanken frei zu verbalisieren. Wir haben das ganze dann transkribiert und codiert. Jetzt habe ich beispielsweise Variablen wie die Gefühle, die geäußert wurden. Ich möchte jetzt quantitativ mit den Daten weiterarbeiten. Ich habe jetzt Daten wie Person X hat 2 Äußerungen getätigt, die darauf hinweisen, dass sie traurig war. Also quasi wie häufig jede einzelne Probandin ein bestimmtes Gefühl geäußert hat. Mein Problem ist jetzt dass in einer Gruppe die Emotion Angst z.B. nur von einzelnen Personen 2-3 Mal geäußert wurde und von den restlichen Probandinnen garnicht, dementsprechend sind diese Personen die es geäußert haben nun Ausreißer. Weil die meisten Personen 0 angegeben haben, sieht die Verteilung von den Daten auch entsprechend aus. Ist das verständlich? Ich weiß nicht so genau wie ich es erklären soll.

bele · von **bele** » Fr 5. Jan 2024, 17:13

Hallo Tommo,

Ich habe zwei Gruppen mit jeweils 70 Probandinnen.

Das ist doch schon mal ganz ordentlich. Da kann man was mit rechnen.

Ich habe jetzt Daten wie Person X hat 2 Äußerungen getätigt, die darauf hinweisen, dass sie traurig war.

Ok, das war mir nicht klar. Du hast also zwei Mal 70 Personen und für jede Person und ein geschlossenes Set an Emotionen je eine ganze Zahl größer Null wie oft sie erwähnt wurden.

Mein Problem ist jetzt dass in einer Gruppe die Emotion Angst z.B. nur von einzelnen Personen 2-3 Mal geäußert wurde und von den restlichen Probandinnen garnicht, dementsprechend sind diese Personen die es geäußert haben nun Ausreißer.

Ich sehe das Problem weniger darin, dass das Ausreißer sind. Sagen wir, von 70 Personen haben 3 über Angst gesprochen. Mein Computer sagt, ein 95%-Konfidenzintervall für den wahren Anteil der Menschen mit Angstangabe reicht von 0,9% bis 12%. Also irgendwas von weniger als jeder Hundertste bis fast jeder Achte ist ein plausibler Wert. Und ganz sicher ist es damit verträglich, dass in der anderen Gruppe kein entsprechendes Ereignis vorkam. Ich würde also nicht sagen, dass diese zwei oder drei Werte Ausreißer sind, ich würde sagen, dass Angstangabe ein seltenes Ereignis war, dass deshalb mit der Stichprobe nur sehr, sehr unpräzise untersucht werden kann.

Weil die meisten Personen 0 angegeben haben, sieht die Verteilung von den Daten auch entsprechend aus. Ist das verständlich? Ich weiß nicht so genau wie ich es erklären soll.

Du hast wahrscheinlich zwei verschiedene Mechanismen, die zu einer Null führen können: Menschen, die bei der Frage gar nicht darüber nachgedacht haben, dass sie Angst beschreiben könnten und dann Menschen, die daran gedacht, sich aber inhaltlich dagegen entschieden haben. Solche Modelle nennt man zero-inflated. Es gibt spezielle für zero-inflated Daten, aber das ist alles ein wenig komplizierter und Du hast ja geschrieben, dass Du Dich nicht gut auskennst.

t-Tests sind eigentlich gemacht für den Mittelwertsvergleich von zwei Gruppen, deren Werte aus Normalverteilungen mit gleicher Varianz gezogen wurden. Deine Werte sind immer Null oder positiv und immer ganzzahlig und die Null kommt super häufig vor -- das ist weit weg von Normalverteilung. Praktisch hat sich aber gezeigt, dass mit größer werdendem Stichprobenumfang die Verteilungsform immer weniger wichtig wird. Mit 70 Personen in der kleineren Gruppe denke ich, dass man den Vergleich mittels t-Test vertreten kann.

Du wirst Deine Arbeit ja irgendwie verteidigen müssen, sei es gegenüber einem Professor, einem Vorgesetzten oder einem Zeitschriftenreviewer. Willst Du da das Bootstrapping verteidigen? Wenn ja, welche Software würdest Du für das Bootstrapping nehmen?

Ich habe hier ein Beispiel in R für Dich. Wir gehen davon aus, dass 2 von 70 Personen jeweils den Wert 2 angegeben haben. Dann würde ich die Verteilung der Mittelwerte in den Bootstrap-Samples wie folgt bestimmen:

Code: Alles auswählen: # Stichprobe mit 2 mal zwei und 86 mal 0: sp <- c(2, 2, rep(0,68)) # daraus ziehen wir jetzt 1.000.000 Bootstrap samples und bestimmen deren Mittelwert bss <- replicate(1000000, round(mean(sample(sp, 70, 1)), 4)) # und das tabellieren wir jetzt table(bss) #> bss #> 0 0.0286 0.0571 0.0857 0.1143 0.1429 0.1714 0.2 0.2286 0.2571 0.2857 #> 131675 270691 274734 183138 89972 34908 11141 2863 716 132 24 #> 0.3143 #> 6

GLG,
Bernhard

folgende User möchten sich bei bele bedanken:
Tommo

bele · von **bele** » Fr 5. Jan 2024, 17:29

bele hat geschrieben:Hallo Tommo,

Ich habe zwei Gruppen mit jeweils 70 Probandinnen.

Das ist doch schon mal ganz ordentlich. Da kann man was mit rechnen.

Ich habe jetzt Daten wie Person X hat 2 Äußerungen getätigt, die darauf hinweisen, dass sie traurig war.

Ok, das war mir nicht klar. Du hast also zwei Mal 70 Personen und für jede Person und ein geschlossenes Set an Emotionen je eine ganze Zahl größer Null wie oft sie erwähnt wurden.

Mein Problem ist jetzt dass in einer Gruppe die Emotion Angst z.B. nur von einzelnen Personen 2-3 Mal geäußert wurde und von den restlichen Probandinnen garnicht, dementsprechend sind diese Personen die es geäußert haben nun Ausreißer.

Ich sehe das Problem weniger darin, dass das Ausreißer sind. Sagen wir, von 70 Personen haben 3 über Angst gesprochen. Mein Computer sagt, ein 95%-Konfidenzintervall für den wahren Anteil der Menschen mit Angstangabe reicht von 0,9% bis 12%. Also irgendwas von weniger als jeder Hundertste bis fast jeder Achte ist ein plausibler Wert. Und ganz sicher ist es damit verträglich, dass in der anderen Gruppe kein entsprechendes Ereignis vorkam. Ich würde also nicht sagen, dass diese zwei oder drei Werte Ausreißer sind, ich würde sagen, dass Angstangabe ein seltenes Ereignis war, dass deshalb mit der Stichprobe nur sehr, sehr unpräzise untersucht werden kann.

Weil die meisten Personen 0 angegeben haben, sieht die Verteilung von den Daten auch entsprechend aus. Ist das verständlich? Ich weiß nicht so genau wie ich es erklären soll.

Du hast wahrscheinlich zwei verschiedene Mechanismen, die zu einer Null führen können: Menschen, die bei der Frage gar nicht darüber nachgedacht haben, dass sie Angst beschreiben könnten und dann Menschen, die daran gedacht, sich aber inhaltlich dagegen entschieden haben. Solche Modelle nennt man zero-inflated. Es gibt spezielle für zero-inflated Daten, aber das ist alles ein wenig komplizierter und Du hast ja geschrieben, dass Du Dich nicht gut auskennst.

t-Tests sind eigentlich gemacht für den Mittelwertsvergleich von zwei Gruppen, deren Werte aus Normalverteilungen mit gleicher Varianz gezogen wurden. Deine Werte sind immer Null oder positiv und immer ganzzahlig und die Null kommt super häufig vor -- das ist weit weg von Normalverteilung. Praktisch hat sich aber gezeigt, dass mit größer werdendem Stichprobenumfang die Verteilungsform immer weniger wichtig wird. Mit 70 Personen in der kleineren Gruppe denke ich, dass man den Vergleich mittels t-Test vertreten kann.

Du wirst Deine Arbeit ja irgendwie verteidigen müssen, sei es gegenüber einem Professor, einem Vorgesetzten oder einem Zeitschriftenreviewer. Willst Du da das Bootstrapping verteidigen? Wenn ja, welche Software würdest Du für das Bootstrapping nehmen?

Ich habe hier ein Beispiel in R für Dich. Wir gehen davon aus, dass 2 von 70 Personen jeweils den Wert 2 angegeben haben. Dann würde ich die Verteilung der Mittelwerte in den Bootstrap-Samples wie folgt bestimmen:

Code: Alles auswählen
# Stichprobe mit 2 mal zwei und 86 mal 0: sp <- c(2, 2, rep(0,68)) # daraus ziehen wir jetzt 1.000.000 Bootstrap samples und bestimmen deren Mittelwert bss <- replicate(1000000, round(mean(sample(sp, 70, 1)), 4)) # und das tabellieren wir jetzt table(bss) #> bss #> 0 0.0286 0.0571 0.0857 0.1143 0.1429 0.1714 0.2 0.2286 0.2571 0.2857 #> 131675 270691 274734 183138 89972 34908 11141 2863 716 132 24 #> 0.3143 #> 6

In der Gruppe, in der alle einen Wert von 0 hatten hat natürlich auch jedes Bootstrap-Sample einen Wert von Null.

GLG,
Bernhard

PonderStibbons · von **PonderStibbons** » Fr 5. Jan 2024, 20:57

Es geht um eine Think-Aloud Studie, bei welcher bestimmte Gefühle verbalisiert wurden und ich möchte mir die unterschiedlichen verbalisierten Emotionen in zwei Gruppen angucken.

Und wie lautet die konkrete Fragestellung der Studie? Wie viele Emotionen wurden betrachtet?

Wie gehen bisherige Studien in dem Bereich vor? Niederfrequente Reaktionen wird es vorher schon gegeben haben. Oder etwa nicht?

Mit freundlichen Grüßen

PonderStibbons

strukturmarionette · von **strukturmarionette** » Fr 5. Jan 2024, 23:00

https://www.uni-muenster.de/Wissenschaf ... lleRV.html

Tommo · von **Tommo** » Mo 8. Jan 2024, 12:42

@bele
Vielen Dank für das Erstellen des R Codes! Tatsächlich sollen wir SPSS benutzen, ich denk das kriege ich hin, da ist es ja relativ leicht, wenn ich mich richtig erinnere.
Verteidigen muss ich die Arbeit nicht, wir sollen aber auf Test Voraussetzungen im Ergebnisteil eingehen und schreiben, wie wir mit diesen Verletzungen umgegangen sind und ich dachte wenn die Vorraussetzung der Normalverteilung nicht gegeben ist und es auch noch diese Situation mit den seltenen Werten gibt, könnte Bootstrapping zumindest zeigen dass ich versucht habe die verletzten Voraussetzungen "auszugleichen". Vielleicht ist dies aber dann auch garnicht unbedingt notwendig, wenn die Verletzung der Normalverteilung kein so großes Problem ist wenn die Stichprobe nicht zu klein ist.

Tommo · von **Tommo** » Mo 8. Jan 2024, 12:54

@PonderStibbons
Fragestellung ist, ob klinische Probandinnen spezifische Emotionen mehr wahrnehmen während der Übung als gesunde Probandinnen und wir schauen uns 13 Emotionen an.

Bezüglich vorheriger Studien habe ich keine Studie gefunden, die die Emotionen qulitativ gemessen hat und ob bestimmte Emotionen auch niederfrequent angegeben wurden, wurde in den Studien, die ich gelesen habe, nicht thematisiert.

bele · von **bele** » Di 9. Jan 2024, 17:13

Tommo hat geschrieben:@bele könnte Bootstrapping zumindest zeigen dass ich versucht habe die verletzten Voraussetzungen "auszugleichen".

Hmm, ja. Nun hat Bootstrapping sicher keine Normalverteilung zur Voraussetzung, dass bedeutet aber nicht, dass Bootstrapping gar keine Voraussetzungen hat. Meine bisherige Suche nach Voraussetzungen einer Bootstrap-Testung ist bisher unbefriedigend im Sande verlaufen. Da steht dann meistens, dass die Stichprobe aus der man sampled repräsentativ für die Grundgesamtheit sein muss. Aber wann ist sie das? Und kann eine Stichprobe aus lauter Nullen repräsentativ sein? Wenn ich in einer Gruppe nur lauter Nullen sample, hier wird bei beliebig vielen Bootstrapsamples der Mittelwert dieser Gruppe immer ganz genau Null sein, obwohl ich ja davon ausgehen muss, dass es noch irgendeinen anderen Wert als Null in dieser Grundgesamtheit geben sollte.

Offensichtlich macht es einen Unterschied, ob ich in einer Gruppe acht Mal eine Null gesampled habe oder 800 Mal. Beim Bootstrapping kommen aber immer die gleichen Bootstrapsamples heraus. Wie gesagt, ich habe dazu noch nichts belastbares gelesen, aber ich habe ein schlechtes Bauchgefühl dabei. Bei einem Permutationstest wäre mein Bauchgefühl nicht ganz so schlecht, aber auch da wäre ich für einen kritischen Lesehinweis zu den Voraussetzungen dankbar.

Ansonsten bleibt es dabei, dass ein Rangsummentest ebenfalls keine Normalverteilung unterstellt und viel üblicher ist. (Da würde ich aber auch noch Literaturvorschläge annehmen, was da genau passiert, wenn es so viele Bindungen gibt. Man darf aber wohl unterstellen, dass die Hersteller von SPSS sich darüber Gedanken gemacht haben.)

LG,
Bernhard

STATISTIK-FORUM.de

Bootstrapping bei einem t-Test?

Bootstrapping bei einem t-Test?

Re: Bootstrapping bei einem t-Test?

Re: Bootstrapping bei einem t-Test?

Re: Bootstrapping bei einem t-Test?

Re: Bootstrapping bei einem t-Test?

Re: Bootstrapping bei einem t-Test?

Re: Bootstrapping bei einem t-Test?

Re: Bootstrapping bei einem t-Test?

Re: Bootstrapping bei einem t-Test?

Re: Bootstrapping bei einem t-Test?

Wer ist online?