Dringend Hilfe benötigt! :-) Chi-Test und Fisher's Exact Tes

Dringend Hilfe benötigt! :-) Chi-Test und Fisher's Exact Tes

Beitragvon Nemi » Mi 25. Jan 2012, 11:48

Liebe Statistikkundige,

Ich schreibe gerade an meiner Masterarbeit in englischer Sprachwissenschaft zum Thema "Geschlechterspezifische Verwendung von Adverbialsätzen in Scots (=Minoritätensprache in Schottland)". Ich untersuche dabei insbesondere, ob Männer dazu neigen, vorangestelle (also vor dem Hauptsatz stehende) Konzessivsätze zu benutzen während Frauen möglicherweise eher dazu neigen, nachgestellte Kausalsätze zu benutzen. Dazu habe ich zwei Datensätze, einen zum Thema Konzessivsätze und einen zum Thema Kausalsätze.
Eigentlich wollte ich gar keine quantitative Studie machen, nun ist es aber doch eine geworden und das Problem ist, dass ich in Mathe eigentlich eine totale Null bin.
Ich habe nun also die zwei Datensätze, von denen ich einen mit dem Chi-Quadrat-Test und den anderen mit dem Fisher Exact Test untersuchen kann (der Datensatz zu den Kausalsätzen enthält Zellen, in denen die Anzahl unter 5 liegt).
Das habe ich bereits getan und mir ist auch soweit klar, wie der Chi-Quadrat-Test funktioniert (wobei ich nicht wirklich verstehe, wie genau mir dieser Test diese Zahl ausspuckt, aber das muss ich vielleicht auch nicht alles verstehen). Ich muss allerdings sagen, ich habe nur einmal den Chi-Test zur Probe durchgerechnet und geguckt, ob ich auf das gleiche Ergebnis wie der Onlinerechner komme. Das hat auch geklappt.
Den Fisher-Test habe ich nur mit dem Online-Rechner gemacht und weiß, dass der 2-tails-p-value für mich ausschlaggebend ist.

Die erste Frage ist eine zum logischen Verständnis, womit es bei mir leider nicht sehr weit her ist.
Ich habe ja immer eine Nullhypothese, die besagt "Die Benutzung der unterschiedlichen Arten von Adverbialsätzen ist bei Männern und Frauen gleich." oder anders formuliert "Die Merkmale 'Position von Adverbialsätzen' und 'Geschlecht' sind unabhängig" oder noch anders formuliert "Die beobachteten und die erwarteten Häufigkeiten stimmen überein".
Meine Alternativhypothese wäre dann je nach Untersuchung (sind zwei, die nochmal aufgesplittet sind) "Männer benutzen mehr vorangestellte Konzessivsätze" oder "Frauen benutzen mehr nachgestelle Kausalsätze".

Wenn der Online-Chi-Test nun sagt, das Ergebnis sei nicht signifikant, heisst das dann also, dass die Nullhypothese zutrifft und die Verteilung ganz normal ist?
Außerdem spuckt der Test ja noch einen p-Wert aus. Wenn der z.B. bei 0,3768 (das sind dann nach meinem Verständnis etwa 4%) liegt, heisst das dann, dass die Wahrscheinlichkeit, dass die Nullhypothese zutrifft 4% oder 96% beträgt? Weil, wenn die Wahrscheinlichkeit 4% beträgt, verstehe ich nicht, warum man dann sagt dass die Hypothese zutrifft.
Aus den erwarteten Zahlen kann ich ablesen, dass es zumindest eine Tendenz gibt, dass meine Alternativhypothesen zutreffen, also das der Wert zB für Männer, die vorangestellte Konzessivsätze in meinen beobachteten Daten kleiner ist als der erwartete Wert und der Wert für nachgestellte Konzessivsätze größer ist als erwartet. Oder verstehe ich das falsch?
Nun weiß ich nicht, was mein Ergebnis ist.
Außerdem frage ich mich, ob ich das bei den Daten, für die ich den Fisher-Test brauche dann genauso sagen kann, oder sagt der p-Wert da etwas anderes aus?
Ich schreibe einfach nochmal die Daten meiner zwei Datensätze dazu.

Konzessivsätze (beobachtet): Frauen vorangestellt: 41, Männer vorangestellt 29; Frauen nachgestellt 65, Männer nachgestellt 60.
Kausalsätze (beobachtet): Frauen vorangestellt 4, Männer vorangestellt 4; Frauen nachgestellt 121, Männer nachgestellt 57.

Außerdem verstehe ich nicht so richtig, ob es jetzt ausschlaggebend ist, dass im zweiten Beispiel die Anzahl der von Männern geäußerten Sätze nur halb so groß ist wie die Anzahl der Sätze, die von Frauen formuliert wurden (125 vs. 61). Der Chi-Test berechnet doch eigentlich so, dass alles normalisiert wird, oder?

Das andere Problem ist die Gesamtzahl von Sprechern in meinem Korpus (=Textsammlung). Ich habe 147 weibliche Sprecher und nur 83 männliche. Das gibt mir eigentlich - so wie ich das verstehe - einen Hinweis darauf, dass Adverbialsätze im Großen und Ganzen von Frauen häufiger verwendet werden und verändert doch auch irgendwie die Sicht auf meine Daten, oder?
D.h. wenn mein ich bei den Konzessivsätzen etwa gleich viele Sätze für Frauen und Männer habe (105 vs. 89, was zumindest ausgeglichener ist als bei den Kausalsätzen), dann heisst es doch eigentlich, dass die Wahrscheinlichkeit, dass Männer diese Sätze benutzen höher ist, weil die Gesamtzahl der Männer, die zum Korpus beitragen kleiner ist, oder?

Ich bin wirklich aufgeschmissen und weiß ehrlich gesagt auch nicht, wo es bei mir hakt, dass ich die Zusammenhänge nicht interpretieren kann bzw. verunsichert bin und wäre SEHR, SEHR dankbar für Tipps und Anregungen.

Vielen Dank im Voraus,
Nemi
Nemi
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 25. Jan 2012, 10:51
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Dringend Hilfe benötigt! :-) Chi-Test und Fisher's Exact

Beitragvon PonderStibbons » Mi 25. Jan 2012, 12:55

Ich habe nun also die zwei Datensätze, von denen ich einen mit dem Chi-Quadrat-Test und den anderen mit dem Fisher Exact Test untersuchen kann (der Datensatz zu den Kausalsätzen enthält Zellen, in denen die Anzahl unter 5 liegt).

Die ERWARTETE Anzahl soll mindestens 5 betragen. In Deinem Fall ist aber auch das nicht erfüllt.
Die erste Frage ist eine zum logischen Verständnis, womit es bei mir leider nicht sehr weit her ist.
Ich habe ja immer eine Nullhypothese, die besagt "Die Benutzung der unterschiedlichen Arten von Adverbialsätzen ist bei Männern und Frauen gleich."

Und zwar in der Population, aus der die Stichprobe stammt. In Stichproben kann durch reinen Zufall es
mehr oder minder stark anders aussehen als in der Population. Deswegen macht man einen Test, ob die Daten
noch im möglichen reinen Zufallsbereich liegen oder nicht.
Wenn der Online-Chi-Test nun sagt, das Ergebnis sei nicht signifikant, heisst das dann also, dass die Nullhypothese zutrifft und die Verteilung ganz normal ist?

Zunächst mal sagt das nur, dass man nicht genügend Evidenz hat, um die Nullhypothese verwerfen zu können.
Außerdem spuckt der Test ja noch einen p-Wert aus. Wenn der z.B. bei 0,3768 (das sind dann nach meinem Verständnis etwa 4%)

37,68%
liegt, heisst das dann, dass die Wahrscheinlichkeit, dass die Nullhypothese zutrifft 4% oder 96% beträgt?

Nein. Der p-Wert sagt nichts zur Wahrscheinlichkeit irgendeiner Hypothese. Der p-Wert sagt: Angenommen,
die Nullhypothese (in der Population) gilt, wie wahrscheinlich sind dann Stichprobendaten wie die Deinigen
(bzw. noch extremere)? Wenn das Ergebnis bspw. "unter der Annahme, dass die Nullhypothese gilt, beträgt
die Wahrscheinlichkeit für solche (oder exremere) Stichprobendaten nur 4%", dann verwirft man man
konventionellerweise die Voraussetzung für den Gedankengang, also die Nullhypothese. Es ist ein
Entscheidungsverfahren!

Angenommen, Du wirfst eine Münze 13mal, und setzt voraus, dass diese nicht manipuliert ist (Nullhypothese: Anteil Kopf=Anteil Zahl). Natürlich kann es immer mal sein, dass Kopf oder Wappen deutlich überwiegen.
Aber man wird nicht bei 8 zu 5 für Kopf gleich annehmen, die Münze ist manipuliert. Dein Wurfergebnis ist
nun aber 12:1 für Kopf. Solch ein (oder extremeres) Ergebnis kommt nur mit p=0,003 vor. Jetzt musst Du
entscheiden: nimmst Du an, es ist etwas extrem seltenes passiert, oder verwirfst Du die Nullhypothese zugunsten
der Annahme, dass mit der Münze etwas nicht stimmt.
Außerdem frage ich mich, ob ich das bei den Daten, für die ich den Fisher-Test brauche dann genauso sagen kann, oder sagt der p-Wert da etwas anderes aus?

p ist p.
Außerdem verstehe ich nicht so richtig, ob es jetzt ausschlaggebend ist, dass im zweiten Beispiel die Anzahl der von Männern geäußerten Sätze nur halb so groß ist wie die Anzahl der Sätze, die von Frauen formuliert wurden (125 vs. 61). Der Chi-Test berechnet doch eigentlich so, dass alles normalisiert wird, oder?

De facto wird berechnet, ob der ANTEIL der einen Variante bei Männern derselbe ist wie bei Frauen.
Da spielt die unterschiedliche Gesamtmenge der Sätze keine Rolle.
Das andere Problem ist die Gesamtzahl von Sprechern in meinem Korpus (=Textsammlung). Ich habe 147 weibliche Sprecher und nur 83 männliche. Das gibt mir eigentlich - so wie ich das verstehe - einen Hinweis darauf, dass Adverbialsätze im Großen und Ganzen von Frauen häufiger verwendet werden und verändert doch auch irgendwie die Sicht auf meine Daten, oder?

Verstehe ich leider nicht, weil ich die Bedeutung des erwähnten Korpus für die Studie nicht kenne.
Im Moment untersuchst Du, soweit ich sehe, die Frage: WENN die Sprecher einen solchen Satz sprechen,
unterscheidet sich dann die Form je nach Geschlecht.

Nebenbei setzen die vorn Dir gerechneten Tests voraus, dass nicht mehrere Sätze vom selben Sprecher
stammen (unabhängige Beobachtungen). Mir ist nicht so recht klar, ob das gegeben ist.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Nemi

Re: Dringend Hilfe benötigt! :-) Chi-Test und Fisher's Exact

Beitragvon Nemi » Mi 25. Jan 2012, 13:40

Lieber P.,

erstmal vielen, vielen Dank für Deine ausführliche Antwort.

Die ERWARTETE Anzahl soll mindestens 5 betragen. In Deinem Fall ist aber auch das nicht erfüllt.


D.h. ich kann bei den Kausalsätzen den Fisher-Test nicht machen, richtig? Dann wäre die Alternative, die erwarteten Häufigkeiten mit den beobachteten Häufigkeiten zu kontrastieren und dazu zu schreiben, dass keine besonderen Unterschiede festzustellen sind?

Außerdem spuckt der Test ja noch einen p-Wert aus. Wenn der z.B. bei 0,3768 (das sind dann nach meinem Verständnis etwa 4%)
37,68%

Offensichtlich kann ich auch keine Prozentrechnung. (...) :-)

Verstehe ich leider nicht, weil ich die Bedeutung des erwähnten Korpus für die Studie nicht kenne.
Im Moment untersuchst Du, soweit ich sehe, die Frage: WENN die Sprecher einen solchen Satz sprechen,
unterscheidet sich dann die Form je nach Geschlecht.


Das ist richtig. Ich dachte nur, es wäre auch noch gut, wenn ich sagen könnte: soundso viele Kausal- bzw. Konzessivsätze werden von Männern geäußert, soundso viele von Frauen. Dann müsste ich das aber in irgendeine Relation zum Anteil der Frauen und Männer setzen, die überhaupt zum Korpus beitragen.
Aber die eigentliche Frage ist genau die, die Du oben formuliert hast. Insofern sollte ich mich vielleicht einfach daran halten.
Es handelt sich im einen Korpus, der verschiedene informelle Unterhaltungen zwischen zwei oder mehreren Sprechern beinhaltet. Eigentlich wäre es sinnvoll, die Anzahl der Sätze nicht in Relation zu den Sprechern sondern zur Anzahl der Worte zu sätzen (es könnte ja sein, dass mehr Sprecher aus dem Korpus weiblich sind, aber die männlichen trotzdem insgesamt mehr sagen), aber dazu habe ich keine Zahlen. Ich habe nur eine Gesamtzahl der Worte im Korpus.

Nebenbei setzen die vorn Dir gerechneten Tests voraus, dass nicht mehrere Sätze vom selben Sprecher
stammen (unabhängige Beobachtungen). Mir ist nicht so recht klar, ob das gegeben ist.


Nein, das ist nicht gegeben. Manche Sprecher tragen zwar nur einen Satz zur Untersuchung bei, andere aber mehrere. Da hab ich dann wahrscheinlich wieder das Problem wie ich es oben geschildert habe.

Deine Antworten haben mir schon sehr weitergeholfen. Danke.

Nemi
Nemi
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 25. Jan 2012, 10:51
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Dringend Hilfe benötigt! :-) Chi-Test und Fisher's Exact

Beitragvon PonderStibbons » Mi 25. Jan 2012, 14:13

D.h. ich kann bei den Kausalsätzen den Fisher-Test nicht machen, richtig?

Wie kommst Du denn jetzt darauf? Der Chi²-Test ist dann nicht durchführbar und es
wird alternativ der Fisher gerechnet.
Nebenbei setzen die vorn Dir gerechneten Tests voraus, dass nicht mehrere Sätze vom selben Sprecher
stammen (unabhängige Beobachtungen). Mir ist nicht so recht klar, ob das gegeben ist.

Nein, das ist nicht gegeben.

Dann kannst Du Deine bisherigen Berechnungen leider vergessen. Die sind für unabhängige Beobachtungen.
Wenn mehrere Sätze vom selben Srecher stammen (können), dann sind diese Sätze abhängige Beobachtungen.
Die p-Werte stimmen dann nicht. Wobei die Geschichte mit den Kausalsätzen mangels Masse so oder so uninteressant auszuwerten ist.

Du musst die Bobachtungseinheit anders definieren. Stichprobenelement ist nicht der einzelne Satz, sondern
der einzelne Sprecher. Analog zum bisherigen Verfahren, eingegrenzt auf Personen, die mindestens einmal die
interessierende Satzform verwenden. Im simpelsten Falle berechnet man für jeden Sprecher den Anteil
Voranstellungen in seinen Konzessivsätzen (Person X äußert 3 Konzessivsätze mit 2 Voranstellungen = Messwert
0,66; Person Y äußert 1 Knzessivstaz mit 1 Voranstellung = Messwert 1,0 etc.). Dann vergleicht man das zwischen
Männern und Frauen mithilfe des Mann-Whitney U-Tests.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Nemi

Re: Dringend Hilfe benötigt! :-) Chi-Test und Fisher's Exact

Beitragvon Nemi » Mi 25. Jan 2012, 15:48

Hej Ponder Stibbons :-)

Wie kommst Du denn jetzt darauf? Der Chi²-Test ist dann nicht durchführbar und es
wird alternativ der Fisher gerechnet.


Gute Frage, ich bin einfach völlig verwirrt.
Genau deswegen wollte ich ja den Fisher Test machen.

Dann kannst Du Deine bisherigen Berechnungen leider vergessen. Die sind für unabhängige Beobachtungen.
Wenn mehrere Sätze vom selben Srecher stammen (können), dann sind diese Sätze abhängige Beobachtungen.
Die p-Werte stimmen dann nicht. Wobei die Geschichte mit den Kausalsätzen mangels Masse so oder so uninteressant auszuwerten ist.


Das verstehe ich ehrlich gesagt nicht, aber ich weiß, dass ich anderen Untersuchungen auch so vorgegangen wurde (also Sätze analysiert wurden, bei denen auch manche Sätze vom gleichen Sprecher waren). Es geht ja eigentlich insgesamt nur um die Anzahl der Sätze. Mmh.

Vielen Dank! :-)
Nemi
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 25. Jan 2012, 10:51
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Dringend Hilfe benötigt! :-) Chi-Test und Fisher's Exact

Beitragvon PonderStibbons » Mi 25. Jan 2012, 16:55

Das verstehe ich ehrlich gesagt nicht, aber ich weiß, dass ich anderen Untersuchungen auch so vorgegangen wurde (also Sätze analysiert wurden, bei denen auch manche Sätze vom gleichen Sprecher waren).

Wenn das falsch gehandhabt wird, ist es natürlich bedauerlich. Allerdings täten sich
mit so einer Vorgehensweise unendliche Möglichkeiten auf. Man bräuchte zum Beispiel
nicht mehr Dutzende von Versuchspersonen, sondern es reichten 1 Mann und 1 Frau,
und die ließe man so lange sprechen, bis man genug "von einer Frau gesprochene
Konzessivsätze" und genügend "von einem Manne gesprochene Konzessivsätze"
aufgezeichnet hat, und auf der Basis rechnet man einen Chi² Test und behauptet,
allgemeine Aussagen über den Sprachgebrauch von Männern und Frauen inferieren
zu können.

Leider geht das so nicht.

Es geht ja eigentlich insgesamt nur um die Anzahl der Sätze. Mmh.

Laut dem was Du dargelegt hast ging es um unterschiedlichen Sprachgebrauch zwischen
Männern und Frauen. Und den kann man (u.a.) so abbilden, wie ich es vorher geschildert
habe.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Dringend Hilfe benötigt! :-) Chi-Test und Fisher's Exact

Beitragvon Nemi » Mi 25. Jan 2012, 18:59

Mhm, jetzt weiß ich nicht mehr, was ich tun soll. Ich werde mich nochmal ein bisschen schlau machen.

Danke für Deine Mühen :-)

Maike
Nemi
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 25. Jan 2012, 10:51
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post


Zurück zu Kreuztabellen & Chi²

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste