Zentraler Grenzwertsatz ein Mythos?

Fragen, die sich auf kein spezielles Verfahren beziehen.

Zentraler Grenzwertsatz ein Mythos?

Beitragvon miner » Do 13. Nov 2014, 10:10

Ich habe ein Problem mit dem zentralen Grenzwertsatz.

1.

Laut dem zentralen Grenzwertsatz soll eine große Stichprobe immer normalverteilt sein, unabhängig davon, wie die Verteilung der zugrunde liegenden Population ist. Wie soll das möglich sein? Je größer die Stichprobe ist, desto mehr nähert sich diese doch der Verteilung der Grundgesamtheit an. Und wenn die Grundgesamthei nicht normalverteilt ist, kann eine große Stichprobe das doch auch nicht sein.
Überspitzt gesagt: Die größte "Stichprobe" wäre dann ja die Vollerhebung. Dem zentralen Grenzwertsatz zufolge müsste diese aber normalverteilt sein. Das ist aber ein Widerspruch zu "Die Grundgesamtheit ist nicht normalverteilt".

2.

Eine Stichprobe ab 30 soll laut zentralem Grenzwertsatz immer normalverteilt sein. Also, 30 ist ja nicht gerade eine große Stichprobe. Ich habe schon größere Stichproben gesehen, die offentsichtlich nicht normalverteilt sind- Auch das wäre ein Gegenbeispiel für den zentralen Grenzwertsatz.

Ich hoffe, jemand kann mir jetzt einen Artikel zitieren, in dem steht, dass der zentrale Gerenzwertsatz ein Mythos ist! ;)
miner
Mitglied
Mitglied
 
Beiträge: 24
Registriert: Do 12. Sep 2013, 16:54
Danke gegeben: 8
Danke bekommen: 0 mal in 0 Post

Re: Zentraler Grenzwertsatz ein Mythos?

Beitragvon PonderStibbons » Do 13. Nov 2014, 10:45

Laut dem zentralen Grenzwertsatz soll eine große Stichprobe immer normalverteilt sein,

Wer erzählt Dir denn so einen Unfug?
Beim zentralen Grenzwertsatz geht es
nicht um die Verteilung der Rohwerte,
sondern um die Verteilung der Stichproben-
Mittelwerte. Lies es doch mal nach.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Zentraler Grenzwertsatz ein Mythos?

Beitragvon Delana » Fr 14. Nov 2014, 13:52

Hey,

danke das du das Thema noch einmal ansprichst.

Ich bin zusammen mit einem Freund von mir auch schon daran verzweifelt.
Verstanden haben wir es so, wie Ponder Stibbons es erklärt hat. Die Theorie besagt ja eigentlich nur, dass die Mittelwerte der Sttichproben ab n=30 normalverteilt sind. Unserer Meinung nach sagt dies aber nichts darüber aus (zumindest haben wir den Zusammenhang bislang nicht kapiert), dass auch das Merkmal in der Stichprobe (also die Rohwerte) normalverteilt sind.

Um parametrische Tests durchführen zu können, liegt doch in der Regel die Voraussetzung der Normalverteilung vor. Diese bezieht sich aber doch auf die Verteilung der Werte in der Stichprobe bzw. des Merkmales in der Gesamtpopulation, oder? (Bitte korrigiert mich, wenn hier bereits die ersten Fehler liegen!)

Unserer Meinung nach, kann man dementsprechend nicht sagen, dass ab einem n von 30 autoamtisch die Normalveteilungsannahme gegeben ist und man somit nicht mehr auf Normalverteilung testen muss.

Genauso wird es jedoch irgendwie immer gehandhabt. Wir haben solange darüber diskutiert, bis wir zur Statistik-Hilfe der Uni gegangen sind. Erklären konnte die Dame uns das da auch nicht, hat aber gesagt, es sei auch egal, man könne sich merken ab n=30 kann man davon ausgehen, dass Normalverteilung vorliegt und braucht auf diese nicht mehr zu testen.
So haben wir es auch noch in diversen Fachbüchern gelesen, wobei keines den Zusammenhang zwischen der Normalverteilung der Mittelwerte der Stichproben und der Rohwerte erklärt hätte. In der Regel klang es, als sei dies ein und dasselbe.

Uns erschien das nicht logisch, was aber auch einfach daran liegen kann, dass wir den Zusammenhang nicht verstanden haben?
Oder handhaben das einfach nur etliche Menschen (inklusive Fachbuchautoren und Professoren) falsch, weil es so schön einfach ist?
Delana
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Do 21. Aug 2014, 10:48
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Zentraler Grenzwertsatz ein Mythos?

Beitragvon PonderStibbons » Fr 14. Nov 2014, 14:37

Um parametrische Tests durchführen zu können, liegt doch in der Regel die Voraussetzung der Normalverteilung vor.

Nein. Falls Du damit meint, die Rohwerte der abhängigen Variablen.

Die Voraussetzung ist, dass sich (bei Gruppenvergleichen)
die Werte innerhalb der Gruppen normalverteilen (korrekt:
aus normalverteilten Grundgesamtheiten stammen), oder
noch einfacher, dass in einer linearen Regression oder einer
ANOVA die Residuen (Vorhersagefehler) normalverteilt sein
sollten (aus einer normalverteilten Grundgesamtheit stammen
sollten).

Das ist aber nur eine hilfsweise Bedingung. Eigentlich ist nicht
die Verteilung der AV in den Gruppen bzw. die der Residuen
interessant, sondern die der zu testenden Größen (Mittelwerte etc.)
Zieht man nur kleine Stichproben, stellt die Normalverteilung der
Residuen sicher, dass die Verteilung der Parameter so ist, wie
den Signifikanztests zugrunde gelegt, so dass die Standardfehler
korrekt berechnet werden. Sind Stichproben groß genug, ist die
Verteilung der Parameter auch bei nicht- normalen Residuen
dennoch so wie angenommen.

Es gibt im Netz Simulationen, die zeigen, wie sich zum Beispiel
Mittelwerte verteilen, wenn man immer und immer wieder Stichproben
aus z.B. einer sehr schief verteilten oder einer gleichverteilten Population
zieht. Diese Mittelwerte verteilen sich dann hübsch in Form der Gaus'schen
Glocke, wenn n > 30 oder spätestens n > 50.

HTH

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Conina, Delana

Re: Zentraler Grenzwertsatz ein Mythos?

Beitragvon miner » Mo 15. Dez 2014, 04:21

Die Voraussetzung ist, dass sich (bei Gruppenvergleichen)
die Werte innerhalb der Gruppen normalverteilen (korrekt:
aus normalverteilten Grundgesamtheiten stammen),
oder
noch einfacher, dass in einer linearen Regression oder einer
ANOVA die Residuen (Vorhersagefehler) normalverteilt sein
sollten (aus einer normalverteilten Grundgesamtheit stammen
sollten).


Da habe ich jetzt in einer anderen Quelle auch noch mal gelesen. Nehmen wir mal den t-Test für unabhängige Stichproben, weil der so schön einfach ist. Da habe ich gelesen, die VErteilung der Testvariablen in der Population (!) soll normalverteilt sein. Und das ist ja das das Du, wenn ich Dich richtig verstehe, auch sagst.

Wenn man überprüfen wollen würde, ob die Population normalverteilt ist, müsste man doch so vorgehen: Stichprobe ziehen, Stichprobe untersuchen auf Verteilung, wenn diese normalverteilt ist Signifikanztest machen, um zu sehen ob die Verteilung auf die Population generalisiert werden kann.

Da passt das zentrale Grenzwerttheorem dann allerdings gar nicht mehr rein.


Das ist aber nur eine hilfsweise Bedingung. Eigentlich ist nicht
die Verteilung der AV in den Gruppen bzw. die der Residuen
interessant, sondern die der zu testenden Größen (Mittelwerte etc.)
Zieht man nur kleine Stichproben, stellt die Normalverteilung der
Residuen sicher, dass die Verteilung der Parameter so ist, wie
den Signifikanztests zugrunde gelegt, so dass die Standardfehler
korrekt berechnet werden. Sind Stichproben groß genug, ist die
Verteilung der Parameter auch bei nicht- normalen Residuen
dennoch so wie angenommen.


Hm, ich fand das Beispiel mit dem t-Test schöner also ANOVA, da einfacher. Ich sehe aber nicht den Sinn darin, den Umweg über die Residuen zu gehen, wenn man genausogut die Normalverteilung an der fraglichen Variable direkt untersichen kann?

Es gibt im Netz Simulationen, die zeigen, wie sich zum Beispiel
Mittelwerte verteilen, wenn man immer und immer wieder Stichproben
aus z.B. einer sehr schief verteilten oder einer gleichverteilten Population
zieht. Diese Mittelwerte verteilen sich dann hübsch in Form der Gaus'schen
Glocke, wenn n > 30 oder spätestens n > 50.


Hier müsste man dann wohl die Frage stellen: Warum ist Normalverteilung überhaupt eine Voraussetzung? Aber das würde jetzt wohl zu weit führen...


P.[/quote]
miner
Mitglied
Mitglied
 
Beiträge: 24
Registriert: Do 12. Sep 2013, 16:54
Danke gegeben: 8
Danke bekommen: 0 mal in 0 Post

Re: Zentraler Grenzwertsatz ein Mythos?

Beitragvon PonderStibbons » Mo 15. Dez 2014, 09:45

Hm, ich fand das Beispiel mit dem t-Test schöner also ANOVA, da einfacher. Ich sehe aber nicht den Sinn darin, den Umweg über die Residuen zu gehen, wenn man genausogut die Normalverteilung an der fraglichen Variable direkt untersichen kann?

Die Normalverteilung einer Variable ist (so gut wie) niemals
von Interesse, allenfalls die Verteilung in den einzelnen
Gruppen (wenn es um t-Tests oder Varianzanalysen geht),
bzw. die Verteilung des Modell-Fehlers.

Hier müsste man dann wohl die Frage stellen: Warum ist Normalverteilung überhaupt eine Voraussetzung? Aber das würde jetzt wohl zu weit führen...

Das wurde bereits weiter oben erkärt. Siehe auch
http://www.uni-graz.at/ilona.papousek/t ... s/faq.html FAQ#4

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 14 Gäste