Zentraler Grenzwertsatz

Fragen, die sich auf kein spezielles Verfahren beziehen.

Zentraler Grenzwertsatz

Beitragvon Freddy19911 » So 28. Feb 2021, 13:59

Hallo,

bitte korrigiert mich wenn ich falsch liege: Der zentrale Grenzwertsatz besagt, dass die Stichprobenkennwerteverteilung einer Statistik (bspw. des Mittelwerts) für (unendlich) viele Stichproben approximativ einer Normalverteilung folgt. Anders ausgedrückt: Ziehe ich sehr viele Stichproben aus einer Grundgesamtheit und berechne für jede Stichprobe den Mittelwert, so folgt die Verteilung dieser Stichprobenmittelwerte für eine ausreichend große Anzahl gezogener Stichproben einer Normalverteilung. Der zentrale Grenzwertsatz hat demnach nichts mit der Verteilung einer gezogenen Stichprobe zu tun und besagt also nicht, dass eine sehr große Stichprobe automatisch normalverteilt ist.

Dazu habe ich folgende Fragen:

1.) Gilt der zentrale Grenzwertsatz auch für beliebige andere Statistiken der Stichproben (Standardabweichung, Median o.ä.) D.h.: Kann ich auch für jede Stichprobe die Standardabweichung berechnen und davon ausgehen, dass die Verteilung der Stichprobenstandardabweichungen für eine ausreichende Anzahl von Stichproben einer NV folgen?

2.) In dem Lehrbuch Fit fürs Studium: Statistik (Grabinger 2018) steht auf Seite 375 zum zentralen Grenzwertsatz:
Sind X1, X2,...XN unabhängige ZV, die alle dieselbe Verteilung haben, dann ist die Zufallsvariable X = X1 + X2 + ... XN annähernd normalverteilt, [...]


Mir gelingt es nicht, diese Aussage in Einklang mit meinem bisherigen Verständnis des zentralen Grenzwertsatzes zu bringen.
Beispiel: Meine Zufallsstichprobe besteht aus den Körpergrößen von 100 Studenten einer Uni. Dabei stellt jedes Element dieser Stichrobe (d.h. jede Ziehung) eine Zufallsvariable dar, deren Realisierung dann die Körpergröße eines bestimmten Studenten ist. Nach der Definition des Buchs würde es doch dann bedeuten, dass eine Zufallsvariable X = X1 + X2 + ... + X100 approximativ einer Normalverteilung folgt. Und das wäre doch dann gleichbedeutend mit der Aussage, dass meine Stichprobe ab einer bestimmten Größe einer Normalverteilung folgt, was - nach meinem Verständnis - der zentrale Grenzwertsatz ja eben nicht besagt. Wo liegt hier mein Denkfehler?

Beste Grüße
Freddy19911
Mitglied
Mitglied
 
Beiträge: 25
Registriert: Mi 20. Jun 2018, 19:44
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Zentraler Grenzwertsatz

Beitragvon bele » So 28. Feb 2021, 16:20

Hallo Freddy,

Freddy19911 hat geschrieben:1.) Gilt der zentrale Grenzwertsatz auch für beliebige andere Statistiken der Stichproben (Standardabweichung, Median o.ä.) D.h.: Kann ich auch für jede Stichprobe die Standardabweichung berechnen und davon ausgehen, dass die Verteilung der Stichprobenstandardabweichungen für eine ausreichende Anzahl von Stichproben einer NV folgen?

Nein, gilt nicht die Standardabweichung, die ja immer nur positiv sein kann und deshalb nicht normalverteilt sein kann und auch nicht für den Median (da war mal was auf CrossValidated, aber das müsste ich erst suchen).

Nach der Definition des Buchs würde es doch dann bedeuten, dass eine Zufallsvariable X = X1 + X2 + ... + X100 approximativ einer Normalverteilung folgt.

Ja.

Und das wäre doch dann gleichbedeutend mit der Aussage, dass meine Stichprobe ab einer bestimmten Größe einer Normalverteilung folgt

Nein. Da irgendwo liegt der Denkfehler. Bloß weil die Summe aller X einer Normalverteilung folgt tund das die X selbst noch lange nicht.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5917
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts

Re: Zentraler Grenzwertsatz

Beitragvon Freddy19911 » So 28. Feb 2021, 17:14

Hallo bele,

vielen Dank für deine Antwort.

Nein. Da irgendwo liegt der Denkfehler. Bloß weil die Summe aller X einer Normalverteilung folgt tund das die X selbst noch lange nicht.


Ich glaube ich habe meinen Denkfehler finden können: Nehmen wir 10 Zufallsvariablen, die jeweils (alle derselben Verteilung folgend) die Werte 0-100 annehmen können. In einem ersten Durchlauf erhalten wir also insgesamt 10 Werte und bilden die Summe daraus (Summe1). Im zweiten Durchlauf erhalten wir erneut 10 Werte und bilden die Summe daraus (Summe2). Im dritten Durchlauf erhalten wir erneut 10 Werte und bilden die Summe daraus (Summe3). Das ganze wiederholen wir 100 mal, bis zur Summe100. Nach dem zentralen Grenzwertsatz ist es nun die Summe der 100 Summen, die approximativ normalverteilt ist (ebenso wie die Summe der Mittelwerte der einzelnen Summen). Ich habe wohl den Denkfehler gemacht, dass ich davon ausgegangen bin, die obige Definition würde meinen, eine einzelne Summe der 10 Werte würde einer NV folgen.
Freddy19911
Mitglied
Mitglied
 
Beiträge: 25
Registriert: Mi 20. Jun 2018, 19:44
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Zentraler Grenzwertsatz

Beitragvon bele » So 28. Feb 2021, 19:57

Nein, das ist zu kompliziert gedacht. Wenn Du nicht 10 Zufallszahlen aus einer beliebigen Verteilung nimmst, sondern die Zahl der Zufallszahlen aus dieser beliebigen Verteilung gegen unendlich streben lässt, dann ist die Summe1 eine normalverteilte Zufallsvariable.

Man kann hier im Forum ja keine Grafiken einstellen aber vielleicht hilft Dir, was ich unter dem Nickname Bernhard hier auf CrossValidated mal eingestellt habe. Wenn ja, freue ich mich dort natürlich über ein Upvote: https://stats.stackexchange.com/a/307581/117812

Inzwischen habe ich auch meinen alten Beitrag zum Thema Zentraler Grenzwertsatz und Median gefunden: https://stats.stackexchange.com/a/488747/117812 Auch da gilt: Wenn es hilft, gerne ein upvote hinterassen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5917
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts

Re: Zentraler Grenzwertsatz

Beitragvon Freddy19911 » Di 2. Mär 2021, 10:36

Hallo bele,

der letzte Beitrag hat mich ein wenig verwirrt aber ich glaube wir meinen dasselbe :lol:

Freddy19911 hat geschrieben:Ich glaube ich habe meinen Denkfehler finden können: Nehmen wir 10 Zufallsvariablen, die jeweils (alle derselben Verteilung folgend) die Werte 0-100 annehmen können. In einem ersten Durchlauf erhalten wir also insgesamt 10 Werte und bilden die Summe daraus (Summe1). Im zweiten Durchlauf erhalten wir erneut 10 Werte und bilden die Summe daraus (Summe2). Im dritten Durchlauf erhalten wir erneut 10 Werte und bilden die Summe daraus (Summe3). Das ganze wiederholen wir 100 mal, bis zur Summe100. Nach dem zentralen Grenzwertsatz ist es nun die Summe der 100 Summen, die approximativ normalverteilt ist (ebenso wie die Summe der Mittelwerte der einzelnen Summen). Ich habe wohl den Denkfehler gemacht, dass ich davon ausgegangen bin, die obige Definition würde meinen, eine einzelne Summe der 10 Werte würde einer NV folgen.


Mit diesem Vorgehen habe ich im Prinzip das gleiche gemacht wie du bei StackExchange beschrieben hast (sehr hilfreicher Beitrag im übrigen). Ich habe es glaube ich nur falsch ausgedrückt:
Ich habe Excel mal 1000 zufällige Zahlen generieren lassen und auf Grund dieser Daten ein Histogramm erstellt, welches erahnen lässt, dass die Grundgesamtheit gleichverteilt ist.

Im Anschluss habe ich zwei Dinge getan:
1.)
100 zufällige Zahlen aus dieser GG als eine Stichprobe gezogen und deren Verteilung mittels Histogramm dargestellt. Die Verteilung dieser Stichprobe weist eben auch (annähernd) eine Gleichverteilung auf. Das ist soweit im Einklang mit meinem Verständnis: Der zentrale Grenzwertsatz sagt eben nicht aus, dass eine Stichprobe ab einer bestimmten Größe einer Normalverteilung folgt. Macht ja auch Sinn: Je größer meine Stichprobe, desto eher nähert sich diese ja meiner Grundgesamtheit an und muss sich demzufolge auch deren Verteilung annähern.

2.)
Im nächsten Schritt habe ich 10 Stichproben (SP 1-10) und für jede Stichprobe 100 Ziehungen (Durchläufe) simuliert. Anders ausgedrückt habe ich 10 Stichproben mit jeweils 100 Elementen aus den 1000 zufällig generierten Zahlen zufällig gezogen. Dann habe ich die Summe für jede einzelne Stichprobe (SP 1-10) über die 100 Elemente der Stichprobe berechnet und die Verteilung dieser Summen dann dargestellt. Und dann ergab sich -zumindest annähernd- eine Normalverteilung. Ich glaube ich habe etwas mit der Terminologie durcheinander gebracht, indem ich die Stichproben (und nicht die Summen der Stichproben) als Zufallsvariablen bezeichnet habe.

LG
Freddy19911
Mitglied
Mitglied
 
Beiträge: 25
Registriert: Mi 20. Jun 2018, 19:44
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Zentraler Grenzwertsatz

Beitragvon bele » Di 2. Mär 2021, 18:55

Freddy19911 hat geschrieben:der letzte Beitrag hat mich ein wenig verwirrt aber ich glaube wir meinen dasselbe :lol:


Bedeutet das, dass Deine Frage damit beantwortet ist, oder ist noch ein Aspekt offen?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5917
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: Google [Bot] und 17 Gäste

cron