Bootstrapping

Fragen, die sich auf kein spezielles Verfahren beziehen.

Bootstrapping

Beitragvon Andiego » Mo 28. Okt 2013, 15:00

Hallo Zusammen,

ich habe einige Schwierigkeiten bei der Interpretation meines Bootstrappings und möchte Euch um Hilfe bitten.

Wir gehen das Problem am Beispiels durch: Angenommen es soll eine Schätzung über den Populationsmittelwert angestellt werden.

Mein größtes Problem liegt bei der Interpretation der Bias. Grundsätzlich ist klar, dass diese die Differenz zwischen Mittelwert der Stichprobe und Mittelwert der Bootstrap-Verteilung darstellt. Was bedeutet dies allerdings für meine Schätzung? Ist der Mittelwert der Bootstrapverteilung nun ein besserer Schätzer für den Populationsmittelwert als der Mittelwert des Samples? Oder gibt mir die Verzerrung eine andere Information?

Warum es überhaupt eine Differenz gibt, ist mir auch nicht klar. Der Mittelwert der Bootstrapverteilung sollte doch Erwartungsgemäß dem des Samples entsprechen. Das ist doch der Kern der Inferenzstatistik. Wie entsteht hier diese Verzerrung?

Ein weiteres Problem habe ich mir den Konfidenzintervallen meiner Bootstrapverteilung. Diese sind nicht kleiner als das Originale Konfidenzintervall? Sollte das nicht durch das Bootstrappen der Fall sein?

Beste Dank für eure Hilfe!
Andiego
Beobachter
Beobachter
 
Beiträge: 19
Registriert: Mo 22. Apr 2013, 16:54
Danke gegeben: 2
Danke bekommen: 2 mal in 2 Posts

Re: Bootstrapping

Beitragvon Andiego » Mi 4. Dez 2013, 16:06

Niemand eine Idee???? :| :?: :?
Andiego
Beobachter
Beobachter
 
Beiträge: 19
Registriert: Mo 22. Apr 2013, 16:54
Danke gegeben: 2
Danke bekommen: 2 mal in 2 Posts

Re: Bootstrapping

Beitragvon DHA3000 » Do 5. Dez 2013, 01:43

Sicher, du schreibst du nur leider nichts über die Stichprobengröße bzw. die Anzahl der Bootstrap-Replikationen...
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

Re: Bootstrapping

Beitragvon Andiego » Mo 9. Dez 2013, 12:26

Hallo DHA3000,

lass uns das Problem vielleicht theoretisch betrachten.

Trotzdem zu deiner Frage: Meine Stichprobengröße ist 60. Die Anzahl der Replikationen ist beliebig. Mein Startwert war 100. Ich kann aber auch sagen, ich will 1000 oder 10000 Replikate. Jedesmal git es eine mehr oder weniger konsitente Abweichung zwischen dem Mittelwet der Stichprobe und dem der Bootsrap-Verteilung.

Mein Beispiel habe ich aus einem Artikel: http://www.stochastik.uni-hannover.de/f ... eprint.pdf
Auf Seite 7 geht es los. Insgesamt ein ganz netter Text. Ich Frage mich allerdings, ob ich da was überlesen habe, oder wo ich auf dem Schlauch stehe (Sollte jemand mein R-Skript haben wollen, kann ich das gerne bereitstellen).

Herzliche Grüße!
Andiego
Beobachter
Beobachter
 
Beiträge: 19
Registriert: Mo 22. Apr 2013, 16:54
Danke gegeben: 2
Danke bekommen: 2 mal in 2 Posts

Re: Bootstrapping

Beitragvon Andiego » Do 12. Dez 2013, 10:29

Ich hole das Thema mal wieder nach vorne....interessiert mich ja immer noch brennend :)
Andiego
Beobachter
Beobachter
 
Beiträge: 19
Registriert: Mo 22. Apr 2013, 16:54
Danke gegeben: 2
Danke bekommen: 2 mal in 2 Posts

Re: Bootstrapping

Beitragvon DHA3000 » Do 12. Dez 2013, 14:43

Also, ich bin mir nicht sicher, ob du den Sinn von Bootstrapping richtig verstanden hast.
Warum sollte der Mittelwert der generierten Verteilung dem, deines Samples entsprechen?
Du bist dir ja über den wahren Mittelwert garnicht sicher, deswegen wendest du BS überhaupt erst an.
Das es also Unterschiede gibt, ist zu erwarten.
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

Re: Bootstrapping

Beitragvon Andiego » Do 12. Dez 2013, 16:49

Hallo DHA3000,

vielen Dank für Deine Antwort. Der Fehler wird sicher auch irgendwo in meinem Verständnis über das Bootstrapverfahren liegen. Ich bin mir allerdings nicht sicher, ob du mit deiner Aussage über den Mittelwert recht hast.

Ich zitiere mal aus dem Text, den ich in einem der Beiträge hier verlinkt habe: Durch die Wiederverwendung der Daten k¨onnen Sch¨atzer nicht verbessert werden, da der vorliegende Stichprobenumfang nicht erh¨oht wird. Es ist jedoch m¨oglich, die Verteilung von Stichprobenstatistiken durch die Bootstrap-Verteilung zu approximieren und damit die Qualit¨at von Sch¨atzern zu beurteilen indem etwa Verzerrung, Perzentile, Vertrauensintervalle oder Standardfehler (approximativ) berechnet werden k¨onnen.

*Sorry für die Formatierung.....denke aber es ist noch lesbar.

Wie ich das verstehe, lässt sich der Schätzer für den Mittelwert zunächst einmal nicht verbessern. Daraus schließe ich, dass die Abweichung durch Bootstrapping nicht interpretiert wird. Das zum einen. Ist das denn so richtig?

Zum anderen Frage ich mich, wieso überhaupt eine Abweichung entsteht. Widerspricht das nicht dem zentralen Grenzwertsatz? Das auch zu deiner Frage, warum sich der Mittelwert der generierten Verteilung dem des Samples entsprechen soll.
Man hat eine beliebige Verteilung. Daraus werden unendlich viele SP genommen und deren Erwartungswert entspricht dann dem Mittelwert der Grundgesamtheit. Folglich müsste sich doch der Mittelwert der Replikate approximativ dem Mittelwert der Ausgangsstichprobe nähern. Immerhin gibt es den Ausspruch: "the population is to the sample as the sample is to the bootstrap samples".

Das es Unterschiede gibt, ist also mMn überhaupt nicht zu erwarten.

Ist dir/euch klar was ich meine?

Viele Grüße!
Andiego
Beobachter
Beobachter
 
Beiträge: 19
Registriert: Mo 22. Apr 2013, 16:54
Danke gegeben: 2
Danke bekommen: 2 mal in 2 Posts

Re: Bootstrapping

Beitragvon DHA3000 » Mo 16. Dez 2013, 23:27

Andiego hat geschrieben:
Wie ich das verstehe, lässt sich der Schätzer für den Mittelwert zunächst einmal nicht verbessern. Daraus schließe ich, dass die Abweichung durch Bootstrapping nicht interpretiert wird. Das zum einen. Ist das denn so richtig?


Nein. ;) Du wendest ja nicht Bootstrapping primär für eine Punktprognose an, sondern um die Verteilung des Schätzers zu generieren. Das heißt, du "simulierst" einen Bereich für deinen Schätzer, wo du glaubst, dass dieser wahre Wert enthalten ist (Sofern du die Verteilung empirisch bestimmt hast). Das es zu unterschieden zu deinem beobachteten Mittelwert kommt, liegt sehr wahrscheinlich daran, dass es sich nicht um eine Normalverteilung handelt.


Andiego hat geschrieben:
Zum anderen Frage ich mich, wieso überhaupt eine Abweichung entsteht. Widerspricht das nicht dem zentralen Grenzwertsatz? Das auch zu deiner Frage, warum sich der Mittelwert der generierten Verteilung dem des Samples entsprechen soll.
Man hat eine beliebige Verteilung. Daraus werden unendlich viele SP genommen und deren Erwartungswert entspricht dann dem Mittelwert der Grundgesamtheit. Folglich müsste sich doch der Mittelwert der Replikate approximativ dem Mittelwert der Ausgangsstichprobe nähern. Immerhin gibt es den Ausspruch: "the population is to the sample as the sample is to the bootstrap samples".
Viele Grüße!


Wenn sich deine empirische Verteilung der Normalverteilung annährend, wäre dies der Fall (ZGS). Dies scheint aber bei dir nicht der Fall zu sein.
Wie viele Beobachtungen hast du denn insgesamt? Und handelt es sich um Zeitreihen?
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

Re: Bootstrapping

Beitragvon Andiego » Mo 10. Feb 2014, 10:51

Hallo Zusammen und hallo DHA3000,

tut mir leid, dass es länger gedauert hat und danke für deine letzte Antwort DHA3000.

Ich verstehe nicht ganz, worauf du dich hier beziehst:
"Wenn sich deine empirische Verteilung der Normalverteilung annährend, wäre dies der Fall (ZGS). Dies scheint aber bei dir nicht der Fall zu sein.'"

Die empirische Verteilung, also die Population, muss nicht normalverteilt sein. Die Stichprobenverteilung, entnommen aus einer beliebigen Verteilung, nähert sich gemäß zentralem Grenzwertsatz einer Normalverteilung.
Meine Vermutung ist auch, dass die Schiefe wohl aus zu kleinem n zustande kommt (wobei mein n = 60 ist).

Zu deinen Fragen: Die Stichprobengröße ist 60. Keine Zeitreihe! Habe das Beispiel übrigens aus diesem Text (S.7):
http://www.stochastik.uni-hannover.de/f ... eprint.pdf


Beste Grüße,
Andiego!
Andiego
Beobachter
Beobachter
 
Beiträge: 19
Registriert: Mo 22. Apr 2013, 16:54
Danke gegeben: 2
Danke bekommen: 2 mal in 2 Posts

Re: Bootstrapping

Beitragvon Andiego » Do 6. Mär 2014, 17:09

Ich hole das Thema wieder hoch!

Ist doch ein Statistik Forum.....irgendjemand muss doch Lust haben, sich mit Bootstrapping zu beschäftigen..... ;)
Andiego
Beobachter
Beobachter
 
Beiträge: 19
Registriert: Mo 22. Apr 2013, 16:54
Danke gegeben: 2
Danke bekommen: 2 mal in 2 Posts

Nächste

Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: Google [Bot] und 7 Gäste

cron