Frage zu abgeleiteter Verteilung

Fragen, die sich auf kein spezielles Verfahren beziehen.

Frage zu abgeleiteter Verteilung

Beitragvon mxim » Fr 15. Mär 2013, 21:38

Hallo,

ich versuche gerade Statistik zu erlernen und höre mir dazu eine Vorlesung von opencourseware an (John Tsitsiklis). Ich verzweifele gerade am Verständnis der Lösung für folgende Aufgabe:

Eine Person fährt mit 30-60km/h (uniform verteilte Zufallsvariable) 200 km weit. Wie ist die Reisezeit verteilt (Dichtefunktion ist gefragt)?

Die Dichtefuntion erhält man als F(t) = 20/(3t^2) im Intervall von 20/6h bis 20/3h.

Diese Funktion hat in diesem Intervall für die kürzeste Reiszeit Ihr Maximum??? Für größere t fällt sie stetig ab - wie kann das sein?
Irgendwie hätte ich gefühlsmäßig erwartet, dass die Dichte ihr Maximum am Erwartungswert haben sollte?
Wo denke ich hier falsch?
Da ich versuche, die Statistik im "Fernstudium" zu erlernen, habe ich leider keine direkten Ansprechpartner in meiner Umgebung, deshalb schon mal
vIelen Dank für eure Hinweise!
Maxim
mxim
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Fr 15. Mär 2013, 21:15
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Frage zu abgeleiteter Verteilung

Beitragvon aziz » Sa 16. Mär 2013, 01:46

Hallo Maxim,

mxim hat geschrieben:Diese Funktion hat in diesem Intervall für die kürzeste Reiszeit Ihr Maximum??? Für größere t fällt sie stetig ab - wie kann das sein?

Da der Nenner immer größer und dadurch der gesamte Bruch immer kleiner wird.

mxim hat geschrieben:Irgendwie hätte ich gefühlsmäßig erwartet, dass die Dichte ihr Maximum am Erwartungswert haben sollte?
Wo denke ich hier falsch?

Das ist bei symmetrischen Verteilungen so. Im allgemeinen muss das nicht gelten. Der Erwartungswert muss noch nicht einmal durch ein Zufallsexperiment realisierbar sein, wie folgendes Beispiel zeigt:

Einfacher Würfelwurf, Annahme einer Gleichverteilung, also . Dann gilt für den Erwartungswert:


Gruß
A.
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

Re: Frage zu abgeleiteter Verteilung

Beitragvon mxim » Sa 16. Mär 2013, 09:38

Vielen Dank für die Hinweise! Der Vergleich hinkt allerdings ein wenig, da die Verteilung diskret ist.

Jetzt habe ich zwar über mein Problem geschlafen, sitze aber immer noch wie der Ochs vorm Berg, da ich es absolut nicht fassen kann, warum diese uniforme Verteilung der Geschwindigkeiten in eine 1/x^2 Form für die Zeit abgeleitet wird!

In einfachen Worten:

Warum ist es wahrscheinlicher nach 20/6 Stunden anzukommen als nach zum Beispiel nach 20/4.5 Stunden? Mir fehlt dafür jegliches intuitives Verständnis! Es sollten doch alles Reisezeiten gleich wahrscheinlich sein. Dass das mit der Geschwindigkeit im Nenner zu tun haben muss, leuchtet zwar irgendwie ein, mein Problem ist aber, dass es mir einfach intuitiv nicht einleuchten will, ich muss wohl noch einmal drüber schlafen!

Dass das alles in der Tat so ist, habe ich gerade in R nachgeprüft:
Code: Alles auswählen
speed<-runif(1000000,30,60)
plot(density(200/speed))
f <- function(x) (20/(3*x^2))
curve(f,add=T,col=2,lty=2)


Sieht tatsächlich im relevanten Intervall ziemlich aus wie die abgeleitete Funktion!

Nach der Rumspielerei habe ich mir noch mal einfach die Funktion 200/x für alle x zwischen 30 und 60 angeschaut - und irgendwie wird alles nur noch unlogischer: die Funktion zeigt stärkere Änderungen / Effekte (Steigung) für kleine Geschwindigkeiten (deutlichere Zunahme der Reisezeit), bei Gleichverteilung der Geschwindigkeiten sollte ich doch dann eher eine Verschiebung zu längeren Reisezeiten ergeben, oder?

Irgendwie bin ich jetzt völlig verwirrt, kennt jemand vielleicht ein entsprechendes Beispiel aus einem Lehrbuch, am besten mit ausgiebiger Erläuterung? Im Buch des besagten Profs ist das Beispiel genauso karg dargestellt, wie in seiner Vorlesung!

Maxim
mxim
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Fr 15. Mär 2013, 21:15
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Frage zu abgeleiteter Verteilung

Beitragvon aziz » Sa 16. Mär 2013, 11:21

mxim hat geschrieben:Vielen Dank für die Hinweise! Der Vergleich hinkt allerdings ein wenig, da die Verteilung diskret ist.

Mit Verlaub, aber das möchte ich nicht behaupten. Das ich im Vergleich eine diskrete Verteilung gewählt habe, halte ich zur Klärung deiner ursprünglichen Frage für irrelevant. Du hattest ursprünglich angenommen, dass das Maximum einer Dichtefunktion sich im Erwartungswert der zugehörigen Zufallsvariable beobachten lässt. Im allgemeinen gilt das schon bei stetigen Verteilungen nicht mehr falls sie keine Symmetrie besitzen. Ich hätte auch als Beispiel die Cauchy-Verteilungen (stetig) wählen können. Hier existert der Erwartungswert nicht! Trotzdem besitzt die Dichte der Cauchy-Verteilung ein Maximum.

mxim hat geschrieben:Jetzt habe ich zwar über mein Problem geschlafen, sitze aber immer noch wie der Ochs vorm Berg, da ich es absolut nicht fassen kann, warum diese uniforme Verteilung der Geschwindigkeiten in eine 1/x^2 Form für die Zeit abgeleitet wird!

Ich vermute, dass dies "verteilungstechnische" Gründe hat, wegen der Rechteckverteilung. Die abgeleitete Dichte scheint ja die Form

zu haben.

mxim hat geschrieben:Warum ist es wahrscheinlicher nach 20/6 Stunden anzukommen als nach zum Beispiel nach 20/4.5 Stunden? Mir fehlt dafür jegliches intuitives Verständnis! Es sollten doch alles Reisezeiten gleich wahrscheinlich sein. Dass das mit der Geschwindigkeit im Nenner zu tun haben muss, leuchtet zwar irgendwie ein, mein Problem ist aber, dass es mir einfach intuitiv nicht einleuchten will, ich muss wohl noch einmal drüber schlafen!

Für die beiden, von dir genannten, Wahrscheinlichkeiten gilt , da wir hier eine stetige Verteilung vorliegen haben. Von den Wahrscheinlichkeiten ist keine größer.

Gruß
A
Zuletzt geändert von aziz am Sa 16. Mär 2013, 16:04, insgesamt 1-mal geändert.
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

Re: Frage zu abgeleiteter Verteilung

Beitragvon aziz » Sa 16. Mär 2013, 16:01

Hallo,

ich bin's nochmal. Hab mir mal das Video, welches du meinen könntest, angeschaut:
http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-041-probabilistic-systems-analysis-and-applied-probability-fall-2010/video-lectures/lecture-10-continuous-bayes-rule-derived-distributions/

Ab ungefähr 33:44 lässt sich der gute Herr etwa 5 Minuten über die Herleitung der abgeleiteten Dichte aus. Wie ich finde gut erklärt.

Gruß
aziz
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

Re: Frage zu abgeleiteter Verteilung

Beitragvon mxim » Sa 16. Mär 2013, 19:09

Hallo,

vielen Dank für die Nachforschungen, ich finde die Vorlesung auch insgesamt super - im Vergleich zu vielen anderen habe ich bei diesem Herren das absolute sichere Gefühl, dass er jederzeit völlig Herr der Materie ist! Zudem finde ich den Ansatz super, immer solange auf die exakte Herleitung zu verzichten, solange es auch irgendwie intuitiv geht!

Verteilung und Erwartungswert: danke für die Richtigstellung!

aziz hat geschrieben:Für die beiden, von dir genannten, Wahrscheinlichkeiten gilt , da wir hier eine stetige Verteilung vorliegen haben. Von den Wahrscheinlichkeiten ist keine größer.


ok, das Argument verstehe ich! Ich meinte, die Dichte ist größer: nehme ich also jeweils ein gleich kleines Intervall in t bei 200/30 und 200/60 sind die Wahrscheinlichkeitsdichten aber doch unterschiedlich, nämlich bei 200/60 deutlich höher als bei 200/30. Irgendwie interpretiere ich das so, dass es wahrscheinlicher ist, schneller ans Ziel zu kommen.

Oder ist das eine generelle Fehlinterpretation von Wahrscheinlichkeitsdichten?
Maxim
mxim
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Fr 15. Mär 2013, 21:15
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Frage zu abgeleiteter Verteilung

Beitragvon aziz » Sa 16. Mär 2013, 20:43

mxim hat geschrieben:ok, das Argument verstehe ich! Ich meinte, die Dichte ist größer: nehme ich also jeweils ein gleich kleines Intervall in t bei 200/30 und 200/60 sind die Wahrscheinlichkeitsdichten aber doch unterschiedlich, nämlich bei 200/60 deutlich höher als bei 200/30. Irgendwie interpretiere ich das so, dass es wahrscheinlicher ist, schneller ans Ziel zu kommen.


Aus der Dichtefunktion lassen sich keine Wahrscheinlichkeiten ablesen. Hierfür muss die Dichte über den Träger (In der Regel, das Ereignis für welches eine Wahrscheinlichkeit bestmmt werden soll) integriert werden. Somit erhält man die sog. Verteilungsfunktion bzw. im Sinne der Maßtheorie eine Wahrscheinlicheitsmaß.

Gruß
Aziz
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

Re: Frage zu abgeleiteter Verteilung

Beitragvon mxim » Sa 16. Mär 2013, 22:41

aziz hat geschrieben:Aus der Dichtefunktion lassen sich keine Wahrscheinlichkeiten ablesen. Hierfür muss die Dichte über den Träger (In der Regel, das Ereignis für welches eine Wahrscheinlichkeit bestmmt werden soll) integriert werden. Somit erhält man die sog. Verteilungsfunktion bzw. im Sinne der Maßtheorie eine Wahrscheinlicheitsmaß.


Ok, als Novize muss ich nochmals nachfragen: ist denn nicht das Integral der Dichte die kumulative Dichte? Dass die Wahrscheinlichkeit für eine reelle Zahl Null ist, hatte ich schon mal gehört - deshalb habe ich auch von kleinen Intervallen gesprochen.

Z.B. das Intervall von a) 6.5-6.6 h im Vergleich zum Intervall von b) 3.4-3.5 h, die Fläche unter der Dichtefunktion ist für das Intervall a) viel kleiner als für das Intervall b). Kann ich denn für diese Intervalle festhalten, dass a) wesentlich unwahrscheinlicher ist als b)?

Wobei das jetzt doch etwas an meiner Fragestellung vorbeigeht - aber ich kann doch irgendwie aus einer Dichtefunktion ableiten, wie wahrscheinlich ein Ereignis in einem bestimmten Intervall der Dichtefunktion ist (relativ zu einem anderen Intervall zumindest!)? Als Bild: Bei Betrachtung der Standardnormalverteilung (Dichtefunktion) sieht man doch, dass ein Intervall der Länge x um 0 herum mit höheren Wahrscheinlichkeiten assoziiert ist, als zum Beispiel ein gleich langes Intervall bei -1!

Maxim
mxim
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Fr 15. Mär 2013, 21:15
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Frage zu abgeleiteter Verteilung

Beitragvon aziz » So 17. Mär 2013, 12:22

mxim hat geschrieben:Ok, als Novize muss ich nochmals nachfragen: ist denn nicht das Integral der Dichte die kumulative Dichte? Dass die Wahrscheinlichkeit für eine reelle Zahl Null ist, hatte ich schon mal gehört - deshalb habe ich auch von kleinen Intervallen gesprochen.

Ja. Das Integrall über die Dichte wird kumulative Dichte oder auch Verteilungsfunktion genannt.

mxim hat geschrieben:Z.B. das Intervall von a) 6.5-6.6 h im Vergleich zum Intervall von b) 3.4-3.5 h, die Fläche unter der Dichtefunktion ist für das Intervall a) viel kleiner als für das Intervall b). Kann ich denn für diese Intervalle festhalten, dass a) wesentlich unwahrscheinlicher ist als b)?

Ja.

mxim hat geschrieben:Wobei das jetzt doch etwas an meiner Fragestellung vorbeigeht - aber ich kann doch irgendwie aus einer Dichtefunktion ableiten, wie wahrscheinlich ein Ereignis in einem bestimmten Intervall der Dichtefunktion ist (relativ zu einem anderen Intervall zumindest!)? Als Bild: Bei Betrachtung der Standardnormalverteilung (Dichtefunktion) sieht man doch, dass ein Intervall der Länge x um 0 herum mit höheren Wahrscheinlichkeiten assoziiert ist, als zum Beispiel ein gleich langes Intervall bei -1!

Das was du dort bildlich beschreibst, wird durch das Integrieren mathematisch erzielt. Es wird der Flächeninhalt unter dem betrachteten Ereignis bestimmt, welcher die Wahrscheinlichkeit für das Ereignis ist.

Gruß
A.
aziz
 
Danke gegeben:
Danke bekommen: mal in Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste