Exponentiell fallende Verteilung aus Durchschnitt und Grenz

Fragen, die sich auf kein spezielles Verfahren beziehen.

Exponentiell fallende Verteilung aus Durchschnitt und Grenz

Beitragvon lightplay » Mo 25. Jul 2016, 10:06

Hallo liebe Statistik-Cracks!

Ich habe ein Problem berufliche Natur, habe schon etwas herum probiert, aber für alle Funktionen haben entweder Durchschnitt oder x-Wert ab dem der Grenzwert gilt, nicht gepasst.

Gesucht ist eine Funktion, die das folgende beschreibt:


Besucher von Events wurden zu ihrer Anfahrt zum Event befragt.

Bei einer Befragung ergibt sich, dass die Besucher im Durchschnitt 11,6km zu den Events gefahren sind. Es kommen zwar auch vereinzelt Besucher aus 100km Entfernung, aber ab 24,7km sind keine signifikanten Besucheranzahlen zu verzeichnen.

Auf der Grundlage soll eine Marktkapazität abgeschätzt werden. Gesucht ist also eine Funktion vom Radius, die in Abhängigkeit von der Entfernung beschreibt, welcher “Anteil Besucher“ erwartet werden kann (dazu ist das Ergebnis mit den Einwohnern in dieser Entfernung zu multiplizieren); also für x km Entfernung sind y von Hundert möglichen Besuchern anzurechnen.

Ich gehe davon aus, dass es sich um eine “horizontal gespiegelte“ sigmoidale Funktion handelt (z.B. g(x) = 1-f(x) mit f(x) sigmoidal), die dann bei der Entfernung 0 km, also g(0) den Wert 1 hat, diesen bis z.B. 5 km praktisch beibehält und dann exponentiell bis zur Entfernung von ca. 25km abfällt.

Dabei gibt es dann die Randbedingungen, dass für s(0,n) = {∑[ i = 0...n](g(i)·i)}/n = 11,6km mit n ∈ ℕ+ und n → ∞ gilt.

Außerdem sollte g(24,7km) ≤ 0,01 sein (ungefähr). Und wenn g(x) eine Normalverteilung ist, so sollte ∫[i=0...n](f(i)) = 1 sein für n ∈ ℕ+ und n → ∞, oder?

Es ist vermutlich nicht eine einzelne Funktion, sondern eine Funktionsschar ist, die diese Anforderungen erfüllt.

Ist damit prinzipiell eine Abschätzung nach Entfernung möglich? Welche Unsicherheit/Einschränkungen gibt es und wie kann eine konkrete, parametrierte, mögliche Lösung dafür aussehen. Es muss für die Abschätzung auch nicht die definitive, einzig wahre Lösung sein, es soll damit aber eine erste, sehr grobe Abschätzung möglich sein.

Wenn ich etwas falsch sehe, bin ich offen für jede Kritik - wir haben leider nicht viel mehr Informationen und ich soll daraus jetzt etwas zaubern.
Deswegen interessiert mich, gibt es dafür irgendeine (sinnvolle) Lösung oder ist das hoffnungslos? Oder gibt es eventuell eine andere Herangehensweise?

Danke für jede Hilfe,

Jens
lightplay
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mo 25. Jul 2016, 09:54
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Exponentiell fallende Verteilung aus Durchschnitt und Gr

Beitragvon mango » Di 26. Jul 2016, 13:11

Hallo,

wie kommst du denn auf deine Funktionsform? Es könnte z. B. auch die kumulierte Dichtefunktion der Normalverteilung sein.

Ohne mich näher mit den Restriktionen befasst zu haben: Ich bin mir nicht sicher, worauf deine eigentliche Frage abzielt. Als nächstes müsstest du jedenfalls überlegen, was du genau vorhersagen möchtest: Die Wahrscheinlichkeit, dass ein bestimmtes Individuum kommt? Denn die Entfernung eines Individuums, das kommt, kannst du natürlich nicht vorhersagen. Bzw. da wäre der Erwartungswert immer das arithmetische Mittel aus allen Entfernungen und das ist recht uninformativ für dich. Du kannst maximal die Wahrscheinlichkeit, dass ein Individuum aus einem gewissen Intervall angereist ist, einen bestimmten Wert hat, vorhersagen.
mango
Elite
Elite
 
Beiträge: 330
Registriert: Fr 2. Mai 2014, 16:55
Danke gegeben: 3
Danke bekommen: 55 mal in 55 Posts

Re: Exponentiell fallende Verteilung aus Durchschnitt und Gr

Beitragvon lightplay » Di 26. Jul 2016, 14:44

Ich bin eher von etwas wie https://en.m.wikipedia.org/wiki/Gompertz_distribution für den Abzug (quasi Wahrscheinlichkeit, dass keiner aus der Entfernung i kommt) ausgegangen.
Wenn Gompertz die Gegenwahrscheinlichkeit (g(i) = 1-f(i)) ist, bei der gilt kumulativ, asymptotisch gegen 1 gehend, bei 0 beginnend, ab einer gewissen Distanz immer schneller (= exponentiell) steigend, dann hätte f(i) meiner Meinung nach die passende Form.

Der Zusammenhang ist: In ein Theater kommen nicht nur Personen einer Stadt, sondern auch Leute aus dem Umland. Aber nicht nur aus dem Umland, sondern ggf. auch von weiter weg. Es werden aber mit zunehmender km-Zahl (Entfernung) immer weniger - mehr oder weniger erstaunlicherweise wir die Zahl aber auch für vergleichsweise hohe Entfernungen nicht null: auch aus 100km oder mehr Entfernung sind Gäste vertreten (je ausgefallener die Inszenierung, je bekannter die Bühne, desto mehr). Aber die Anzahl der Gäste die über der “Grenze“ liegen ist gering bis sehr gering. Diese Abnahme ist also nicht linear. Die Wahrscheinlichkeit nähert sich nach einer anfänglichen, kaum abnehmenden Plateauphase (innerhalb des Stadtgebiets bis 5 oder 6 km) zunächst schnell zunehmend, mit einem Maximum der ersten Ableitung um 11 bis 17 km, dann immer langsamer der 0.
Also sinkt die verfügbare Marktkapazität (Anzahl der potentiellen Besucher) für das Theater exponentiell in Abhängigkeit von der Entfernung.

Mit f(i) sollte man dann mit einer Tabelle der Orte und Einwohner im Umkreis für die bekannten Entfernung des Ortes i vom Event und der Einwohnerzahl b des Ortes eine Marktkapazität abschätzen können (Summe von i = 0 bis 24,7 über Einwohnerzahl b[i] mal Wahrscheinlichkeit f(i), dass ein Individuum aus der Entfernung i kommt).
Das ist natürlich je nach Inszenierung unterschiedlich, aber ich dachte, das man sich so bei der begrenzten Datenlage annähern kann.

Die kumulierte Normalverteilung hat meiner Ansicht nach die Schwäche, dass diese am Anfang (0km) nicht auf 1 kommt.
Außerdem kann ich zwar für den Erwartungswert dann 11,6 angeben und eine Standardabweichung mit 11,6 ± 2×(24,7-11,6) angeben, aber ich glaube, wenn die Besucher im Schnitt 11,6 km fahren, müsste der Wert bei 11,6km tatsächlich über 0,5 liegen, eher bei 0,65 o.ä.
Wenn ich nämlich die Summe über i = 0 bis 24,7 für {f(i)×i} bilde und diese durch (i+1) teile, liegt dieser Durchschnitt deutlich unter 11,6km. Das klingt für mich plausibel, das ja zum einen die Besucher mit kürzerer Anreise (wobei kurz mindestens bis zur Stadtgrenze geht) mit f(i) = 1 gewertet werden müssten.
Wenn die “natürliche Grenze“ (darunter nicht relevanter Anteil) der Anreise bei 24,7km liegt, aber gleichzeitig auch regelmäßige Aussetzer für Entfernungen >> 24,7km existieren, so sollte ab 24,7km das Integral um 0,3% bis maximal 3% liegen.

Verstehst Du das Problem so oder fehlt da noch etwas?

Danke!
lightplay
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mo 25. Jul 2016, 09:54
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 23 Gäste