95% Perzentil - Gleichverteilung

Fragen, die sich auf kein spezielles Verfahren beziehen.

95% Perzentil - Gleichverteilung

Beitragvon lobo5 » Di 8. Mai 2018, 12:14

Hallo,

bitte entschuldigt diese simple Frage. Ich bin schon ewig nicht mehr in Kontakt mit Statistik gekommen, muss jetzt aber folgendes Überprüfen:

Ich habe eine Gleichverteilung von 800 Ereignissen über einen Zeitraum von 5 Jahren (60Monaten).
Nun möchte ich wissen, wie hoch die maximale Zahl der Ereignisse pro Monat im 95% Konfidenzintervall (richtiger Begriff?) ist.

Wie mache ich das? Ich arbeite in Excel und bin mir sicher, dass ich mit dem richtigen Stichwort auch bei Youtube fix fündig werden würde.

Viele Grüße und danke für die Hilfe!
lobo5
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 8. Mai 2018, 12:08
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: 95% Perzentil - Gleichverteilung

Beitragvon PonderStibbons » Di 8. Mai 2018, 12:28

Ich habe eine Gleichverteilung von 800 Ereignissen über einen Zeitraum von 5 Jahren (60Monaten).

Das kann keine Gleichverteilung sein, weil es eine krumme Zahl wäre (800/60=13,33).
Nun möchte ich wissen, wie hoch die maximale Zahl der Ereignisse pro Monat im 95% Konfidenzintervall (richtiger Begriff?) ist.

Wenn Du eine Gleichverteilung annimmst, dann wäre die Zahl in jedem Monat eben
gleich und es gäbe keine sinnvolle maximale Zahl.

Oder meinst Du eventuell, 800 Ereignisse verteilen sich UNgleich über 60 Monate? In dem Fall
wäre zu klären, was Du bei maximale Zahl der Ereignisse pro Monat im 95% Konfidenzintervall
so in etwas vorschwebt. Was für Ereignisse sind das denn?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: 95% Perzentil - Gleichverteilung

Beitragvon lobo5 » Di 8. Mai 2018, 12:40

Hallo PonderStibbons,

danke für die schnelle Antwort!
Es handelt sich um eine "simulierte Gleichverteilung".

Hintergrund ist folgender:
Es soll beleuchtet werden, ob historische Ereignisse zufälligerweise gehäuft auftraten, oder ob eine Häufung von Ereignissen tatsächlich auch statistisch nachweisbar ist. Dazu teste ich, ob es zwischen dem Datum des realen Auftretens des Ereignisses (dh. Monat, Jahr) und einer simulierten Gleichverteilung (Ereignisse können theoretisch in jedem Monat gleich wahrscheinlich stattfinden) Unterschiede gibt.

Ist diese Beschreibung verständlich?

Jetzt wird vielleicht auch klarer, wozu die 95%-Hürde dienen soll: Wenn meine reale Verteilung über der 95%-Hürde einer simulierten Verteilung liegt, kann ich annehmen, dass die Ereignisse nicht mehr zufällig (gleich) verteilt sind.

VIele Grüße
lobo5
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 8. Mai 2018, 12:08
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: 95% Perzentil - Gleichverteilung

Beitragvon strukturmarionette » Di 8. Mai 2018, 13:08

Hi,

also bspw sowas:
Bayern München gwinnt im Jan 4mal
Bayern München gwinnt im Feb 4*
Bayern München gwinnt im März 4*
Bayern München gwinnt im Apr 4*
Bayern München gwinnt im Mai 4*
u.s.w.
- ?
- (oder was?)

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: 95% Perzentil - Gleichverteilung

Beitragvon PonderStibbons » Di 8. Mai 2018, 13:38

Vielleicht willst Du testen, ob die Verteilung der Ereignisse über die n=60 Monate
aus einer gleichverteilten Grundgesamtheit stammt. Das wäre z.B. mit einem
Kolmogorov-Smirnov Test auf Gleichverteilung zu machen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: 95% Perzentil - Gleichverteilung

Beitragvon lobo5 » Di 8. Mai 2018, 14:10

strukturmarionette hat geschrieben:Hi,

also bspw sowas:
Bayern München gwinnt im Jan 4mal
Bayern München gwinnt im Feb 4*
Bayern München gwinnt im März 4*
Bayern München gwinnt im Apr 4*
Bayern München gwinnt im Mai 4*
u.s.w.
- ?
- (oder was?)

Gruß
S.

Hallo ihr beiden. Vielen Dank für eure Hilfe!

Zum Bayern-Beispiel:
Prinzipiell ja, das Beispiel ist jedoch etwas sperrig, da man hier den Einfluss des Gegners (gut, schlecht, Championsleague) noch im HInterkopf behalten muss.

Konkret geht es in meinem Beispiel um das "Wellenverhalten" von Unternehmensfusionen. Unternehmensfusionen wie zur Zeit etwa Bayer/Monsanto treten häufig in Wellen auf, dh. es gibt Jahre in denen viele Transaktionen stattfinden, und dann gibt es wieder relativ ruhige Jahre (zB. die Jahre der Finanzkrise).

Harford, ein Wissenschaftler auf diesem Gebiet, hat einen Test entwickelt, mit dem er objektiv solche Wellen identifizieren kann. Diesen möchte ich nachvollziehen. Ich erkläre ihn im folgenden, damit ihr vielleicht auch mich versteht :)

Zuerst identifiziert er die höchste Konzentration tatsächlicher Unternehmensübernahmen innerhalb eines Teils des Untersuchungszeitraums.
Angenommen wir bleiben bei 60 Monaten für die gesamte Untersuchungsperiode, so wird er innerhalb dieser 60 Monate diejenigen 12 zusammenhängenden Monate suchen, in denen die Summe der Unternehmensübernahmen am höchsten ist.

Beispiel:
Untersuchungsperiode: 01/2000 bis 12/2004 - 60 Monate
Gesamtzahl Transaktionen: 800
Davon findet die größte Zahl von Transaktionen, nämlich 400, in den 12 Monaten beginnend mit April 2002 statt ("Aktivitätsmaximum")

Im nächsten Schritt vergleicht er, ob diese 400 Transaktionen innerhalb der 12 Monate innerhalb der 95% einer Gleichverteilung liegen, sprich: liegt eine Welle vor, oder ist das noch durch "normale Schwankungen" / den Zufall gedeckt?

Hierzu verteilt er die Gesamtheit der Ereignisse (Transaktionen) über die 60 Monate mit Hilfe einer Gleichverteilung neu, dh. er löst das Ereignis von seinem realen Datum und verteilt es neu auf die Monate. Jeder Monat ist dabei gleich wahrscheinlich. Nach 1000 Simulationen vergleicht er sein oben beschriebenes "Aktivitätsmaximum" (400 Transaktionen ab April 2002-März 2003) mit dem 95% der berechneten, künstlichen Verteilung.

In seinen Worten, falls ich zu unklar bin:
"This 24-month period is identified as a potential wave.
Taking the total number of bids over the entire decade for a given industry,
I simulate 1000 distributions of that number of occurrences of industry member
involvement in a bid over a 120-month period by randomly assigning each
occurrence to a month where the probability of assignment is 1/120 for each month.
I then calculate the highest 24-month concentration of activity from each of the 1000
draws. Finally, I compare the actual concentration of activity from the potential
wave to the empirical distribution of 1000 peak 24-month concentrations. If the
actual peak concentration exceeds the 95th percentile from that empirical
distribution, that period is coded as a wave"



Ich hoffe ich mache mich hiermit verständlicher :D
Mir geht es um die 95% - Die Gleichverteilung und das Aktivitätsmaximum ist ja nicht so schwer herauszufinden.
Doch wie kann ich die Zahl der Transaktionen bestimmen, bei denen ich anhand von Harford's Vorgehen bestätigen kann, dass es sich um eine Welle handelt?

Viele Grüße
lobo5
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 8. Mai 2018, 12:08
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: 95% Perzentil - Gleichverteilung

Beitragvon PonderStibbons » Di 8. Mai 2018, 14:27

Steht doch da? Ihn interessiert eine 24-Monats-Periode. Er lässt 1000x eine Simulation laufen, in der jeweils die Ereignisse zufällig auf 120 Monate verteilt werden. Dann ermittelt er für jeden Durchlauf die 24-Monats-Periode mit der größten Zahl Ereignisse. Damit hat er 1000 Maxima. Am Ende vergleicht er, ob seine emprische Zahl an Ereignissen über 24 Monate höher ist als die Maxima in 95% der Durchläufe. Nach der Methode musst Du also eine Simulation programmieren, wie es aussieht.

Mit freundlichen Grüßen

PonderStibbons

P.S.
zu schreiben
diese simple Frage.
ist ziemlich daneben, nicht zuletzt angesichts der Null-Info im ersten Beitrag.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
lobo5

Re: 95% Perzentil - Gleichverteilung

Beitragvon bele » Di 8. Mai 2018, 14:28

Hallo lobo,

meinst Du nicht, Du hättest diese Informationen in Deinen Eröffnungspost schreiben sollen?

Mit dem neuen Wissen kannst Du zwei Wege gehen: Du kannst, wie oben beschrieben, eine Simulation programmieren und daraus die Informationen ziehen. Ist nicht schwer, erfordert aber etwas Programmierkenntnisse. Oder Du kannst einen ähnlichen Weg über eine Poissonverteilung gehen. Vorher musst Du noch klären, ob Du die unterschiedliche Länge der Monate in Betracht ziehen willst, ob Du Feiertag und Wochenenden berücksichtigen möchtest, oder ob das zuviel kleinklein ist.

Nehmen wir an, dass all diese Ereignisse voneinander unbhängig sind, und dass sie pro Monat im Schnitt mal auftreten.

Dann kann man mit der Poissonverteilung für jede Häufigkeit k ausrechnen, wie wahrscheinlich sie ist. Siehe z. B. https://de.wikipedia.org/wiki/Poisson-Verteilung

Beispielhaft im Statistikprogramm R wäre die Wahrscheinlichkeit, dass k kleiner oder gleich 13 ist:
Code: Alles auswählen
> ppois(13, 13.3333)
[1] 0.5364531

Also etwa 53,6 %.

Die Wahrscheinlichkeit, dass k kleiner oder gleich 20 ist:
Code: Alles auswählen
> ppois(20, 13.3333)
[1] 0.9685565

Also etwa 96,9 %

Man könnte sich also vorstellen, bei 20 die Grenze für eine Welle zu setzen. Mit etwas mehr Mühe könnte man unterschiedlich lange Monate und Feiertage auch berücksichtigen. Dann müsste man halt statt 13,3333 eine andere Zahl einsetzen, die man aus der Zahl der Arbeitstage in dem Monat und der Zahl der Arbeitstage in den 60 Monaten ausrechnet.

Fazit: Unbedingt mal Poissonverteilung googlen, falls Deine Programmierkenntnisse nicht ausreichen, das Original nachzukochen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5920
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1401 mal in 1387 Posts

Re: 95% Perzentil - Gleichverteilung

Beitragvon lobo5 » Di 8. Mai 2018, 16:13

PonderStibbons hat geschrieben:P.S.
zu schreiben
diese simple Frage.
ist ziemlich daneben, nicht zuletzt angesichts der Null-Info im ersten Beitrag.

Hallo,

das kam vielleicht etwas falsch rüber. Ich dachte nicht, dass all die Infos notwendig sind. Viel mehr habe ich gehofft, die Situation vereinfacht darstellen zu können.
Vielen Dank für die Hilfe! Nichts vom dem geschriebenen sollte "daneben" rüberkommen.
lobo5
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 8. Mai 2018, 12:08
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: 95% Perzentil - Gleichverteilung

Beitragvon lobo5 » Di 8. Mai 2018, 16:14

bele hat geschrieben:Hallo lobo,

meinst Du nicht, Du hättest diese Informationen in Deinen Eröffnungspost schreiben sollen?

Hallo Bernhard,

rückblickend wäre das wohl cleverer gewesen. Vielen herzlichen Dank für deine ausführliche Erklärung!
bele hat geschrieben:Mit dem neuen Wissen kannst Du zwei Wege gehen: Du kannst, wie oben beschrieben, eine Simulation programmieren und daraus die Informationen ziehen. Ist nicht schwer, erfordert aber etwas Programmierkenntnisse. Oder Du kannst einen ähnlichen Weg über eine Poissonverteilung gehen. Vorher musst Du noch klären, ob Du die unterschiedliche Länge der Monate in Betracht ziehen willst, ob Du Feiertag und Wochenenden berücksichtigen möchtest, oder ob das zuviel kleinklein ist.

Nehmen wir an, dass all diese Ereignisse voneinander unbhängig sind, und dass sie pro Monat im Schnitt mal auftreten.

Dann kann man mit der Poissonverteilung für jede Häufigkeit k ausrechnen, wie wahrscheinlich sie ist. Siehe z. B. https://de.wikipedia.org/wiki/Poisson-Verteilung

Beispielhaft im Statistikprogramm R wäre die Wahrscheinlichkeit, dass k kleiner oder gleich 13 ist:
Code: Alles auswählen
> ppois(13, 13.3333)
[1] 0.5364531

Also etwa 53,6 %.

Die Wahrscheinlichkeit, dass k kleiner oder gleich 20 ist:
Code: Alles auswählen
> ppois(20, 13.3333)
[1] 0.9685565

Also etwa 96,9 %

Man könnte sich also vorstellen, bei 20 die Grenze für eine Welle zu setzen. Mit etwas mehr Mühe könnte man unterschiedlich lange Monate und Feiertage auch berücksichtigen. Dann müsste man halt statt 13,3333 eine andere Zahl einsetzen, die man aus der Zahl der Arbeitstage in dem Monat und der Zahl der Arbeitstage in den 60 Monaten ausrechnet.

Fazit: Unbedingt mal Poissonverteilung googlen, falls Deine Programmierkenntnisse nicht ausreichen, das Original nachzukochen.

LG,
Bernhard

Ich werde mich an R und der Poissonverteilung mal probieren.
Viele Grüße!
lobo5
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 8. Mai 2018, 12:08
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 8 Gäste