Wahrscheinlichkeitsrechnung/Forschungserfolg

Fragen, die sich auf kein spezielles Verfahren beziehen.

Wahrscheinlichkeitsrechnung/Forschungserfolg

Beitragvon Simi22 » Mo 22. Nov 2021, 04:46

Liebe Alle,

im Rahmen eines Projekts müsste ich Wahrscheinlichkeiten errechnen und würde gerne am Beispiel des unteren fiktiven Cases Eure Meinung dazu wissen, ob mein Vorgehen korrekt ist bzw. wo mein Denkfehler liegt :)

Der Case lautet folgendermaßen:

Im Rahmen eines Forschungsprojektes sind Erfolgswahrscheinlichkeiten (Ew) für den Übergang von einer Phase in die nächste Phase bekannt.
Annahmegemäß:
Ew von Ph 1: 60%
Ew von Ph 2: 35%
Ew von Ph 3: 65%
Ew von Ph 4: 70%
Ew von Ph 5: 40%

1) Um bei einmaliger Durchführung des Forschungsprojekts herauszufinden wie hoch die Wahrscheinlichkeit im Schnitt ist, dass man in Ph5 kommt müsste man rechnen: 60%*35%*65%*70% bzw. dass man ein brauchbares Molekül findet (Forschungserfolg): 60%*35%*65%*70%*40%, ist dies korrekt?

2) Wenn man herausfinden möchte, wie hoch die Wahrscheinlichkeit ist, dass man zB. an Phase 3 scheitert, müsste man rechnen: 60%*35%*(100%-65%), korrekt? Es wäre nicht richtig zu rechnen 60%*35%*(100%-(60%*35%*65%)), oder?

3) Wenn man annimmt, dass man das Projekt fünfmal durchführt, dann müsste man die Rechnung nochmal mal 5 nehmen, oder? (Die Überlegung wäre, dass bei mehr Projekten die Wahrscheinlichkeit im Schnitt höher ist, dass man ein erfolgreiches Molekül findet) Also zB. bei 1) 5*60%*35%*65%*70% (Ph5) bzw. 5*60%*35%*65%*70%*40% (Erfolg), sowie bei 2) 5*60%*35%*(100%-65%).

4) Wie berechnet man nun die Wahrscheinlichkeit, dass bei x-facher Durchführung des Projekts, nicht nur 1, sondern 2 brauchbare Molekül gefunden werden können? Ich dachte vielleicht müsste der Binomialkoeffizient genutzt werden. In Excel wäre zB. bei einer 5 maligen Durchführung des Projekts folgendes zu rechnen P(2) = Binom.Dist(2(Anzahl der Erfolge),5(Versuchsdurchführung),60%*35%*65%*70%*40% (Erfolgswahrschinlichkeit),False) = gesuchter Prozentsatz, dass man zwei brauchbare Moleküle findet. Bei Durchrechnung für jede Phase 1-5 haben sich bei meinem (tatsächlichen Fall) allerdings "komische" Ergebnisse ergeben: So war die errechnete Wahrscheinlichkeit, dass man 2 brauchbare Moleküle findet bis Ph1 (erfolgreicher Abschluss Ph 1) niedriger, als bis Phase 2 (erfolgreicher Abschluss von Ph1 & Ph 2) usw. Dies erscheint mir nicht logisch, viel mehr hätte ich wie bei der Rechnung zu einem Molekül erwartet, dass die Ew immer kleiner wird, weil immer mehr Phasen dazukommen, also am Ende des Prozesses die Wahrscheinlichkeit quasi am kleinsten ist. Offensichtlich habe ich einen Denkfehler. Kann mir vielleicht einer von Euch helfen?

5) Wie müsste man die Rechnung in 4) eigentlich modifizieren, wenn man errechnen möchte, wie hoch die Wahrscheinlichkeit ist, dass gleich hintereinander zwei erfolgreiche Moleküle gefunden werden können? Müsste man dann rechnen (zb. für Ph 2): 60%*35%*60%*35%?

Es ist wahrscheinlich wirklich nicht komplex, aber i-wie stehe ich auf dem Schlauch.

Vielen lieben Dank Euch
Simi.
Zuletzt geändert von Simi22 am Mo 22. Nov 2021, 10:23, insgesamt 1-mal geändert.
Simi22
Beobachter
Beobachter
 
Beiträge: 13
Registriert: Mo 22. Nov 2021, 03:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wahrscheinlichkeitsrechnung/Forschungserfolg

Beitragvon strukturmarionette » Mo 22. Nov 2021, 09:12

Hi,

- Prozentzahlen sind Dreisatzrechnung
- stelle zunächst dar die Entstehund deiner Prozentzahlen

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Wahrscheinlichkeitsrechnung/Forschungserfolg

Beitragvon Simi22 » Mo 22. Nov 2021, 09:58

Hi,

vielen lieben Dank für Deine Antwort!

Die Erfolgswahrscheinlichkeiten der Phasen in der Aufgabe sind fiktiv. Ansonsten habe ich dargestellt wie ich rechnen würde.

LG
Simo
Simi22
Beobachter
Beobachter
 
Beiträge: 13
Registriert: Mo 22. Nov 2021, 03:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wahrscheinlichkeitsrechnung/Forschungserfolg

Beitragvon bele » Mo 22. Nov 2021, 13:59

Hallo Simi,

Simi22 hat geschrieben:würde gerne am Beispiel des unteren fiktiven Cases Eure Meinung dazu wissen


Meine Erfahrungen und Meinungen zu solchen erdachten Parallelproblemen habe ich hier schonmal zusammengefasst: nutzung-des-forums-f44/das-musste-mal-gepostet-werden-t6682.html#p31013

1) Um bei einmaliger Durchführung des Forschungsprojekts herauszufinden wie hoch die Wahrscheinlichkeit im Schnitt ist, dass man in Ph5 kommt müsste man rechnen: 60%*35%*65%*70% bzw. dass man ein brauchbares Molekül findet (Forschungserfolg): 60%*35%*65%*70%*40%, ist dies korrekt?


Naja, das ist dann richtig gerechnet wenn man Unabhängigkeit zwischen den Ereignissen konstatiert. Das mag sachwissenschaftlich berechtigt oder eine steile These oder absoluter Quatsch sein. Das Multiplizieren der Ereigniswahrscheinlichkeiten für die UND-Verknüpfung gilt aber eben nur für unabhängige Wahrscheinlichkeiten.

2) Wenn man herausfinden möchte, wie hoch die Wahrscheinlichkeit ist, dass man zB. an Phase 3 scheitert, müsste man rechnen: 60%*35%*(100%-65%), korrekt?


Das hängt ein bisschen von der präzisen Definition von "An Phase 3 scheitern" ab. Wenn Ereignis/Phase 1 sich nicht verwirklicht, bin ich dann (nicht) an Phase drei gescheitert? Das Ereignis Phase 1 ist erfüllt UND Phase 2 ist erfüllt UND Phase 3 hat sich nicht erfüllt ist das Produkt dieser Warhscheinlichkeiten WENN diese Wahrscheinlichkeiten voneinander unabhängig sind.

3) Wenn man annimmt, dass man das Projekt fünfmal durchführt, dann müsste man die Rechnung nochmal mal 5 nehmen, oder?


Um genau was zu berechnen? Den Erwartungswert dafür, dass sich mindestens einmal ein Erfolg einstellt, wiederum unter der Annahme kompletter Unabhängigkeit? Nein. Den Erwartungswert der Anzahl der sich einstellenden Erfolge unter Unabhängigkeitsannahmen? Ja.

4) Wie berechnet man nun die Wahrscheinlichkeit, dass bei x-facher Durchführung des Projekts, nicht nur 1, sondern 2 brauchbare Molekül gefunden werden können?


Meines Erachtens haben wir dafür längst nicht genug Annahmen getroffen. Wenn überhaupt nur ein Molekül existiert, das man nach den o. g. Wahrscheinlichkeiten finden kann ist die Wahrscheinlichkeit Null. Wenn es unendlich viele auffindbare Moleküle gibt, dann ist die Gefahr, ein zweites Mal das erste Molekül zu finden, vernachlässigbar, aber wenn es nur fünf auffindbare Moleküle gibt dann ist sie nicht mehr zu vernachlässigen. Es kommt also sehr auf den Sachverhalt an.


5) Wie müsste man die Rechnung in 4) eigentlich modifizieren, wenn man errechnen möchte, wie hoch die Wahrscheinlichkeit ist, dass gleich hintereinander zwei erfolgreiche Moleküle gefunden werden können?


Zweimal hintereinander bei zwei Versuchen oder zweimal hintereinander bei unendlich vielen Versuchen oder zweimal hintereinander bei einer gegebenen Zahl von Versuchen? Wiederum aus einem unbegrenzten oder einem begrenzten Pool an möglichen Molekültreffern?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5917
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts

Re: Wahrscheinlichkeitsrechnung/Forschungserfolg

Beitragvon Simi22 » Mo 22. Nov 2021, 14:42

Lieber Bernhard,

vielen lieben Dank schonmal für Deine ausführliche Antwort!!! Diese hilft mir sehr.

Ich habe aufgrund der von dir im Blogeintrag erwähnten Probleme bewusst (versucht) zu vermeiden zu sehr zu vereinfachen und den Kontext weitmöglichst realistisch zu halten.
Trotzdem habe ich offensichtloch zu wenige Informationen geliefert. Entschuldige bitte!

Bevor ich auf deine Kommentare eingehe, gebe ich also noch etwas Kontext: Es geht im Prinzip um die Entscheidung zwischen verschiedenen Anbietern für ein Forschungsvorhaben. Alle Anbieter verlangen unterschiedliche Gegenleistungen für Teilerfolge. Einige wollen für den erfolgreichen Abschluss von Ph1 10 Mio, andere für den Abschluss von Ph3 5 Mio, etc. Diese Gegenleistungen fallen immer pro Produkt an (dh. der Anbieter kriegt für den erfolgreichen Abschluss von Ph 1 pro Produkt den Betrag x). Um einen risikoadjustierten Vergleich der Anbieter zu ermöglichen, wollte ich die Gegenleistungen entsprechend der Wahrscheinlichkeit ihres Eintritts gewichten. Vereinfachend wollte ich die Anbieter basierend auf zwei Produkten vergleichen. Also quasi fürs erste Produkt errechnen wie wahrscheinlich zB. der Eintritt von Phase x ist (und wie hoch damit die zu erwartende Zahlung ist) und für ein zweites Produkt errechnen wie wahrscheinlich der Eintritt von Phase x ist. Dabei gehe ich davon aus, dass man 5 Mal probiert ein Produkt (Molekül) zu finden.

1) Genau, es wird vereinfachend Unabhängigkeit zwischen den Ereignissen konstatiert.
2) Genau, ich wollte die Wahrscheinlichkeit dazu berechnen, dass sich das Ereignis Phase 1 erfüllt UND Phase 2 erfüllt, aber Phase 3 nicht erfüllt (weiterhin unter der Annahme der Unabhängigkeit).
3)Wenn ich die Wahrscheinlichkeit berechnen wollen würde, dass bei 5 Projekten (5 Versuchen) im Schnitt eines erfolgreich ist (dh. alle Phasen erfolgreich abschließt), was müsste ich dann anders rechnen? Ich bin tatsächlich nicht, an der Wahrscheinlichkeit interessiert, dass sich mindestens ein Erfolg einstellt, sondern dass sich genau 1 Erfolg einstellt (es geht quasi darum, die Wahrscheinlichkeit für ein erfolgreiches Produkt bei 5 Veruschen zu ermitteln). Wäre meine Rechnung dann nicht richtig?
4) Es gibt sehr, sehr, sehr viele Moleküle, sodass die Wahrscheinlichkeit das erste ein zweites Mal zu finden vernachlässigbar ist. Was ich im Prinzip errechnen möchte ist die Wahrscheinlichkeit, dass sich bei 5 Projekten (5 Versuchen) genau 2 Erfolge einstellen, also quasi die Wahrscheinlichkeit, dass es ein zweites erfolgreiches Produkt gibt, bei 5 Versuchen.
5) Zweimal hintereinander bei 5 Versuchen - aus einem sehr, sehr, sehr großen Pool an Trefferen, sodass wohl ein unbegrenzter Pool angenommen werden kann.

Ich hoffe meine Ausführungen waren verständlich! Gib gerne erneut Bescheid, sollten Informationen fehlen.

Beste Grüße und nochmals vielen Dank
Simi
Simi22
Beobachter
Beobachter
 
Beiträge: 13
Registriert: Mo 22. Nov 2021, 03:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wahrscheinlichkeitsrechnung/Forschungserfolg

Beitragvon bele » Mo 22. Nov 2021, 17:17

Hallo Simi,

wenn das alles unabhängige Ereignisse sind und man die UND-Wahrscheinlichkeit durch Multiplikation der Teilwahrscheinlichkeiten errechnen kann, dann wird hieraus:

Ew von Ph 1: 60%
Ew von Ph 2: 35%
Ew von Ph 3: 65%
Ew von Ph 4: 70%
Ew von Ph 5: 40%


die Gesamtwahrscheinlichkeit 60% * 35% * 65% * 70% * 40% und damit in meiner Rechnung
Code: Alles auswählen
> .60 * .35 *.65 * .70 * .40
[1] 0.03822


also 3,822%. Das kann man jetzt in eine Binomialformel einsetzen oder eine entsprechende Funktion nutzen.

Code: Alles auswählen
> dbinom(2, 5, prob = .03822)
[1] 0.01299597


Also währe die Wahrscheinlichkeit, dass genau zwei von fünf Versuchen mit einer jeweiligen Eintrittswahrscheinlichkeit von 3,8% auftreten 1,3% (zu82% kein Treffer, zu 1,6% ein Treffer, zu 0,05% drei Treffer usw.)

HTH,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5917
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts

Re: Wahrscheinlichkeitsrechnung/Forschungserfolg

Beitragvon Simi22 » Mo 22. Nov 2021, 17:55

Lieber Bernhard,

vielen Dank für Deine Antwort. So hätte ich auch gerechnet.
Kannst Du mir vielleicht erklären, warum man für mich "komische" Ergebnisse erhält wenn man die Versuchszahl auf 10 erhöht.

Mit der Rechnung ergibt sich für den erfolgreichen Abschluss von Ph1 nur eine Wahrscheinlichkeit von 1,06% (Binom.dist(2;10;0,6; False); Ph2: 29% (Binom.dist(2;10;0,21; False); Ph3: 28% (Binom.dist(2;10;0,14; False); Ph4: 21% (Binom.dist(2;10;0,10;False) und Ph5: 6% (Binom.dist(2;10;0,038; False).
Also die Ergebnisse für Ph2-Ph5 machen Sinn für mich, aber das Ergebnis von Ph1 nicht. Kannst Du mir erklären, warum die Prozente nicht immer kleiner werden. Dies hatte mich bei meiner Rechnung verunsichert.

Vielen Dank nochmal und LG
Simi
Simi22
Beobachter
Beobachter
 
Beiträge: 13
Registriert: Mo 22. Nov 2021, 03:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wahrscheinlichkeitsrechnung/Forschungserfolg

Beitragvon bele » Mo 22. Nov 2021, 18:49

"Für Dich komisch" heißt, Du hattest irgendeine Erwartung die nicht erfüllt wurde. Du wirst diese Erwartung schon erklären und begründen müssen, wenn andere was dazu sagen sollen. Warum sollten die Prozente immer kleiner werden?

LG, Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5917
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts

Re: Wahrscheinlichkeitsrechnung/Forschungserfolg

Beitragvon Simi22 » Mo 22. Nov 2021, 23:36

Ich dachte sie würden kleiner werden, da man in jedem Schritt eine weitere Phase überwinden muss.
Auf der anderen Seite könnte bei Ph1 der geringe Prozentsatz in dem Sinne Sinn machen, dass man sagt, dass bei 60% Erfolgswahrscheinlichkeit und 10 Versuchen einfach die Wahrscheinlichkeit "nur" 2 Treffer zu generieren gering ist.

LG
Simi
Simi22
Beobachter
Beobachter
 
Beiträge: 13
Registriert: Mo 22. Nov 2021, 03:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wahrscheinlichkeitsrechnung/Forschungserfolg

Beitragvon bele » Di 23. Nov 2021, 10:22

Hallo Simi,

Ich dachte sie würden kleiner werden, da man in jedem Schritt eine weitere Phase überwinden muss.


Die Chance auf Treffer überhaupt und der Erwartungswert der Treffer, die sinken natürlich, wie Du es auch intuitiv vermutest.

dass bei 60% Erfolgswahrscheinlichkeit und 10 Versuchen einfach die Wahrscheinlichkeit "nur" 2 Treffer zu generieren gering ist


Dein letzter Satz trifft ins Schwarze. In Ph1 ist der Erwartungswert 10 * 0,6 = 6 Treffer, also deutlich mehr als die geforderten 2. Ph1 wird also im Allgemeinen zuviele Treffer generieren. Weil es vor allem zuviele Treffer gibt werden Fälle mit zuvielen Treffern auch häufiger in der zweiten Stufe aussortiert und das Verhältnis verschiebt sich. Weil jetzt im Erwartungswert nicht mehr 6 Treffer sondern nur noch 2,1 Treffer zu erwarten sind ist der Anteil der "genau 2 Treffer" auch intuitiv nachvollziehbar größer.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5917
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts

Nächste

Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron