Hallo nash,
ich würde das als zwei verschiedene Binomialprozesse verstehen. Jeder gescreente (600 bzw 2400) hat eine Wahrscheinlichkeit
in eine Medikamentenstudie zu kommen und jeder in die Medikamentenstudie gekommene hat eine Wahrscheinlichkeit
dass er auf das Medikament anspricht.
Machen wir erst den ersten Schritt: Wenn von 600 gescreenten 200 eingeschlossen werden, dann ist das 1/3. Die wahre Wahrscheinlichkeit kann aber auch ein wenig darüber oder ein wenig darunter liegen. Welche Wahrscheinlichkeit jetzt wie plausibel ist hängt ein wenig von Deinen Vorabannahmen ab, aber sagen wir ganz grob, die Wahrscheinlichkeitsverteilung von
entspricht einer Beta-Verteilung mit den Lageparametern 200 und 400. Blöderweise kann man hier im Forum keine Grafiken hochladen. Ich empfehle Dir, Dir das Programm R von
http://www.r-project.org herunterzuladen und zu installieren. Die Wahrscheinlichkeitsdichte von
kannst Du Dir dort zeichnen lassen, indem Du folgendes Kommando in R kopierst:
- Code: Alles auswählen
curve(dbeta(x, 200, 400), xlab = expression(p[1]), ylab = "Wahrscheinlichkeitsdichte")
Das 5. und das 95. Perzentil dieser Verteilung:
- Code: Alles auswählen
> qbeta(c(.05, .95), 200, 400)
[1] 0.3020199 0.3652790
Man kann sagen, dass
zu 90% zwischen 30.2% und 38,5% liegt. Jetzt ziehen wir uns aus der Wahrscheinlichkeitsverteilung zehntausend plausible Werte
und simulieren damit zehntausend mal, wieviele von 2400 in die Medikamentenstudie einbezogen worden wären, wenn Fortuna frei spielt:
- Code: Alles auswählen
# zehntausend Werte p1
p1 <- rbeta(10000, 200, 400)
plot(density(p1))
# zehntausend mal wird jetzt 2400mal gewürfelt und
# gezählt, wie oft "Einschluss" fällt:
inc <- sapply(p1,
function(p) sum(sample(c(1,0), 2400, TRUE, prob = c(p, 1-p))))
hist(inc)
# jetzt suchen wir wieder das 5. und das 95. Quantil dieser Würfelwerte
quantile(inc, c(.05, .95))
Auch hier gilt: Wenn Du das in R kopierst werden verschiedene Grafiken erstellt und es gibt eine Ausgabe in der Art wie
- Code: Alles auswählen
> quantile(inc, c(.05, .95))
5% 95%
716 886
Also erwarten wir zu 90%, dass von den 2400 zwischen 716 und 886 in die Medikamentenstudie eingeschlossen werden können (ok, das ging zu schnell. Eigentlich solltest Du die Zahl zehntausend etwas erhöhen und das mehrmals laufen lassen um ein Gefühl dafür zu bekommen, wie reproduzierbar diese Simulationsrechnung ist bzw. ob die Zahl der Wiederholungen für Deine Zwecke ausreicht).
Im nächsten Schritt müsste man jetzt mit den zehntausend (oder mehr) Eingeschlossenenzahlen und den möglichen Wahrscheinlichkeiten von der Therapie zu profitieren weiter simulieren. Dafür will ich aber erstmal hören, ob das für Dich so nachvollziehbar ist, ob R als Beschreibungssprache infrage kommt, kurz, ob es Sinn hat, so weiter zu machen.
Im wirklichen Leben werden die Unsicherheiten immer noch größer sein, weil man es nicht schafft, die 2400 Teilnehmer aus de identischen Grundgesamtheit wie die 600 zu rekrutieren. Irgendwas ist bei denen immer anders und daher reicht es vielleicht auch zu sagen: Wir rechnen mit den 716 Einschlüssen weiter, die wir auch im ungünstigen Fall aus den 2400 noch erwarten dürfen.
LG,
Bernhard