Liebe Profis,
auch ich komme nach stundenlangem Lesen und Überlegen einfach nicht mehr weiter – der Kopf raucht und ich sehe vor lauter Bäumen den Wald nicht mehr…. Daher die Beschreibung meines Problems:
Ich habe ein Programm geschrieben, dass die Richtigkeit der Auswahl einer Antibiose bei Lungenentzündungen gemäß der Leitlinien überprüft. Hierzu muss man wissen, das bei Lungenentzündungen nicht immer das gleiche Antibiotikum verschrieben wird, sondern dies von verschiedenen Faktoren abhängig ist (z.B. Lungenvorerkankungen eines Patienten). Nun möchte ich testen, ob das Programm tatsächlich häufiger das richtige Präparat auswählt als der Arzt. Ich habe einen Datensatz von 100 Patienten mit nachgewiesenen Lungenentzündungen und weiß, welches antibiotische Präparat der Arzt für den jeweiligen angesetzt hat. Mein Programm macht nun für jeden Patienten ebenfalls einen Präparatvorschlag. Für jeden Patienten liegen also zwei Therapievorschläge vor: die vom Arzt und die von meinem Programm (diese können entsprechend gleich lauten oder unterschiedlich sein). Beide Therapievorschläge pro Patient werden dann von einem Infektionlogen als Golfstandard auf ihre Richtigkeit überprüft (Ergebnis also pro Vorschlag und Patient kategoriell: Präparatvorschlag durch den Arzt stimmt oder stimmt nicht und Präparatvorschlag durch das Programm stimmt oder stimmt nicht).
Kann ich in dem aufgezeigten Setting eine signifikante Überlegenheit meines Programms nachweisen oder bleibt das Ergebnis am Ende nur eine deskriptive Gegenüebrstellung z.B. richtige Entscheidungen durch den Arzt = 75% - gegenüber richtige Entscheidung Programm = 95%? Oder kann ich eine Überlegenheitsstudie mit richtiger Fallzahlberechnung, Signifikanz und Power durchführen? Literaturangaben oder Pilotstudien wie oft Ärzte bei Lungenentzündungen ein falsches Präparat anordnen gibt es nicht. Eine Effektstärke, also z.B. das das Programm 20% besser ist, könnte man vielleicht schätzen oder festlegen...
Ich danke Euch so sehr im Voraus,
liebe Grüße
Katrin