hallo,
Wuerde einen Rat benoetigen ob ich am richtigen Weg bin.
Ich habe folgendes Problem: Fuenf Fotoexperten begutachten Aufnahmen und bewerten sie
auf einer vierstufigen Skalar von "unbedenklich" bis "jugendgefaehrdend". Da es eine ungerade Anzahl an
Experten ist, kann ich durch die Anwendung von einer Mehrheitswahl einen Konsens erstellen.
Um ihre Uebereinstimmung mit dem Konsens festzustellen kann ich Cohen's Kappa berechnen.
Der Grund warum ich das wissen will ist, da ich ein Computerprogramm entwickeln moechte welches diese Aufgabe
uebernehmen soll. Es ist robuster da es jedesmal
wenn es ein und das selbe Foto sieht zum gleichen Ergebnis kommt. Meine Frage ist daher wie ich berechnen kann
wie viele Bilder/Samples ich brauche, um statistisch besser zu sein als die Gruppe der Experten. Besser heisst in diesem
Fall eine hoehere Uebereinstimmung mit dem Konsens der auch im Fall des Computers von einer Gruppe von Experten erstellt wurde.
Ist dafuer Cohen's Kappa geeignet? Welchen Test sollte ich anwenden?
input:
5 Beobachter
deren kappa: 0.4
konfidenzintervall: 0.2
keine messwiederholung
das war das Ergebnis der ersten Testung.
die zweite soll der PC durchführen, dh wie viele Personen muss ich befragen?
Output: Personenanzahl?
2.testung soll höheren kappa als Konsens haben.
(das ist die Annahme, 0.5 konfidenzintervall und 0.8 Power)
Besten Dank fuer jeden Hinweis!
Lg,
Manuela