vor kurzem habe ich in einen studentischen Forschungsprojekt zusammen mit einer größeren Gruppe 1600 Nachrichten codiert
und wir hatten zwei Pretests durchgeführt. Jedoch glaube ich, dass unsere Reliabilität ziemlich schlecht ist und
ich muss jetzt mit diesen Daten für meinen Abschlussbericht arbeiten.
Zunächst bin ich mir nicht sicher, ob ich meine Werte richtig bewerte:
1. Wenn mein Holsti_Index ganz okay ist, da dieser zwischen 75 und 80 Prozent liegt, aber Krippendorff's Alpha zu nierdig (0.25Prozent) ist,
sind meine Daten trotzdem schlecht oder? 2. Gibt es eine Möglichkeit unseren Datensatz nicht zu schlecht darstellen zu müssen ?
Das habe ich hierzu geschrieben, aber ich weiß selbst nicht, ob ich das richtig bewerte:
Um die Übereinstimmung mehrer Codierer und verschiedener Skalenniveaus zu berechnen, wurde sich bei dem Pretest für das statistische Maß Krippendorffs Alpha
und den Holsti-Index entschieden. Dabei wurden insgesamt 30 Codierungen pro Kategorie vorgenommen. Die Reliabilität der Daten wurde zu genau zwei Zeitpunkten
gemessen...Das Ergebnis war hierbei eine Übereinstimmung der Codierer nach Holsti von 70,24 Prozent. Krippendorff's Alpha erreichte hingegen einen Durchschnittswert von 0,29 Prozent. ... Nachdem die die zweite Hälfte des Datensatzes codiert war, wurde ein weiterer Pretest durchgeführt. Es zeigte sich eine Verbesserung hinsichtlich der durchschnittlichen Übereinstimmung der Codierer nach dem Holsti-Index. So konnte der Holsti-Wert von 70,24 Prozent auf 79,42 Prozent verbessert werden. Unter Berücksichtigung des Schwierigkeitsgrads einzelner Kategorien, welche sich eher mühsam von anderen abgrenzen lassen, wird ein Koeffizienten von .75 bereits als ein Erfolg gewertet. Als eine hinreichende Qualität werden hingegen Werte von .80 und höher bewertet (vgl. Rössler, 2005, S.192).
Dementsprechend sind die Daten gut?
Problematische Kategorien/Variablen?, wie Übertreibung (V22a: 72,89% zu 91,59%), Zielgruppe der Übertreibung (V22b: 77,55% zu 91,59%), Art der Wertung (V17b: 49,75% zu 76,02%) und Klarstellung (V31: 53,83% zu 87,25%) konnten deutlich verbessert werden. Kategorien/Variablen?, wie Beleidigung (V28:39,9%) und Bitte (V29:57,14%), welche sprunghaft die 100 Prozent erreichten, zeigen eine vollständige Übereinstimmung auf. Dies liegt eher darin begründet, dass in der Testcodierung diese Merkmale nicht vorgekommen sind. Krippendorff's Alpha verschlechterte sich zweiten Durchlauf im Durchschnitt von 0,29 Prozent zu 0,25 Prozent.
Dies bedeutet, dass die Werte schlecht sind? Und jetzt?

Ich wäre echt froh Feedback zu erhalten, ob ich das alles richtig bewerte oder nicht

LIebe Grüße Anni