Hallo allerseits,
habe eine Frage bezüglich eines korpuslinguistischen Themas, ich hoffe irgendjemand kann mir weiterhelfen oder hat zumindest eine Idee, in welche Richtung ich hier gehen könnte.
Für meine Masterarbeit analysiere ich politische Metaphern im Brexit-Diskurs und habe dazu ein binationales Zeitungskorpus mit ca. 1 Mio. Wortformen (Deutschland) sowie 4 Mio. Wortformen (Großbritannien) zusammengestellt, insgesamt also 5 Mio. Wörter. Zusätzlich unterscheide ich zwischen Qualitäts- und Boulevardmedien. Eine meiner Hypothesen ist, dass Boulevardmedien kreativere Metaphern (Kreativität gemessen durch einen Score mit Werten 1 (sehr konventionell) -7 (sehr kreativ)) als Qualitätsmedien gebrauchen, da sie meistens sensationalistischer in ihrer Berichterstattung sind.
Gesetzt den Fall ich möchte jetzt meine Hypothese überprüfen und ich teile die Metaphern hierzu abermals in zwei Gruppen (Konventionell = Score kleiner als 4, kreativ Score größer gleich 5) ein, wie kann ich hier vorgehen? Eine Vierfeldmatrix zur Durchführung eines Chi²-Test ist hier nicht möglich, da der Test nur mit absoluten Häufigkeiten funktioniert, die Werte aber zusätzlich an den jeweiligen Korpusgrößen (deutsch- und englischsprachiges Korpus stehen in einem Verhältnis von 1:4 bez. Wortumfang) normalisiert werden müssten. Zusätzlich hierzu müsste auch irgendwie die Dysbalance zwischen Qualitäts- und Boulevardmedien berücksichtigt werden (die Datenbasis ist auch hier nicht ausgewogen), oder?
Kann mir hier jemand weiterhelfen? Wäre supi
Danke und viele Grüße