Liebes Forum,
ich möchte die Produktion von Nebensätzen im Zweitspracherwerb analysieren. Dazu habe ich insgesamt 853 Nebensätze aus 15 Texten von Lernenden auf B2-Niveau + 15 Texten von Lernenden auf C1-Niveau untersucht und nach verschiedenen nominal skalierten Kriterien (z.B. Verbstellung, syntaktische Funktion usw.) klassifiziert. Jetzt würde ich mir gerne ansehen, ob es Unterschiede zwischen den B2- und C1-Texten gibt (z.B. ob in den C1-Texten die Verbstellung korrekter ist als in den B2-Texten).
Ich habe schon ein paar nette Kreuztabellen erstellt, verzweifle aber momentan an der Interpretation - konkret weiß ich nicht, wie ich einschätzen kann, ob meine Ergebnisse statistisch signifikant sind. Wenn ich es richtig verstehe, benutzt man dazu normalerweise Chi-Quadrat-Tests. Da gibt es bei mir aber 2 Probleme: Erstens sind die zu erwartenden Häufigkeiten teilweise kleiner als 5 (habe im Internet gelesen, dass das ungünstig sei), und zweitens weichen innerhalb derselben Kreuztabelle manche Werte stark vom erwarteten Wert ab, manche dafür gar nicht - hier wäre es doch sinnvoll, wenn ich nicht die ganze Kreuztabelle teste, sondern nur einzelne Felder, oder? Geht das überhaupt?
Ein Beispiel: Bei der Variable "Funktion" gibt es die Ausprägungen "Komplementsatz", "Adverbialsatz", "Attributsatz" und "weiterführender Nebensatz". Die B2- und C1-Texte haben einen annähernd gleich großen Anteil an Komplementsätzen (38,60% vs. 38,88%), dafür unterscheiden sie sich aber (meines Erachtens) bei den Adverbial- und Attributsätzen (30,83% vs. 35,06% / 30,57% vs. 25,84%). Ein weiterführender Nebensatz wurde überhaupt nur ein einziges Mal produziert.
Wie kann ich an diese Daten nun herangehen? Welche(r) Test(s) wären empfehlenswert?
Vielen Dank im Voraus!