Es geht um eine sprachwissenschaftliche Korpusanalyse. Ein bestimmtes Wort wird hinsichtlich bestimmter Satzmuster genauer untersucht.
Das Wort tritt insgesamt 4000x im Korpus auf, und es wird eine zufällige Stichprobe von 150x herausgewählt. Das Wort wird im Hinblick auf fünf Muster (Merkmalsausprägungen) untersucht. Bei einer völlig zufälligen Verteilung wäre ja zu erwarten, dass diese jeweils mit 20% auftreten, oder? Welchen Test muss ich nun verwenden, um die tatsächlichen Wahrscheinlichkeiten daraufhin zu überprüfen, ob sie statistische signifikant sind? Inwiefern spielt hier auch die 4000 eine Rolle?