Hallo Markus,
ich bin kein Geisteswissenschaftler und kann nicht sagen, was in solchen Fällen etabliert und üblich ist. Das solltest Du herausfinden. Leider kommt Literaturanalyse hier im Forum nur selten vor, deshalb erwarte ich so gesehen nicht so viel von hier. Bestimmt kann man sowas noch woanders fragen.
Was ich mir schwierig vorstelle: Es wird ja unterschiedlich lange Definition mit unterschiedlich vielen Substantiven geben. Wäre die Verteilung der Substantive völlig zufällig, und das gemeinsame Vorkommen zweier Substantive reiner Zufall, dann wäre halt die Wahrscheinlichkeit gemeinsamen Aufkommens in längeren Definitionen (mehr Substantive) wahrscheinlicher und in kürzeren unwahrscheinlicher. Man kann wahrscheinlich nicht sagen: Anteil Wort A an Definitionen mal Anteil Wort B bei Definitionen gleich Anteil Kombination A und B im Falle der Unabhängigkeit.
Mein Gedanke wäre daher eine Simulationsrechnung: Du notierst für jede Definition, wieviele Substantive sie hat und wie häufig die zwei zu untersuchenden Substantive darin sind. Jetzt verteilst Du die Substantive zufällig auf die Definitionen und zählst, wie oft sie gemeinsam vorkommen. Das wiederholst Du zehntausend Mal. Für jedes dieser zehntausend Male zählst Du aus, wie häufig sie bei zufälliger Verteilung gemeinsam vorkommen. Das vergleichst Du dann damit, wie häufig sie tätsächlich gemeinsam vorkommen und folgerst daraus, ob sie überzufällig häufig gemeinsam vorkommen.
Das wird man nicht als vorgefertigten Menüpunkt in irgendeiner Software finden, aber es sollte sich in R mit überschaubarem Programmieraufwand umsetzen lassen. Die Rechenzeit könnte natürlich schon ausufern, wenn es sehr viele Begriffspaare sind, die so untersucht werden sollen. Für einige handverlesene Schlüsselwörter sicher kein Problem, für die paarweise Kombination aller in diesem Post verwendeten Wörter -- oh je. Konkret: Wenn Du 20 Schlüsselwörter hast lassen sich daraus 190 Wortpaare bilden. 190 Mal zehntausend Versuche, das lässt sich wahrscheinlich für einmal Kaffeekochen und auf Klo gehen rechnen.
https://www.wortschatz-blog.de/wie-viel ... uchen-wir/ schreibt:
Mit 1.000 bis 2.000 Wörtern lässt sich bereits beträchtlicher Teil des Alltags bestreiten, hat der neuseeländische Linguist Paul Nation durch Textanalysen errechnet – vorausgesetzt natürlich, es handelt sich um die gängigsten Alltagsbegriffe. Höher setzt mit 3.000 Wörtern das Projekt Oxford 3000 an:
Also bei 1000 Wörtern wären das bereits eine halbe Million möglicher Wortpaare. Da müsste man sich dann nochmal neu Gedanken machen, z. B. die herausscreenen, die ohnehin in Deinen Definitionen nicht vorkommen.
Kannst Du dahingehend Deine Anforderungen konkretisieren?
LG,
Bernhard