Schlüsselwörter von Definitionen analysieren

Fragen, die sich auf kein spezielles Verfahren beziehen.

Schlüsselwörter von Definitionen analysieren

Beitragvon MarkusG99 » So 15. Aug 2021, 19:43

Hallo,

ich (nicht-Statistiker) würde gerne im Rahmen einer Literaturanalyse mehrere Definitionen eines Begriffs analysieren und sowohl die absolute Häufigkeit der damit assoziierten Schlüsselwörter erfassen, als auch Muster finden welche Schlüsselwörter häufig oder nicht häufig zusammen anzutreffen sind. Ich will die quantitative Auswertung in R vornehmen.

Beispiel:
Begriff "Führungsqualität"; damit assoziierte Schlüsselwörter (kommen in Definitionen vor) sind z.B. Kommunikation, Motivation, Fehlertoleranz, Entscheidungsfreude, etc.
Ergebnis nach Analyse mehrerer Definitionen wäre z.B. häufigstes Schlüsselwort ist "Kommunikation" mit X Nennungen usw.; die Schlüsselwörter "Kommunikation" und "Fehlertoleranz" treten signifikant häufig zusammen auf, die Schlüsselwörter X und Y treten selten/nie zusammen auf.

Welches statistische Verfahren eignet sich dafür?
Wie kann ich die Signifikanz bestimmen, welche ausdrücken soll welche Schlüsselwörter signifikant häufig zusammen auftreten?

Bitte um eure Unterstützung und danke euch im Voraus!!!

Liebe Grüße,
Markus
MarkusG99
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: So 15. Aug 2021, 18:56
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Schlüsselwörter von Definitionen analysieren

Beitragvon bele » So 15. Aug 2021, 20:53

Hallo Markus,

ich bin kein Geisteswissenschaftler und kann nicht sagen, was in solchen Fällen etabliert und üblich ist. Das solltest Du herausfinden. Leider kommt Literaturanalyse hier im Forum nur selten vor, deshalb erwarte ich so gesehen nicht so viel von hier. Bestimmt kann man sowas noch woanders fragen.

Was ich mir schwierig vorstelle: Es wird ja unterschiedlich lange Definition mit unterschiedlich vielen Substantiven geben. Wäre die Verteilung der Substantive völlig zufällig, und das gemeinsame Vorkommen zweier Substantive reiner Zufall, dann wäre halt die Wahrscheinlichkeit gemeinsamen Aufkommens in längeren Definitionen (mehr Substantive) wahrscheinlicher und in kürzeren unwahrscheinlicher. Man kann wahrscheinlich nicht sagen: Anteil Wort A an Definitionen mal Anteil Wort B bei Definitionen gleich Anteil Kombination A und B im Falle der Unabhängigkeit.

Mein Gedanke wäre daher eine Simulationsrechnung: Du notierst für jede Definition, wieviele Substantive sie hat und wie häufig die zwei zu untersuchenden Substantive darin sind. Jetzt verteilst Du die Substantive zufällig auf die Definitionen und zählst, wie oft sie gemeinsam vorkommen. Das wiederholst Du zehntausend Mal. Für jedes dieser zehntausend Male zählst Du aus, wie häufig sie bei zufälliger Verteilung gemeinsam vorkommen. Das vergleichst Du dann damit, wie häufig sie tätsächlich gemeinsam vorkommen und folgerst daraus, ob sie überzufällig häufig gemeinsam vorkommen.

Das wird man nicht als vorgefertigten Menüpunkt in irgendeiner Software finden, aber es sollte sich in R mit überschaubarem Programmieraufwand umsetzen lassen. Die Rechenzeit könnte natürlich schon ausufern, wenn es sehr viele Begriffspaare sind, die so untersucht werden sollen. Für einige handverlesene Schlüsselwörter sicher kein Problem, für die paarweise Kombination aller in diesem Post verwendeten Wörter -- oh je. Konkret: Wenn Du 20 Schlüsselwörter hast lassen sich daraus 190 Wortpaare bilden. 190 Mal zehntausend Versuche, das lässt sich wahrscheinlich für einmal Kaffeekochen und auf Klo gehen rechnen.

https://www.wortschatz-blog.de/wie-viel ... uchen-wir/ schreibt:
Mit 1.000 bis 2.000 Wörtern lässt sich bereits beträchtlicher Teil des Alltags bestreiten, hat der neuseeländische Linguist Paul Nation durch Textanalysen errechnet – vorausgesetzt natürlich, es handelt sich um die gängigsten Alltagsbegriffe. Höher setzt mit 3.000 Wörtern das Projekt Oxford 3000 an:


Also bei 1000 Wörtern wären das bereits eine halbe Million möglicher Wortpaare. Da müsste man sich dann nochmal neu Gedanken machen, z. B. die herausscreenen, die ohnehin in Deinen Definitionen nicht vorkommen.

Kannst Du dahingehend Deine Anforderungen konkretisieren?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5917
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts

folgende User möchten sich bei bele bedanken:
MarkusG99

Re: Schlüsselwörter von Definitionen analysieren

Beitragvon MarkusG99 » Mo 16. Aug 2021, 08:52

Hallo Bernhard,

vielen Dank für deine prompte und sehr ausführliche Antwort!

Ich verstehe deine Antwort, aber sie geht möglicherweise etwas am Ziel vorbei. Die Absicht ist ja, Definitionen eines Begriffs (der leider noch nicht feststeht, wird einer aus Führung/Management sein; ist ja eigentlich egal) gegenüberzustellen und Gemeinsamkeiten sowie Unterschiede anhand einer quantitativen Methode darzustellen (nicht "händisch" abzählen). Eine Definition eines Fachbegriffes umfasst rund 1-3 Sätze. In Summe erwarten wir, etwa 20-50 Definitionen (mehrere Sprachen, aber das ist für die Auswertung egal; in der Literatur gibt es z.B. über 160 verschiedene Definitionen von "Kultur") in der Literatur zu finden.

Dann würden wir z.B. maximal 10 Schlüsselwörter festlegen und tabellarisch darstellen, z.B.:
Quelle 1: Motivation|Intelligenz|Entscheidungsfreude|Sozialkompetenz|...
Quelle 2: Kulturelle Intelligenz|Durchsetzungskraft|Ausbildung|Motivation|...

Und dann halt feststellen, aha, Intelligenz, Motivation, und Ausbildung treten signifikant oft zusammen auf, sind also für die Erklärung des Begriffs besonders relevant. Schlüsselwörter wie z.B. Sozialkompetenz sind (absolut) nur selten zu finden, tragen also wenig zur Erklärung bei.

Von der Idee her wohl wie eine Clusteranalyse?

Ich entschuldige mich, dass meine Frage etwas unklar war. V.a. dass es nicht ausschließlich um Wortpaare geht sondern um 2 oder mehrere Worte die signifikant oft zusammen auftreten.

Vielen Dank & Liebe Grüße,
Markus
MarkusG99
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: So 15. Aug 2021, 18:56
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Schlüsselwörter von Definitionen analysieren

Beitragvon bele » Mo 16. Aug 2021, 13:32

Hallo Markus,

das ist schon wesentlich konkreter, aber ob das für eine Methodenempfehlung reicht, habe ich noch meine Zweifel.

Und dann halt feststellen, aha, Intelligenz, Motivation, und Ausbildung treten signifikant oft zusammen auf, sind also für die Erklärung des Begriffs besonders relevant. Schlüsselwörter wie z.B. Sozialkompetenz sind (absolut) nur selten zu finden, tragen also wenig zur Erklärung bei.


Das sind zwei ganz verschiedene Fragestellungen, die man gedanklich auch trennen sollte. Die eine beschreibt das gemeinsame Auftreten von Wortgruppen, die andere die absolute Häufigkeit von Wörtern. Das wird man mit verschiedenen Funktionen untersuchen und in verschiedenen Unterkapiteln des großen Kapitels Ergebnisse berichten.

Die Idee mit der Clusteranalyse ist nachvollziehbar. Man müsste eine angemessene Distanzfunktion für die Distanz zwischen je zwei Wörter definieren und könnte dann mit der Distanzmatrix Gruppen einander ähnlicher Wörter suchen. Schwierig bleibt, dass Du die ganze Zeit von Signifikanz schreibst ohne das wirklich klar wird, welche Hypothesen/Nullhypothesen Du da untersuchen möchtest, was also "signifikant oft" eigentlich heißt.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5917
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 21 Gäste

cron