Guten Tag,
ich habe eine vermutlich recht einfache Frage, bin mir aber nicht ganz sicher nach welchen Stichpunkten ich suchen muss.
Ich habe von fünf unterschiedlichen Textarten (A, B, C, D, E) die Mittelwerte und Standardabweichungen in Bezug auf ca 70 Variablen (in Prozent, bspw ein durchschnittlicher Text dieser Art enthält x Prozent positive Wörter). Nun habe ich mittels Textanalyse eine neue Textart (F) hinsichtlich dieser Variablen analysiert und möchte herausfinden, welcher der ursprünglichen fünf Textarten die neue Art über alle Variablen hinweg am ähnlichsten ist. Kann ich Variablen einfach z-transformieren und jeweils Pearson r für die neue Textart F mit den jeweiligen anderen berechnen und schauen welche am höchsten ist?
Wenn ich dies tue, ist die Korrelation leider nicht signifikant, kann dies mit der zu geringen Größe der neuen Stichprobe zusammenhängen?
Vielen Dank schon einmal im Voraus für jegliche Hilfe.
Mit besten Grüßen,
Julia