Hallo,
Ich bin sehr unerfahren was statistische Verfahren angeht. Deshalb bräuchte ich von euch grundlegende Hilfe bei folgender Problemstellung:
ich habe eine Untersuchung durchgeführt, in der 6 Gruppen (Gruppe A, B...F) eine Gewichtung (Zahlenwert) für 11 Kriterien abgeben konnten (wie wichtig ist mir Kriterium 1,2...11?). Die Gewichte haben nur die Bedingung, dass sie zusammen 100 ergeben müssen.
Die Tabelle sieht dann also ungefähr so aus (nur zur Veranschaulichung; nicht das reale Bsp.):
Gruppe Kriterium 1 Kriterium 2 ... Kriterium 11
A 27 10 5
B 20 6 30
.
F 4 10 29
Ich möchte nun Zusammenhänge finden zwischen den Gewichtungen der Gruppen, da ein Diagramm mit allen Gruppen und deren Gewichtungen relativ unübersichtlich ist und ich dort auch "auf einen Blick" keine Zusammenhänge erkennen konnte.
Dazu würde ich gerne von euch wissen, ob die Methoden, die ich angewendet habe überhaupt Sinn bei diesem Bsp. machen.
1.)
Ich habe den Korrelationskoeffizienten nach Pearson für alle Gruppen über alle Kriterien errechnet und in einer Korrelationsmatrix dargestellt.
a) Denkt ihr, dass die Anwendung einer Korrelationsanalyse für meine Problemstellung grundsätzlich Sinn macht? (für mich überraschenderweise wurde sie bei ähnlichen Problemstellungen nicht in wiss. Papern angewendet; könnte aber auch sein, dass ich nur keine Paper dazu gefunden habe...)
b) Es finden sich 3 Korrelationen zw. den Gruppen die höher als +0,6 sind. Laut Literatur kann man hier von einer starken Korrelation sprechen.
Ist deshalb die Aussage gerechtfertigt, dass diese Gruppen recht ähnliche Gewichtungen abgegeben haben oder wäre das ein Trugschluss?
c) Außerdem habe ich "Subgruppen" von Kriterien gebildet. Z.B. habe ich eine Gruppe gebildet, die alle Kriterien beinhaltet, die eine höhere Standardabweichung als die durchschnittliche Standardabweichung haben (und eine mit allen Kriterien mit einer niedrigeren Standardabweihung als die durchschnittliche Standardabweichung; d.h. ich habe einfach die Standardabweichung für alle Kriterien berechnet und dann einen Durchschnittswert gebildet). Mein Gedanke war, dass Kriterien mit einer höheren Standardabweichung Kriterien sind, die recht unterschiedlich von den Gruppen bewertet wurden.
In diesen Gruppen befindet sich nun sehr starke positive (r=0,946) und starke negative (r=-0,846) Korrelationen.
Ist es zulässig zu sagen, dass die Gruppenpaare, die starke negative Korrelationen haben, relativ gegensätzliche Gewichte verteilt haben (und damit relativ gegensätzliche 'Ansichten' für die Kriterien vertreten)?
2.)
Außerdem habe ich die Methode der hierarchischen Clusteranalyse angewendet.
Hier habe ich den (Quadratischer) Euklidischer Abstand benutzt und verschiedene Agglomerationsmethoden (complete linkage, Ward...).
a) Denkt ihr, dass die Anwendung dieser Methode für meine Problemstellung grundsätzlich Sinn macht? (sie wurde bei ähnlichen Problemstellungen in verschiedenen wiss. Papern angewendet)
b) Es werden mir meistens die gleichen 3 Cluster, die relativ 'früh' entstehen, als Ergebnis ausgegeben (Gruppe A + F, Gruppe B+ C, Gruppe E + F). Nur bei "single linkage" ergeben sich etwas andere Cluster.
Inhaltlich würde ich sagen, dass diese 3 Cluster auch durchaus Sinn machen (es bilden sich die Cluster, die ich auch - ohne irgendwelche Ergebnisse zu kennen - vermutet hätte; ich weiß, das heißt noch nicht viel...).
Jedoch: Wenn ich die Ergebnisse der Clusteranalyse mit denen der Korrelationsanalyse vergleiche, ergeben sich keine Übereinstimmungen (ich sehe kaum hohe Korrelationen zw. den Paaren der Clusteranalyse). Z.B. zw. Gruppe A + F (1. Cluster, der sich ergibt) sehe ich keine hohen Korrelationen. Das hätte ich jedoch vermutet. Kann mir jmd. erklären, warum das nicht so ist?
Für jegliche sachdienlichen Hinweise wäre ich sehr verbunden