Auswertung von Gewichtungen (Korrelation + Clusteranalyse)

Fragen, die sich auf kein spezielles Verfahren beziehen.

Auswertung von Gewichtungen (Korrelation + Clusteranalyse)

Beitragvon Koller » Mi 20. Jul 2016, 13:37

Hallo,

Ich bin sehr unerfahren was statistische Verfahren angeht. Deshalb bräuchte ich von euch grundlegende Hilfe bei folgender Problemstellung:
ich habe eine Untersuchung durchgeführt, in der 6 Gruppen (Gruppe A, B...F) eine Gewichtung (Zahlenwert) für 11 Kriterien abgeben konnten (wie wichtig ist mir Kriterium 1,2...11?). Die Gewichte haben nur die Bedingung, dass sie zusammen 100 ergeben müssen.

Die Tabelle sieht dann also ungefähr so aus (nur zur Veranschaulichung; nicht das reale Bsp.):

Gruppe Kriterium 1 Kriterium 2 ... Kriterium 11
A 27 10 5
B 20 6 30
.
F 4 10 29

Ich möchte nun Zusammenhänge finden zwischen den Gewichtungen der Gruppen, da ein Diagramm mit allen Gruppen und deren Gewichtungen relativ unübersichtlich ist und ich dort auch "auf einen Blick" keine Zusammenhänge erkennen konnte.
Dazu würde ich gerne von euch wissen, ob die Methoden, die ich angewendet habe überhaupt Sinn bei diesem Bsp. machen.

1.)
Ich habe den Korrelationskoeffizienten nach Pearson für alle Gruppen über alle Kriterien errechnet und in einer Korrelationsmatrix dargestellt.
a) Denkt ihr, dass die Anwendung einer Korrelationsanalyse für meine Problemstellung grundsätzlich Sinn macht? (für mich überraschenderweise wurde sie bei ähnlichen Problemstellungen nicht in wiss. Papern angewendet; könnte aber auch sein, dass ich nur keine Paper dazu gefunden habe...)
b) Es finden sich 3 Korrelationen zw. den Gruppen die höher als +0,6 sind. Laut Literatur kann man hier von einer starken Korrelation sprechen.
Ist deshalb die Aussage gerechtfertigt, dass diese Gruppen recht ähnliche Gewichtungen abgegeben haben oder wäre das ein Trugschluss?
c) Außerdem habe ich "Subgruppen" von Kriterien gebildet. Z.B. habe ich eine Gruppe gebildet, die alle Kriterien beinhaltet, die eine höhere Standardabweichung als die durchschnittliche Standardabweichung haben (und eine mit allen Kriterien mit einer niedrigeren Standardabweihung als die durchschnittliche Standardabweichung; d.h. ich habe einfach die Standardabweichung für alle Kriterien berechnet und dann einen Durchschnittswert gebildet). Mein Gedanke war, dass Kriterien mit einer höheren Standardabweichung Kriterien sind, die recht unterschiedlich von den Gruppen bewertet wurden.
In diesen Gruppen befindet sich nun sehr starke positive (r=0,946) und starke negative (r=-0,846) Korrelationen.
Ist es zulässig zu sagen, dass die Gruppenpaare, die starke negative Korrelationen haben, relativ gegensätzliche Gewichte verteilt haben (und damit relativ gegensätzliche 'Ansichten' für die Kriterien vertreten)?

2.)
Außerdem habe ich die Methode der hierarchischen Clusteranalyse angewendet.
Hier habe ich den (Quadratischer) Euklidischer Abstand benutzt und verschiedene Agglomerationsmethoden (complete linkage, Ward...).
a) Denkt ihr, dass die Anwendung dieser Methode für meine Problemstellung grundsätzlich Sinn macht? (sie wurde bei ähnlichen Problemstellungen in verschiedenen wiss. Papern angewendet)
b) Es werden mir meistens die gleichen 3 Cluster, die relativ 'früh' entstehen, als Ergebnis ausgegeben (Gruppe A + F, Gruppe B+ C, Gruppe E + F). Nur bei "single linkage" ergeben sich etwas andere Cluster.
Inhaltlich würde ich sagen, dass diese 3 Cluster auch durchaus Sinn machen (es bilden sich die Cluster, die ich auch - ohne irgendwelche Ergebnisse zu kennen - vermutet hätte; ich weiß, das heißt noch nicht viel...).
Jedoch: Wenn ich die Ergebnisse der Clusteranalyse mit denen der Korrelationsanalyse vergleiche, ergeben sich keine Übereinstimmungen (ich sehe kaum hohe Korrelationen zw. den Paaren der Clusteranalyse). Z.B. zw. Gruppe A + F (1. Cluster, der sich ergibt) sehe ich keine hohen Korrelationen. Das hätte ich jedoch vermutet. Kann mir jmd. erklären, warum das nicht so ist?

Für jegliche sachdienlichen Hinweise wäre ich sehr verbunden ;)
Koller
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 20. Jul 2016, 13:06
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Auswertung von Gewichtungen (Korrelation + Clusteranalys

Beitragvon Miiira » Mi 20. Jul 2016, 14:46

Hello,
zu Aussagen wie in 1.) b) rate ich dir, die Bedeutung der Korrelation nochmal genauer anzusehen.
Bewertet Gruppe A nämlich beispielsweise so:
A: 1 1 1 1 1 1 1 1 1 1 90
und Gruppe F so:
F: 5 5 5 5 5 5 5 5 5 5 50
so liegt der Korrelationskoeffizient der beiden bei 1, obwohl Gruppe F die Kriterien eins bis zehn fünfmal so hoch bewertet hat wie Gruppe A, Kriterium 11 jedoch ist für Gruppe A fast doppelt so wichtig eingestuft worden wie es von Gruppe F eingestuft wurde.
Zuletzt geändert von Miiira am Mi 20. Jul 2016, 14:50, insgesamt 2-mal geändert.
Miiira
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mi 20. Jul 2016, 12:10
Danke gegeben: 3
Danke bekommen: 1 mal in 1 Post

Re: Auswertung von Gewichtungen (Korrelation + Clusteranalys

Beitragvon Koller » Mi 20. Jul 2016, 14:48

Miiira hat geschrieben:Hello,
zu Aussagen wie in 1.) b) rate ich dir, die Bedeutung der Korrelation nochmal genauer anzusehen.
Bewertet Gruppe A nämlich beispielsweise so:
A: 1 1 1 1 1 1 1 1 1 1 90
und Gruppe F so:
F: 5 5 5 5 5 5 5 5 5 5 50
so liegt der Korrelationskoeffizient der beiden bei 1, obwohl Gruppe F die Kriterien eins bis zehn fünfmal so hoch bewertet hat wie Gruppe A, Kriterium 11 jedoch ist für Gruppe A fast doppelt so wichtig eingestuft worden wie es von Gruppe F eingestuft wurde.


Ja, danke für den Hinweis. Ein anderes Problem bei Pearson ist, dass Outliers das Ergebnis stark beeinflussen. Hättest du vielleicht einen Vorschlag für eine bessere Methode um Zusämmenhänge / Unterschiede herauszufinden??
Koller
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 20. Jul 2016, 13:06
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Auswertung von Gewichtungen (Korrelation + Clusteranalys

Beitragvon Miiira » Mi 20. Jul 2016, 15:06

Über den Zusammenhang zweier Gruppen können mittels Korrelation schon gute Aussagen getroffen werden, aber wenn es ein stark positiver Zusammenhang ist, sagt das nur aus, dass die Tendez besteht, dass wenn die eine Gruppe hoch bewertet, dann auch die andere Gruppe eher höher bewertet. Es heißt aber nicht zwigend, dass beide Gruppen recht ähnlich bewerten.
Würdest du beispielsweise die Korrelation zwischen Körpergröße und Gewicht von Menschen berechnen, so bekommst du vermutlich auch einen relativ großen positiven Korrelationskoeffizienten. Du kannst dann aber nicht sagen, dass das Körpergewicht und die Größe eines Menschen ähnlich große Werte sind (macht auch gar keinen Sinn, denn eine Körpergröße ist ein komplett anderes Maß als das Korpergewicht).
Dieser positive Korrelationskoeffizent würde dann aber wohl aussagen, dass die Tendenz besteht, dass ein größerer Mensch eher mehr wiegt als ein kleinener.
Miiira
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mi 20. Jul 2016, 12:10
Danke gegeben: 3
Danke bekommen: 1 mal in 1 Post

Re: Auswertung von Gewichtungen (Korrelation + Clusteranalys

Beitragvon Koller » Mi 20. Jul 2016, 15:09

Das leuchtet ein. Ich möchte ja auch herausbekommen, ob die Gruppen die verschiedenen Kriterien ähnlich bewertet haben (egal ob die dann eher hoch oder niedrig bewertet haben).

D.h. die Clusteranalyse wäre hier doch eher die einzige (?) Methode der Wahl?
Koller
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 20. Jul 2016, 13:06
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 10 Gäste

cron