STATISTIK-FORUM.de

gentix · von **gentix** » Fr 21. Mär 2014, 20:26

Hallo zusammen,

es geht noch immer um die Clusteranalyse, die ich bereits seit Tagen bearbeite. Mir wurde hier im Forum auch schon sehr weitergeholfen. Leider stehe ich aber gerade vor einem riesigen Problem!

Die Cluster wurden bereits bestimmt. Aus n=1318 Befragten wurden drei Cluster (1) n=352, (2) n=407, (3) n=559 gebildet. Die Gruppen sind weitestgehend homogen und die sind durchaus plausibel. Nun will ich aber noch erkennen, ob die Teilgruppen tatsächlich heterogen zueinander sind. Hierfür weist K-Means (Clusterzentrenanalyse) ja auch eine Anova-Tabelle aus, die durchaus plausible Werte liefert:

Bild

Alle F sind mitunter deutlich größer als 1 und die Variablen alle signifikant. Das deutet ja stark auf eine saubere Clusterlösung hin, nicht wahr?

ABER: Wie kann ich erkennen, ob sich die Cluster signifikant unterscheiden, wenn Anova nicht durchgeführt werden darf, weil die Stichprobe nicht normalverteilt ist keine homogenen Varianzen hat? Folgender Link hilft mir leider auch nicht weiter: http://www.uni-graz.at/ilona.papousek/t ... s/faq.html weil meine kleinste Zelle 352 Fälle umfasst und die größte 559. Das entspricht nicht 1,5 sondern 1,59.

Ich komme mit meiner weiteren Auswertung gerade nicht weiter voran, weil ich erst sichergehen möchte, dass die Clusterlösung tatsächlich sinnvoll ist. Kann mir jmd. von euch dazu einen Rat geben?

Ich brauche dringend kompetenten Rat.

Viele Grüße
gentix

STATISTIK-FORUM.de

Problem bei Clusteranalyse

Problem bei Clusteranalyse

Wer ist online?