Hallo zusammen,
ich beschäftige mich auch seit einiger Zeit mit einer Clusteranalyse, bei der ich rund n=1.500 Befragte zunächst mittels Single-Linkage-Verfahren auf Ausreißer getestet habe, bevor ich dann Ward und K-Means durchgeführt habe. Beim Single-Linkage-Verfahren sind 57 Ausreißer aufgefallen. Wenn ich diese nun rausnehme, wird die 3-Cluster-Lösung, die nach Elbow-Kriterium und Dendrogramm nahegelegt wird, aber noch immer nicht vollkommen homogen. Noch immer liegen in einem Cluster 2 von 6 Variablen bei 1,1. Ich finde das Ergebnis nicht besonders zufriedenstellend, zumal ich dafür 57 Fälle rausnehmen müsste, was ganz grob 5% aller Fälle entspricht. Das Ergebnis wird bei mehr Clustern nicht besser, zumal die Interpretierbarkeit schwieriger wird. Gibt es etwas, was ich noch prüfen kann, um evtl. homogenere Cluster zu bekommen? Habe ich überhaupt Alternativen zur nicht vollkommen homogenen 3-Cluster-Lösung? Wenn ich das richtig verstehe, müssten die Ausreißer ja strenggenommen für jede Clusterlösung rausgenommen werden oder?
Würde mich über eure Hilfe freuen.
Viele Grüße
gentix