Ausreißer bei Clusteranalyse

Alles rund um Clusteranalysen.

Ausreißer bei Clusteranalyse

Beitragvon gentix » Di 18. Mär 2014, 23:36

Hallo zusammen,

ich beschäftige mich auch seit einiger Zeit mit einer Clusteranalyse, bei der ich rund n=1.500 Befragte zunächst mittels Single-Linkage-Verfahren auf Ausreißer getestet habe, bevor ich dann Ward und K-Means durchgeführt habe. Beim Single-Linkage-Verfahren sind 57 Ausreißer aufgefallen. Wenn ich diese nun rausnehme, wird die 3-Cluster-Lösung, die nach Elbow-Kriterium und Dendrogramm nahegelegt wird, aber noch immer nicht vollkommen homogen. Noch immer liegen in einem Cluster 2 von 6 Variablen bei 1,1. Ich finde das Ergebnis nicht besonders zufriedenstellend, zumal ich dafür 57 Fälle rausnehmen müsste, was ganz grob 5% aller Fälle entspricht. Das Ergebnis wird bei mehr Clustern nicht besser, zumal die Interpretierbarkeit schwieriger wird. Gibt es etwas, was ich noch prüfen kann, um evtl. homogenere Cluster zu bekommen? Habe ich überhaupt Alternativen zur nicht vollkommen homogenen 3-Cluster-Lösung? Wenn ich das richtig verstehe, müssten die Ausreißer ja strenggenommen für jede Clusterlösung rausgenommen werden oder?

Würde mich über eure Hilfe freuen.

Viele Grüße
gentix
gentix
Power-User
Power-User
 
Beiträge: 58
Registriert: Di 18. Mär 2014, 23:29
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Ausreißer bei Clusteranalyse

Beitragvon PonderStibbons » Mi 19. Mär 2014, 10:19

Wieso ist es Dir wichtig, homogene Cluster zu bekommenm
wozu ist das bei Dir erforderlich?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Ausreißer bei Clusteranalyse

Beitragvon gentix » Mi 19. Mär 2014, 10:27

Hallo PonderStibbons,

danke für deine Antwort.

Ich schaue mir das Einkaufsverhalten in einem Einkaufszentrum an und habe dazu unterschiedliche Merkmale wie z.B. "Einstellungen" und "Besuchsmotive" erfasst.
Jetzt möchte ich Gruppen gleicher Ausprägung bilden und mir diese in einem nächsten Schritt etwas genauer anschauen.

Viele Grüße
gentix
gentix
Power-User
Power-User
 
Beiträge: 58
Registriert: Di 18. Mär 2014, 23:29
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Ausreißer bei Clusteranalyse

Beitragvon PonderStibbons » Mi 19. Mär 2014, 10:32

Aus der Antwort ersehe ich nicht, wieso Du Dir so viel Gedanken um
die Homogenität der Cluster machst. Du hast 57 Fälle, die Du nicht
zuordnen kannst, und eine Clusterlösung, deren Qualität Du beschreiben
kannst und die Du anscheinend für Deine weiteren zwecke verwenden
kannst.

Just my 2pence

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Ausreißer bei Clusteranalyse

Beitragvon gentix » Mi 19. Mär 2014, 10:42

Möglicherweise liegt es daran, dass in der Literatur immer davon gesprochen wird, dass Cluster idealerweise homogen und zueinander möglichst unterschiedlich sein sollten.

Das heißt: Cluster müssen nicht zwingendermaßen vollkommen homogen sein, sondern man muss nur über die Qualität der Cluster-Lösung informiert sein? Und ein nicht vollkommen homogener Cluster ist nicht automatisch eine schlechte Lösung?

Viele Grüße
gentix
gentix
Power-User
Power-User
 
Beiträge: 58
Registriert: Di 18. Mär 2014, 23:29
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Ausreißer bei Clusteranalyse

Beitragvon gentix » Mi 19. Mär 2014, 17:47

PonderStibbons,

habe ich dich da richtig verstanden?
gentix
Power-User
Power-User
 
Beiträge: 58
Registriert: Di 18. Mär 2014, 23:29
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Ausreißer bei Clusteranalyse

Beitragvon PonderStibbons » Mi 19. Mär 2014, 23:44

Ich weiß nicht, ob und wozu Du sehr homogene Cluster brauchst,
Du kannst es mir nicht sagen, Möglichkeiten zur Steigerung der
Homogenität gibt es nicht, wenn ich es recht verstanden habe,
also musst Du wohl mit dem arbeiten, was Du hast. Eine schlechte
Clusterlösung sollte sich bei Verwendung als Gruppierungsvariable
negativ bemerkbar machen.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Ausreißer bei Clusteranalyse

Beitragvon gentix » Do 20. Mär 2014, 13:16

Ich dachte es sei grundsätzlich erforderlich, homogene Cluster zu identifizieren, wenn man eine Clusteranalyse durchführt.

Die F-Werte meiner Clusterlösung sehen folgendermaßen aus:

CL1......CL2......CL3
0,220 | 0,356 | 0,167
0,154 | 0,515 | 0,302
0,653 | 0,880 | 0,175
1,206 | 0,990 | 0,714
0,948 | 0,965 | 0,228
1,239 | 0,932 | 0,848

Ich nehme einfach einmal an, dass ich hiermit weiterarbeiten kann. Kreuztabellen, bestehend aus der Clustervariable und anderen Variablen liefern inhaltlich plausible Ergebnisse. Ich werde die weniger homogenen Variablen bei Cluster 1 einfach bei der Interpretation weniger berücksichtigen.

Viele Grüße
gentix
gentix
Power-User
Power-User
 
Beiträge: 58
Registriert: Di 18. Mär 2014, 23:29
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Ausreißer bei Clusteranalyse

Beitragvon SKasten » Do 1. Mai 2014, 17:08

Liebe/r Gentix,
ich bin gerade an dem Punkt, an dem Du vor 1,5 Monaten warst. Ich weiß zwar, wie ich meine Daten auswerten werde und habe auch schon diverse Berechnungen angestellt, ABER ich finde einfach nicht, wie ich per Single Linkage (mit seuclid) die Ausreißer identifiziere. Mein Dendogramm spuckt mir immer nur einen Ausreißer aus. Das ist dann der Fall, der als letztes den anderen, bereits gebildeten Clustern zugeordnet wurde.
Kannst Du mir einen Tipp geben :? Das wäre wunderbar ;-)
Grüße, Susanne
SKasten
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Fr 4. Mai 2012, 10:07
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Clusteranalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron