PPaul hat geschrieben:Hallo zusammen,
Hallo, Paul.
Clusteranalyse ist mein Schwepunkt. ich kenne die Wardmehtode besonders gut, weil ich diese generalisiert habe. Auch die k-Means ist mir sehr gut bekannt, auch mit ihr arbeitete ich viel. Ihre Frage ist recht einfach.
PPaul hat geschrieben:Hierfür habe ich mittels einer Ward-Analyse eine erste Idee für eine Clusterung (4 bzw. 5-Cluster Lösung) bekommen. Um diese Clusterung zu optimieren ist die Durchführung einer k-Means-Analyse geplant. Nun zu meinen Fragen:
(0.) Ist dieses Vorgehen sinnvoll?
Soweit Sie unter "Optimieren" weitere quantitative untersuchung meinen, um noch mehr Ideen zu sammeln: ja, das halte ich für sinnvoll.
PPaul hat geschrieben:1. Kann ich aus den SPSS Ergebnissen der Wardanalyse irgendwie die bisherigen Clusterzentren (für k-means) entnehmen, wenn ja wie?
Das können Sie in der Tat, z.B. die durchschnittswerte der jeweiligen Cluster aus Ward-Analyse mit jeweiliger Clusterzahl. Allerdings ist das nicht norwendig, denn k-Means kann mit beliebigen Centroiden anfangen. Manchmal geht eine oder andere Interaktion in eine Schleife und führt zu unsinnigen Ergebnissen, egal ob mit zufälligen oder von vorangegangener Ward-Analyse gelieferten Centoiden. Um die k-Means ergebnisse zu beeinflüßen, sollte man das interpretativ rechtfertigen.
Sofern Sie bei Ihrer Frage nicht die Clusterzentreneigenschaften sondern die Anzahl der Cluster meinen - ich würde alle 4 und 5 ausprobieren und zusätlich auch noch 3 und 6 und mir überlegen, ob das eine oder das andere sich besser für Ihre Zwecke interpretieren ließe.
PPaul hat geschrieben:2. Wenn nein, wie sieht das beste Vorgehen zur Bestimmung von Clusterzentren aus?
Sofern Sie "beste" als "technisch einfachste" für K-means meinen - gar nicht. K-Means macht alles selber.
Sofern die Frage allgemein ist - da gibt es unterschiedliche Herangehensweisen. In Abhähgigkeit von Ihrer Theorie, für die Sie die Clusteranalyse machen und in Abhängigkeit von Ihrem "Material" würde sich eine oder andere Clusterungmethode empfehlen, manchmal auch zwei.
PPaul hat geschrieben:Leider finde ich die an SPSS angelehnte Literatur hierzu eher bescheiden.
Beste Grüße
Komisch... was meinen Sie unter "Abstammung" ? Sind Sie ein Biometriker? Die Biometrie arbeitet mit Clusteranalyse durchaus viel. Oder Ökonometrie? Die Ökonometriker und Politologen haben zur Clusteranalyse meines Wissens nach tatsächlich wenig guter Literatur.