Gemischt skalierte Variablen für hierarch. Clusteranalyse

Alles rund um Clusteranalysen.

Gemischt skalierte Variablen für hierarch. Clusteranalyse

Beitragvon nurhier » Fr 1. Feb 2019, 18:46

Hallo,

für meine Bachelorarbeit habe ich vor über eine Clusteranalyse Zielgruppensegmente eines Start ups zu ermitteln.
Die relevanten Variablen sind sowohl nominal (z.B. Berufsstatus) als auch metrisch skaliert (durchschnittliche monatliche Ausgaben für Ernährung oder vorab gebildete Faktoren wie z.B. Gesundheitsbewusstsein hinsichtlich der Ernährung). Die nominalen Items würde ich natürlich in binäre Daten transformieren.

Folgende Fragen stellen sich mir nun, da die Literatur leider nicht viel über diese Problematik hergibt:

1. Meines Wissens nach ist nur die hierarchische Clusteranalyse möglich, da sowohl dir Two-Step-Analyse als auch die partitionierende Analysemethoden euklidische Distanzen und somit ausschließlich metrische Daten voraussetzt, ist das korrekt?

2a. Laut Backhaus et al. (2016, S. 473) schreiben über die Proximitätsermittling bei gemischt skalierten Variablen nun folgendes:
"Eine erste Möglichkeit besteht in der für metrische und nicht-metrische Variablen getrennten Berechnung von Ähnlichkeitskoeffizienten bzw. Distanzen. Die Gesamt-ähnlichkeit ermittelt sich dann als ungewichteter oder gewichteter Mittelwert der im vorherigen Schritt berechneten Größen." So weit, so einfach. Aber als welches Skalenniveau betrachte ich dieses arithmetische Mittel für die Auswahl des Fusionierungsalgorithmus? Darüber finde ich leider überhaupt keine Informationen..

2b. Das Ward-Verfahren ist in einem solchen Fall nicht möglich, oder? Backhaus et al. (2016, S. 498) schreiben die Voraussetzung für dieses Verfahren sei, dass "alle Variablen auf metrischem Skalenniveau gemessen wurden". Bleibt dementsprechend für mich als bester Fusionierungsalgorithmus das Average-Linkage-Verfahren übrig oder habt ihr noch bessere Ideen?

Herzlichen Dank vorab für eure Unterstützung!
nurhier
Einmal-Poster
Einmal-Poster
 
Beiträge: 1
Registriert: Fr 1. Feb 2019, 18:18
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Zurück zu Clusteranalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron