Hallo zusammen,
ich bin grade bei der Auswertung meiner Daten und habe noch einige Fragen bezüglich der Clusteranalyse.
Vorweg: Die Clusteranalyse ist für mich Neuland.
In den Büchern und auf Seiten, die ich gelesen habe steht, dass eine Vorraussetzung der Clusteranalyse (ich werde eine herarchische Clusteranalyse durchführen) ist, dass die einfließenden Variablen ausreichend streuen müssen, da sonst keine Unterscheidung getroffen werden kann. Das verstehe ich auch - nur kann ich leider nicht herausfinden, woran - bzw. anhand welcher Methode und Werte ich erkennen kann/entscheiden soll, dass die Variable in die Analyse rein- oder nichtreingeht. (Abgesehen von der Häufigkeitsverteilung) - Gibt es hier bestimmte - Maße bezüglich metrisch skalierter Variablen?
Dann wurde mir gesagt - obwohl meine Variablen alle metrisch sind (6er) Skala - trotzdem im Vorfeld eine z-Standardisierung durchzuführen. Ich weiß, dass dies empfohlen wird bei unterschiedlich skalierten Variablen, aber mir ist das Prozedere bei einheitlich Skalierten Variablen nicht geläufig, bzw. was kann der Grund dafür sein?
Plus weitere Fragen: Kann ich auch binäre Variablen (ja/nein) Z- Standadisieren, und: habe einige Male gelesen, dass die oben genannte Voraussetzung bezüglich der Normalverteilung genau duch eine Z-Standadisierung gelöst werden kann... Kann mir das jemand vllt. erklären?
Wie gesagt, ich verstehe alles grob, aber manche Dinge werden in Büchern unklar formuliert bzw. es wird nur gesagt "Voraussetzung, dass ... weil das" aber wie man das Problem nun behebt - nunja, dafür geben sie keine Lösung...
Viele Grüße
D.