Hallo zusammen,
ich schildere kurz das Problem: Ich habe eine übergeordnete Variable (z.B. Haushalt 1) - diese hat verschiedene Merkmalsausprägungen. Zu dieser übergeordneten Variable gehören mehrere untergeordnete Variablen (z.B. Haushaltsmitglied 1,2,3 etc...). Diese haben nun zusätzlich zu den übergeordneten Merkmalen weitere Merkmale und unterschiedliche Ausprägungen (z.B. Haushaltsmitglied 1 --> Hobby 1, Haushaltsmitglied 2 --> Hobby 4 etc.).
Ich würde nun gerne alle untergeordneten Variablen zu EINER (repräsentativen) Variablen zusammenfassen/aggregieren. Ziel ist es später mit den übergeordneten Variablen eine Clusteranalyse zu machen.
0. Wie wäre das generelle Vorgehen hierbei?
1. Habt ihr Literaturempfehlungen zu diesem speziellen Thema (Datenaggregation etc.)?
2. Sollte ich mit Durchschnittswerten rechnen? Erscheint mir hier etwas unpassend, da die meisten Merkmale nominal/ordinal skaliert sind..
3. Wäre eine Einführung neuer Merkmalsausprägungen (z.B. Hobby 6 = Hobby 1 + Hobby 4) sinnvoll?
4. Festlegung von dominierenden Merkmalen (z.B. falls Haushaltsmitglied 1 "Fahrrad" fährt und Mitglied 2 "wechselnde Verkehrsmittelt" dann liegt dominiert "wechselnde Verkehrsmittel", da es auch "Fahrrad" enthält)
Ich wäre dankbar für jede hilfreiche Antwort zu meiner Frage und meine Überlegungen
Gruß