Variablenaggregation

Fragen, die sich auf kein spezielles Verfahren beziehen.

Variablenaggregation

Beitragvon Markovchain » Di 15. Nov 2016, 19:04

Hallo zusammen,

ich schildere kurz das Problem: Ich habe eine übergeordnete Variable (z.B. Haushalt 1) - diese hat verschiedene Merkmalsausprägungen. Zu dieser übergeordneten Variable gehören mehrere untergeordnete Variablen (z.B. Haushaltsmitglied 1,2,3 etc...). Diese haben nun zusätzlich zu den übergeordneten Merkmalen weitere Merkmale und unterschiedliche Ausprägungen (z.B. Haushaltsmitglied 1 --> Hobby 1, Haushaltsmitglied 2 --> Hobby 4 etc.).

Ich würde nun gerne alle untergeordneten Variablen zu EINER (repräsentativen) Variablen zusammenfassen/aggregieren. Ziel ist es später mit den übergeordneten Variablen eine Clusteranalyse zu machen.

0. Wie wäre das generelle Vorgehen hierbei?
1. Habt ihr Literaturempfehlungen zu diesem speziellen Thema (Datenaggregation etc.)?
2. Sollte ich mit Durchschnittswerten rechnen? Erscheint mir hier etwas unpassend, da die meisten Merkmale nominal/ordinal skaliert sind..
3. Wäre eine Einführung neuer Merkmalsausprägungen (z.B. Hobby 6 = Hobby 1 + Hobby 4) sinnvoll?
4. Festlegung von dominierenden Merkmalen (z.B. falls Haushaltsmitglied 1 "Fahrrad" fährt und Mitglied 2 "wechselnde Verkehrsmittelt" dann liegt dominiert "wechselnde Verkehrsmittel", da es auch "Fahrrad" enthält)

Ich wäre dankbar für jede hilfreiche Antwort zu meiner Frage und meine Überlegungen :)

Gruß
Markovchain
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Di 15. Nov 2016, 18:50
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Variablenaggregation

Beitragvon strukturmarionette » Mi 16. Nov 2016, 01:47

Hi,

- Deine Hierarchiscch Datenstruktur ist nachvollziehbar, es fehlen aber Angaben über N.

Ich würde nun gerne alle untergeordneten Variablen zu EINER (repräsentativen) Variablen zusammenfassen/aggregieren. Ziel ist es später mit den übergeordneten Variablen eine Clusteranalyse zu machen.

- Mit welchen Vars willst Du dann aus welchem Grund Clusteranalysen durchführen?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Variablenaggregation

Beitragvon Markovchain » Mi 16. Nov 2016, 14:07

Hi,

danke erstmal für die Antwort. Ich versuche die Fragen mal soweit zu beantworten wie ich kann (falls ich zu ungenau bin gerne noch weiter Fragen!)

1. Ich denke mal mit N meinst du die Anzahl an Über- und Untergeordneten Variablen. Ca. 300 übergeordnete Variablen und diesen sind 5000 weitere Variablen untergeordnet. DIe Verteilung kann aber sehr unterschiedlich sein (1 übergeordnete Variable kann 2,3 oder sogar 10 untergeordnete Variablen haben).

2. Ich will mit den 300 übergeordneten Variablen eine Clusterung durchführen (anhand vorher ausgewählter Merkmale, die aber noch nicht feststehen (werden aus dem gesamten "Merkmals-Pool" genommen)). Die Merkmale einer übergeordneten Variablen sollen durch die Merkmale der untergeordneten Variablen ergänzt werden.

Vielleicht auch eine weitere Überlegung zu einem ausgedachten Beispiel:

Haushalt 1:
Größe: 5 Mitglieder
Haustiere: 2
Kinder: 3
Hobbies: Fussball (Vater) UND Schwimmen (Tochter) --> Rest hat keine Hobbies

Haushalt 2:
Größe: 5 Mitglieder
Hasutiere: 1
Kinder: 3
Hobbies: Fussball (Vater) --> Rest hat keine Hobbies

Haushalt 1 hat nun eine Merkmalsausprägung bei Hobbies mehr als Haushalt 2... Erzeuge ich eine neue Hobby-Gruppe als Kombination, dann werden die Haushalte vielleicht nicht zusammen geclustert, obwohl beide gerne Fussball spielen.

Ich hoffe das Beispiel ist einigermaßen verständlich.

Besten Gruß
Markovchain
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Di 15. Nov 2016, 18:50
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Variablenaggregation

Beitragvon strukturmarionette » Do 17. Nov 2016, 08:40

Hi,

sorry, versteh ich nicht.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Variablenaggregation

Beitragvon Markovchain » Do 17. Nov 2016, 16:17

Hi,

okey ich versuchs nochmal neu. Vielleicht noch einfacher:

Haushalt 1 (übergeordnete Variable) hat die drei Merkmale 1,2,3. Zusätzlich zum Haushalt gehören Haushaltsmitlgieder die zwei weitere Merkmale haben 4 und5. Nun will ich die Merkmale 4 und 5 und deren Ausprägungen dem Haushalt 1 zuordnen --> Am Ende hat der Haushalt 1 fünf Merkmale (1,2,3,4,5).

Leider gibt es in jedem Haushalt eine unterschiedliche Anzahl an Haushaltsmitgliedern und diese haben widerum oft andere Ausprägungen der Merkmale 4,5.

Welche Ausprägungen der Merkmale 4 und 5 werden nun dem Haushalt 1 zugeordnet? Alle vorhandenen? Eine durchschnittliche Ausprägung (leider nur nominales Niveau...)?

Diese Zuordnung habe ich versucht in meinem letzten Post mit den "Hobbies" deutlich zu machen. Im Ersten Haushalt haben wir zwei verschiedene Ausprägungen des Merkmals (Vater und Tochter als Haushaltsmitglieder) und in Haushalt 2 nur eine.
Markovchain
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Di 15. Nov 2016, 18:50
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 13 Gäste