Hallo,
vielleicht ist es eine relativ einfache Frage, aber mein Betreuer kann mir leider hierbei nicht helfen (ja, wechseln, aber das geht leider nicht mehr).
Vor mir liegt eine Umfrage per Multiple-Choice (MC), am deren Ende Gruppen aus den Teilnehmern gebildet werden (demographische Daten sind vorhanden - z.B. Mann/Frau).
Jeder Teilnehmer soll MCs ausfüllen.
Nun stellt sich für mich die Frage, wie diese Daten am besten gespeichert werden, um diese später erfolgreich zu clustern (oder ggf. eine Faktorenanalyse durchzuführen).
Empfiehlt es sich (Nutzer A wählt Himbeeren, Erdbeeren aus; Nutzer B wählt Erdbeeren und Heidelbeeren aus):
a. Für jeden Auswahlpunkt des MC Blocks ein Ja/Nein Feld (1/0) anzulegen und die Daten in dieser Form zu speichern (Feld Himbeeren, Feld Erdbeeren, Feld Heidelbeeren --> Nutzer A hat folgenden DS: A | 1 | 1 | 0; Nutzer B hat folgenden DS: B | 0 | 1 | 0).
oder
b. Soll jede Auswahl des MC Blocks eine Nummer bekommen, welche separat gespeichert wird (Himbeeren = 1; Erdbeeren = 2; Heidelbeeren = 3 --> Nutzer A hat folgende DS: A | 1; A | 2, Nutzer B hat folgende DS: B | 2; B | 3).
Welcher Ansatz ist am sinnvollsten für ein Clustering (oder ggf. Faktorenanalyse - wobei ich diese eher bei einer Likert-Skala sehen würde, aber den Argumenten meines Betreuers bin ich grundsätzlich offen gegenüber und würde mich freuen, wenn mir jemand die Nutzung einer Faktorenanalyse im Rahmen von Boolenwerten, also eines nicht stark skalierten Werte, bestätigen würde).
Liebe Grüße
MCRJ19