Guten Tag,
ich stehe gerade ein wenig auf dem Schlauch und hoffe, dass Ihr mich bei meiner Problematik unterstützen könnt.
Es geht um Folgendes:
Ich habe über einen längeren Zeitraum Konsumdaten von einer bestimmten Anzahl an Studienteilnehmern erhoben.
Pro Teilnehmer habe ich Werte zu den folgenden Variablen:
- Menüs insgesamt
- Menüs mit Fleisch
- Menüs mit Fisch
- Vegetarische/ Vegane Menüs
Ziel ist es, pro Teilnehmer eine Variable zu schaffen, die die RELATIVE Häufigkeit seiner Menüwahl beschreibt, sprich % Anteil an Fleischmenüs, % Anteil an Veg-Menüs etc. Diese Prozentsätze zu berechnen ist natürlich grundsätzlich kein Problem.
Das eigentliche Problem ist aber, dass nicht jeder Teilnehmer die gleiche Anzahl an Menüs im Studienzeitraum konsumiert hat. Die Spanne reicht von 1 bis 19 Menüs insgesamt. In den relativen Häufigkeiten werden diese Unterschiede jedoch nicht abgebildet: Jemand der nur 1x ein Menü verzehrt hat, welches Fleisch enthielt, wird beim Anteil der Fleischmenüs 100% erhalten, was meiner Ansicht nach aber nicht vergleichbar ist mit jemandem der 19x da war und 19x Fleisch gegessen hat (auch dieser Teilnehmer hat beim Anteil der Fleischmenüs dann einen Wert von 100%).
Ich möchte nun eine Art der Gewichtung kreieren, die die Anzahl an insgesamt konsumierten Menüs widerspiegelt. Diese Gewichtung ist nicht nur dafür gedacht, einen gewichteten Mittelwert o.Ä. zu berechnen. Wie man hier vorgeht, wüsste ich. Ziel ist es, einen gewichteten Datensatz zu erhalten, sprich die einzelnen Werte pro Teilnehmer durch die Gewichtung so zu "verändern", dass sie vergleichbar sind.
[b]
Wie gehe ich vor, um Gewichtungsfaktoren zu berechnen, die dieses Ziel erfüllen? [/b]
Eine Idee von mir war folgende: Ich berechne die durchschnittliche Anzahl an konsumierten Menüs (= 7,78), und berechne das Gewicht, indem ich die Gesamtzahl der konsumierten Menüs pro Teilnehmer (z.B. Teilnehmer X hat insgesamt nur 1 Menü gegessen) durch diesen Wert teile -> für Teilnehmer X wäre der Gewichtungsfaktor 1/7,78 = 0,129, was bedeuten würde, dass ich die relativen Anteile mit diesem Wert multiplizieren würde. Sprich: Wenn das konsumierte Menü dieses Teilnehmers X Fleisch enthielt, und die "normale" relative Häufigkeit der Fleischmenüs daher 100% betragen würde, würden sich diese 100% durch die Gewichtung auf 12,9% reduzieren (0,129 * 100%). [b]Macht das Sinn? Welche Alternativen gibt es? [/b]
Ich danke Euch jetzt schon vielmals für Eure großartige Hilfe!
Liebe Grüße,
Nina