Hallo liebe Statistik-Freunde,
Ich bin gerade etwas Ratlos und hoffe mir kann hier jemand helfen.
ich muss für eine Umfrage (sehr große Stichprobe) "Impact-Matrizen" erstellen, welche den Einfluss von Variablen (df-beta-wert) auf eine Zielvariable und den Mittelwert abbilden sollen.
Dabei sieht die Struktur des Fragebogens so aus, dass es Allgemeine Variablen gibt und 8 spezifische Themen, von denen jede Versuchsperson maximal 3 Themen wählt.
Sowohl bei der allgemeinen Kategorie (die alle beantworten), als auch in den Wahlthemen gibt es identische Dimensionen. Also D1 allgemein, D1 Thema1, D1 Thema2 etc. und D2 allgemein, D2 Thema 1,..
Die Fälle untereinander sind Unabhängig und die erste Impact-Matrix soll als Zielvariable D1 Allgemein haben und als unabhängige Variablen die restlichen Dimensionen allgemein (von allen beantwortet). Das ist soweit kein Problem glaube ich. Nun zu meinem Problem:
Zu jeder einzelnen Allgemeinen Dimension soll wiederum abgebildet werden, welchen Einfluss die gleiche Dimension getrennt nach den unterschiedlichen Wahlthemen in denen die Dimension vorkommt auf die jeweilige Allgemeine Dimension hat. Also Einfluss von D2 Thema 2, Thema 3, Thema 4 etc. auf D2 allgemein.
Dabei gibt es aber natürlich sehr viel Missing Data, weil jeder einzelne Fall nur 3 von 8 Themen beantwortet. Rauslöschen ist natürlich keine Option, daher suche ich nach der besten Lösung für das Problem.
Ich hoffe, das Problem ist einigermaßen verständlich geworden.
Ich würde mich über Anregungen und Lösungen sehr freuen!
Vielen Dank schonmal im voraus!