STATISTIK-FORUM.de

DGOERIS · von **DGOERIS** » Mo 12. Jan 2015, 18:22

Hallo liebe Statistik-Freunde,

Ich bin gerade etwas Ratlos und hoffe mir kann hier jemand helfen.

ich muss für eine Umfrage (sehr große Stichprobe) "Impact-Matrizen" erstellen, welche den Einfluss von Variablen (df-beta-wert) auf eine Zielvariable und den Mittelwert abbilden sollen.
Dabei sieht die Struktur des Fragebogens so aus, dass es Allgemeine Variablen gibt und 8 spezifische Themen, von denen jede Versuchsperson maximal 3 Themen wählt.
Sowohl bei der allgemeinen Kategorie (die alle beantworten), als auch in den Wahlthemen gibt es identische Dimensionen. Also D1 allgemein, D1 Thema1, D1 Thema2 etc. und D2 allgemein, D2 Thema 1,..
Die Fälle untereinander sind Unabhängig und die erste Impact-Matrix soll als Zielvariable D1 Allgemein haben und als unabhängige Variablen die restlichen Dimensionen allgemein (von allen beantwortet). Das ist soweit kein Problem glaube ich. Nun zu meinem Problem:
Zu jeder einzelnen Allgemeinen Dimension soll wiederum abgebildet werden, welchen Einfluss die gleiche Dimension getrennt nach den unterschiedlichen Wahlthemen in denen die Dimension vorkommt auf die jeweilige Allgemeine Dimension hat. Also Einfluss von D2 Thema 2, Thema 3, Thema 4 etc. auf D2 allgemein.
Dabei gibt es aber natürlich sehr viel Missing Data, weil jeder einzelne Fall nur 3 von 8 Themen beantwortet. Rauslöschen ist natürlich keine Option, daher suche ich nach der besten Lösung für das Problem.

Ich hoffe, das Problem ist einigermaßen verständlich geworden.

Ich würde mich über Anregungen und Lösungen sehr freuen!

Vielen Dank schonmal im voraus!

strukturmarionette · von **strukturmarionette** » Di 13. Jan 2015, 05:41

HI,

Ich hoffe, das Problem ist einigermaßen verständlich geworden.

Nein.

Schreib doch zumindest mal auf, was deine UV und AV sind bzw sein sollen.

und

ob die Daten bereits vorliegen und /oder in welcher Phase eines Versuchs- bzw. Umfragedesigns du dich befindest.

Gruß
S.

folgende User möchten sich bei strukturmarionette bedanken:
DGOERIS

DGOERIS · von **DGOERIS** » Di 13. Jan 2015, 09:49

Hi S.,

Dann versuche ich nochmal mich klarer auszudrücken.

UV und AV unterscheiden sich abhängig von der Regression die gerechnet werden soll.

Erste Matrix:

UV: Allgemeine Qualität, Allgemeine Transparenz, Allgemeine Innovation, Allgemeine Zuverlässigkeit -> Einfluss auf -> AV: Allgemeiner Eindruck

Anschließend soll z.B. die Transparenz untersucht werden:

Zweite Matrix:

UV: Hardware Transparenz, Software Transparenz, Datensicherheit Transparenz, usw... -> Einfluss auf -> AV: Allgemeine Transparenz (Anmerkung, allgemeine Transparenz, ist durch eigene Fragen operationalisiert. Es gibt also keine Regression von identischen Fragen aufeinander)

Ist das so etwas klarer?

Die Daten liegen noch nicht vor, die Umfrage ist jedoch so gut wie fertig und es ist z.B. nicht möglich jede VPn alles zu fragen, weil das zum einen aus Zeitgründen nicht und viele VPn nicht zu jedem Thema etwas sagen können, weil die Abhängig von Erfahrung sind. Den Fragebogen umgestalten ist ebenfalls kaum noch möglich. Die Stichprobe wird wie schon gesagt voraussichtlich sehr groß sein (mindestens vierstellig).

Viele Grüße

STATISTIK-FORUM.de

Regression mit missing Data

Regression mit missing Data

Re: Regression mit missing Data

Re: Regression mit missing Data

Wer ist online?