STATISTIK-FORUM.de

castor1 · von **castor1** » Mi 20. Jul 2016, 14:49

Geschätzte Gemeinschaft,

ich bin an eurer Einschätzung für ein sinnvolles/ methodisch richtiges Auswertungsverfahren für folgendes Vorhaben interessiert bzw. sogar angewiesen:

Mein Hauptinteresse liegt in der Wirkungsmessung (Kausalität) einer Intervention. Leider habe ich nur eine Messung des Outcome (Y bzw. AV kontinuierlich) VOR der Intervention und eine Messung NACH der Intervention zur Verfügung. Dennoch scheint mir das Design ausreichend, da externe Einflüsse auf Y zwischen den Messzeitpunkten sehr unwahrscheinlich sind. Es geht mir hier auch nicht um die Diskussion des Designs sondern um die Methoden zur Auswertung. Die beiden Messungen sind kein Panel sondern als zwei Querschnittserhebungen zu behandeln. Es sind zwar großteils die selben Subjekte in den beiden Stichproben, aber eben nicht vollkommen gleich und v.a. sind die Werte nicht zuordenbar. Neben Y-vor und Y-nach habe ich noch mehrere demografische Variablen (alle kategorial zw. 2 und 10 Stufen), die als Kontrollvariablen verwendet werden sollen.

Zur Auswertung schwebt mir folgendes vor, mit der Bitte um eure Meinung:
1. Zunächst habe ich die beiden Stichproben (also Vorher- und Nachher-Stichprobe) bzgl. der Kontrollvariablen verglichen. Dazu habe ich die kategorialen Kontrollvariablen als Dummies umcodiert und mittel t-Test für unabhängige Stichproben den Unterschied der jeweiligen Anteilswerte (z.B. Anteil Männer in Vorher vs. Nachher) auf statistische Signifikanz getestet. Ergebnis: die beiden Stichproben sind nur in wenigen Merkmalen stat. signifgikant verschieden (z.B. Anteil der 20-34-Jährigen).

2. Dann habe ich ein Regressionsmodell gerechnet (Y = a + b1*PräPost) mit Y als AV und Vorher- und Nachhermessung als Dummy( PräPost, Post=1), das mir einen sign. Unterschied zwischen Vorher- und Nachher-Messung bestätigt. D.h. b1 ist pos. (.18) und sign. auf 1%-Niveau. Das sagt mir, dass der Mittelwert von Y nach der Intervention um .18 höher liegt als vorher. Ergo: Intervention zeigt Effekt.

3. Hier sollen nun die Kontroll-Dummies ins Spiel kommen. Also habe ich wieder ein Regressionsmodell mit den Kontroll-Dummies (jeweils ohne Referenzkategorie) und der Prä-Post Dummy gerechnet (Y = a + b1*PräPost + b2*Mann + b3*19bis34-Jährige + b4*Kleinunternehmen....). Der Koeffizient der PräPost-Dummy ist nun .12, also etwas kleiner. Das ist ja plausibel, da die vielen Kontrollvariablen Varianz aufsaugen.

Meine 1. Frage: Ist es empfehlenswert, alle Kontrollvariablen ins Modell aufzunehmen oder nur jene, deren Anteilswerte sich signifikant in den beiden Stichproben unterscheiden (siehe 1. Schritt)? Letztlich möchte ich ja die beiden Stichproben - bis auf die Intervention (also PräPost Dummy) - völlig angleichen (oder soweit das eben mit den verfügbaren Kontrollvariablen möglich ist). Demzufolge könnte es ja auch sinnvoll sein, auch Merkmale mit nicht signifikanten Unterschieden einzubeziehen.

Meine 2. Frage: Macht es Sinn, das Modell schrittweise zu rechnen. Also PräPost als 1.Block und alle Kontrolldummies als 2.Block einzufügen und das korr. R² auf sign. Unterschied zu testen?

Meine 3. Frage: Brauche ich im Modell mit den Kontrollvariablen auch die Interaktionsterme von PräPost mit den KV-Dummies? Oder sind diese bzgl. der (globalen) Wirkungsmessung Prä vs. Post irrelevant (was ich vermute). Damit verbunden auch die Frage: Wenn ich die Wirksamkeit der Intervention für die verschiedenen Gruppen, die sich aus den Kontrolldummies ergeben, berechnen möchte, dann brauche ich ja wohl ein Modell mit Interaktionstermen. Kann ich da ein einzelnes Modell mit allen KV-Dummies und Interaktionstermen berechnen oder sollte ich eher für jede KV-Dummy ein eigenes Modell rechnen, etwa 1. Y = a + b1*PräPost + b2*Mann + b3*Mann*PräPost, 2. Y = a + b1*PräPost + b2*Kleinunternehmen + b3*Kleinunternehmen*PräPost usw.

Vielen Dank für eure Hilfe und LG

PonderStibbons · von **PonderStibbons** » Mi 20. Jul 2016, 15:15

Mein Hauptinteresse liegt in der Wirkungsmessung (Kausalität) einer Intervention. Leider habe ich nur eine Messung des Outcome (Y bzw. AV kontinuierlich) VOR der Intervention und eine Messung NACH der Intervention zur Verfügung. Dennoch scheint mir das Design ausreichend, da externe Einflüsse auf Y zwischen den Messzeitpunkten sehr unwahrscheinlich sind.

Wie sieht das konkret aus, worum geht es inhaltlich, wie lautet die Fragestellung,
wie war das Vorgehen bei der Datengewinnung, was wurde gemessen und auf was
für Skalen, und vor allem: wie groß ist die Stichprobe?

Es sind zwar großteils die selben Subjekte in den beiden Stichproben, aber eben nicht vollkommen gleich und v.a. sind die Werte nicht zuordenbar.

Wenn Du eine Mischung aus abhängigen und unabhängigen Beobachtungen hast und
die abhängigen nicht zuordenbar sind, kannst Du eigentlich keinen Signifikanztest
rechnen.

Mit freundlichen Grüßen

PonderStibbons

castor1 · von **castor1** » Mi 20. Jul 2016, 15:26

Wie sieht das konkret aus, worum geht es inhaltlich, wie lautet die Fragestellung,

4000 Menschen aus der Zielgruppe wurden bzgl. ihrer Einstellungen ggü. einem Thema befragt. Danach gab es eine Reihe an Interventionen (Workshops, Info-Veranstaltungen etc.). Nach diesen Interventionen wurden wieder 4000 Menschen aus der Zielgruppe bzgl. ihrer Einstellungen befragt. Die Frage lautet nun: Haben die Interventionen die Einstellungen verändert. Einstellungen gemessen anhand einer Skala bestehend aus drei Items mit je 7 Stufen.

Die demografischen Variablen sind nominalskaliert (z.B. Geschlecht) bzw. ordinalskaliert (z.B. Kleinunternehmen, Mittleres U, Großunternehmen).

LG Castor

PonderStibbons · von **PonderStibbons** » Mi 20. Jul 2016, 16:21

Generell, man sollte keine "nichtsignifikanten" Kontrollvariablen aus der Analyse
werfen, weil das Modell diese bei der Berechnung der Standardfehler dann nicht
berücksichtigen kann. Ob man schrittweise rechnet, hängt davon ab, ob einen
die Informationen aus den einzelnen Schritten interessieren. Ob Interaktionen
zwischen Kontrollvariablen und dem Zeit-Faktor rein sollten ins Modell kann
ich nicht beurteilen, Wesen und Funktion dieser Kontrollvariablen sind mir
nicht ausreichend klar.

Wie gesagt, sind Signifikanztests bei alledem allerdings hinfällig, weil es
eine Mischunng abhängiger und unabhängiger Beobachtungen ist. Zumindest
habe ich nie gesehen, dass man (teilweise) abhängige Messungen wie
unabhängige betrachten darf. Andererseits passiert dieser Fehler,
Messwiederholungen nicht zuordnen zu können, überraschend häufig,
vielleicht hat das schonmal jemand in eime Artikel diskutiert.

Mit freundlichen Grüßen

PonderStibbons

castor1 · von **castor1** » Mi 20. Jul 2016, 17:01

Generell, man sollte keine "nichtsignifikanten" Kontrollvariablen aus der Analyse
werfen, weil das Modell diese bei der Berechnung der Standardfehler dann nicht
berücksichtigen kann.

Ich bin mir nicht sicher, ob ich das richtig verstehe: Ich habe in einem ersten Schritt die beiden Stichproben bzgl. versch. Anteilswerte verglichen (deskriptiv). Bspw. sind in der Vorhermessung 63% Männer, in der Nachhermessung 62% Männer. Ein t-Test sagt mir nun, dass dieser Unterschied nicht signifikant ist - der Unterschied in den Stichproben also vermutlich zufällig zustande kam. Soll ich nun diese Kontrollvariable "Geschlecht" dennoch in ein Regressionsmodell aufnehmen, in dem ich den Mittelwertunterschied in der AV zwischen Vorher- und Nachhermessung berechnen möchte? Es geht also nicht um die Signifikanz der KV im Regressionsmodell.

Ob man schrittweise rechnet, hängt davon ab, ob einen
die Informationen aus den einzelnen Schritten interessieren.

Gut. Dann formuliere ich meine Frag anders: sollten mich diese Informationen interessieren, wenn ich am kausalen Effekt der Intervention (also PräPost Dummy) interessiert bin? Eine Antwort der wenn-dann Art wäre hier hilfreicher. Ansonsten bringt mich diese Antwort leider nicht weiter.

Ob Interaktionen
zwischen Kontrollvariablen und dem Zeit-Faktor rein sollten ins Modell kann
ich nicht beurteilen, Wesen und Funktion dieser Kontrollvariablen sind mir
nicht ausreichend klar.

Die KVs sind dazu da, die beiden Stichproben "cetersis paribus" zu gestalten, abgesehen vom Zeitfaktor.

Meine Bitte an alle: kann mir diesbezüglich jemand mit inhaltlich ergiebigeren Antworten helfen?

STATISTIK-FORUM.de

Prä-Post Design mit Dummy-Kontrollvariablen

Prä-Post Design mit Dummy-Kontrollvariablen

Re: Prä-Post Design mit Dummy-Kontrollvariablen

Re: Prä-Post Design mit Dummy-Kontrollvariablen

Re: Prä-Post Design mit Dummy-Kontrollvariablen

Re: Prä-Post Design mit Dummy-Kontrollvariablen

Wer ist online?