Voraussetzungen Regression+Mediationsanalyse nach Hayes

Alle Verfahren der Regressionanalyse.

Voraussetzungen Regression+Mediationsanalyse nach Hayes

Beitragvon Timmytime » Do 11. Okt 2012, 18:39

Hallo zusammen,

ich habe eine Frage zu einer statistischen Auswertung und hoffe ihr könnt mir ein paar Tipps geben.

-> Die Ausgangsituation: Ich habe 1 UV (mit 2 Bedingungen), 1 AV und 1 Mediator. Für die Effekte der UV auf die AV mache ich einen normalen t-Test für unabhängige Stichproben und eine ANOVA damit ich das partielles Eta-Quadrat für die Effektstärken erhalte. Im Rahmen dieser Analyse prüfe ich statistisch die Voraussetzungen des t-Tests für unabhängige Stichproben: Levene-Test für Varianzhomogenität (Ergebnis: alles in Ordnung) und Normalverteilungsprüfung (Kolmogorov-Smirnov-Test sign., nach Betrachtung der Normalverteilungsplots sowie Kennwerten von Schiefe und Kurtosis aber approximativ normalverteilt).

->Im zweiten Hypothesenteil möchte ich den Mediator überprüfen. Im Rahmen dessen rechne ich folgendes:
-> 1. bivariate Regression UV (Prädiktor) -> AV (sign.)
-> 2. bivariate Regression UV (Prädiktor) -> Mediator (sign.)
-> 3. multivariate Regression mit UV und Mediator als Prädiktoren auf -> AV (Ergebnis: Mediator sign., UV auf AV nicht mehr sign.; d.h. vollständige Mediation)
=> 4. Zur Prüfung auf Signifikanz des Mediators: Mediatoranalyse nach Hayes mittels bootstrap

-> Zur eigentlichen Frage: Welche Voraussetzungen muss ich für den zweiten Hypothesenteil (die Regressionen + Mediatoranalyse nach Hayes) prüfen? Bei der Regression muss ich ja auch Varianzhomogenität und Normalverteilung prüfen. Prinzipiell habe ich das für die AV ja schon vor dem T-Test gemacht. ABER: Soweit ich das verstanden habe, muss ich bei der Regression Varianzhomogenität und Normalverteilung der RESIDUEN überprüfen und NICHT wie beim T-Test Normalverteilung und Varianzhomogenität der Variablen, richtig? Oder muss ich beides prüfen? d.h. Varianzhomogenität und Normalverteilung sowohl der Variablen selbst als auch der Residuen?

Und: Muss ich darüber hinaus noch etwas statistisch prüfen?
-> Linearere Zusammenhang sollte mittels theoretischer Überlegung gegeben sein, richtig?
-> Statistische Unabhängigkeit: Durbin-Watson-Statistik: Ich habe gelesen dass man das nur machen soll bei Längsschnittsstudien (was meine Studie nicht ist). Wenn stat. Unabhängigkeit durch Versuchsanordnung gegeben ist, kann ich das also weglassen, richtig?
-> Außerdem: bei -> 3. der Mediatoranalyse (UV + Mediator auf -> AV) habe ich ja 2 Prädiktoren, also prinzipiell eine multiple lineare Regression. Für die gelten ja noch weitere Annahmen die zu prüfen wären, wie keine Multikollinearität. Muss ich das in diesem Fall noch machen? Ich überprüfe doch mit der bivariaten UV->Mediator Regression schon den Zusammenhang.
-> Für die stat. Prüfung auf Signifikanz des Mediators mit Hayes muss ich nichts prüfen, da ja alles dann schon im Vorfeld der Regression geprüft wäre und bootstrap ja unempfindlich ist gegenüber Verletzungen ist, richtig?

Viele Grüße
Timmytime
Mitglied
Mitglied
 
Beiträge: 20
Registriert: Mo 8. Okt 2012, 01:01
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Voraussetzungen Regression+Mediationsanalyse nach Hayes

Beitragvon Timmytime » Sa 13. Okt 2012, 21:04

Hm, niemand? :( Jede Teilantwort wäre auch schon hilfreich.
Timmytime
Mitglied
Mitglied
 
Beiträge: 20
Registriert: Mo 8. Okt 2012, 01:01
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Voraussetzungen Regression+Mediationsanalyse nach Hayes

Beitragvon daniel » So 14. Okt 2012, 11:01

Soweit ich das verstanden habe, muss ich bei der Regression Varianzhomogenität und Normalverteilung der RESIDUEN überprüfen

Das hast Du richtig verstanden. Die Normalverteilungsannahme ist dabei, je nach Fallzahl, allerdings nicht zentral.

Linearere Zusammenhang sollte mittels theoretischer Überlegung gegeben sein, richtig?

Das kann man auch gerne noch empirisch testen. Dazu gab es schon einige threads. Schau mal unter "Annahmen Regression" oder so. Da wirst Du sicher fündig.

Statistische Unabhängigkeit:

Genauer: kein AR Prozess der residuen. Bei Querschnitten tritt das nicht auf, es sei denn die Stichprobe ist geclustert. In diesemn Fall sollte man sich m.E. den Test gleich schenken, und robuste Standradfehler berechnen, die die Klumpung berücksichtigen.

keine Multikollinearität

Die beiden variablen, die als Prädikatoren verwendest sind (hoch) korreliert. Das siehst Du bereits daran, dass sie bivariat mit dem outcome korrelieren, diese Korrelation aber nur für den Mediator bestehen bleibt. Ich denke keine Multikollinearität ist keine Annahme, sondern eine Vorraussetzung. Wenn Du Schätzer bekomst, und die Standradfehler nicht astronomisch hoch sind, hast Du in diesem Fall kein Problem.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

folgende User möchten sich bei daniel bedanken:
Timmytime

Re: Voraussetzungen Regression+Mediationsanalyse nach Hayes

Beitragvon Timmytime » So 14. Okt 2012, 17:07

Hallo Daniel,

danke für deine Antwort! noch zu 2 Sachen die du geschrieben hast:

Du hast gesagt, dass es richtig ist Varianzhomogenität und Normalverteilung der Residuen zu prüfen. Muss ich denn zusätzlich noch Normalverteilung + Varianzhomogenität der Variablen selbst in den Grundgesamtheiten prüfen, so wie ich es beim t-Test machen muss? Ich finde dazu unterschiedliche Angaben in verschiedenen Büchern, die sich teilweise vermischen und mich sehr verwirren. Ich habe das so verstanden:
-> Varianzhomogenität bei der Variablen: Levene-Test
-> Varianzhomogenität der Residuen: Streudiagramm Residualwerte gegen Vorhersagewerte (kein stat. Test vorhanden)
-> Normalverteilung bei der Variablen: Kolmogorov-Smirnov-Test + grafisch Histogramm (x-Achse die Variable, y-Achse Häufigkeit) und P-P-Diagramm der Variablen
-> Normalverteilung bei den Residuen: grafisch Histogramm (x-Achse Regression standardisiertes Residuum, y-Achse Häufigkeit) und P-P-Diagramm von standardisiertes Residuum (kein stat. Test vorhanden?)
Trotzdem steht in einigen Büchern z.B. bei der Regression dass man den K-S-Test verwenden kann. Aber: Der K-S-Test testet doch auf Normalverteilung der Variablen, nicht auf Normalverteilung der Residuen, das sind doch 2 verschiedene paar Schuhe? Oder muss ich bei der Voraussetzungeprüfung der Regression zusätzlich erst Normalverteilung + Varianzhomogenität der Variablen prüfen, und dann Normalverteilung + Varianzhomogenotät der Residuen?

-> Und wichtig noch: Ich habe eine UV mit 2 Bedingungen (Vergleichsgruppen): Bei Normalverteilungsprüfung und Varianzhomogenitätsprüfung vorm t-Test habe ich für die Bedingungen getrennt diese Voraussetzungen geprüft. Muss ich bei der Residualanalyse der Normalverteilung und Varianzhomogenität auch für die Bedingungen getrennt analysieren?

-> die Multikollinearität als Voraussetzungsprüfung kann ich mir dann also in diesem Fall schenken (bzw. muss ich gar nicht anführen im Ergebnisteil), da bei einer Mediation die Prädiktoren ohnehin korreliert sind?

Danke schonmal für deine Mühen.
Timmytime
Mitglied
Mitglied
 
Beiträge: 20
Registriert: Mo 8. Okt 2012, 01:01
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Voraussetzungen Regression+Mediationsanalyse nach Hayes

Beitragvon daniel » So 14. Okt 2012, 20:09

Muss ich denn zusätzlich noch Normalverteilung + Varianzhomogenität der Variablen selbst in den Grundgesamtheiten prüfen, so wie ich es beim t-Test machen muss?

Nein. Keines ist eine Vorraussetzung/Annahme der linearen Regression.
-> Varianzhomogenität der Residuen: Streudiagramm Residualwerte gegen Vorhersagewerte (kein stat. Test vorhanden)
[...]
-> Normalverteilung bei den Residuen: grafisch Histogramm (x-Achse Regression standardisiertes Residuum, y-Achse Häufigkeit) und P-P-Diagramm von standardisiertes Residuum (kein stat. Test vorhanden?)
[...]
Trotzdem steht in einigen Büchern z.B. bei der Regression dass man den K-S-Test verwenden kann. Aber: Der K-S-Test testet doch auf Normalverteilung der Variablen, nicht auf Normalverteilung der Residuen, das sind doch 2 verschiedene paar Schuhe? Oder muss ich bei der Voraussetzungeprüfung der Regression zusätzlich erst Normalverteilung + Varianzhomogenität der Variablen prüfen, und dann Normalverteilung + Varianzhomogenotät der Residuen?

Das ist die gleiche Frage, wie die erste. Daher ist die Antwort die gleiche. Residuen lassen sich mit Statisitksoftware in Variablen speichern. Diese Variablen kann man dann testen auf was auch immer man will.

-> Und wichtig noch: Ich habe eine UV mit 2 Bedingungen (Vergleichsgruppen): Bei Normalverteilungsprüfung und Varianzhomogenitätsprüfung vorm t-Test habe ich für die Bedingungen getrennt diese Voraussetzungen geprüft. Muss ich bei der Residualanalyse der Normalverteilung und Varianzhomogenität auch für die Bedingungen getrennt analysieren?

Du testest die Residuen der einen Regression, die Du geschätzt hast.

-> die Multikollinearität als Voraussetzungsprüfung kann ich mir dann also in diesem Fall schenken (bzw. muss ich gar nicht anführen im Ergebnisteil), da bei einer Mediation die Prädiktoren ohnehin korreliert sind?

Das solltest Du mit den Reviewern/Betreuern absprechen. Ich finde das überflüssig, aber ich bewerte die Arbeit nicht.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

folgende User möchten sich bei daniel bedanken:
Timmytime

Re: Voraussetzungen Regression+Mediationsanalyse nach Hayes

Beitragvon Timmytime » So 14. Okt 2012, 21:40

Hallo Daniel,

danke soweit. Ich habe die standardisierten Residuen nun als Variablen gespeichert (meiner 3 Regressionen der Mediation, d.h. UV->AV; UV->Mediator; UV+Mediator->AV) und mit diesen den K-S-Test gemacht. Dies habe ich unter explorativer Datenanalyse gemacht und dabei als AV die standardisierten Residuen genommen. Die Faktorenliste habe ich leer gelassen, weil du gesagt hast ich prüfe bei den Residuen nicht für die Unterschiedsbedingungen getrennt, wie ich es bei der Normalverteilungsprüfung der Variablen vor dem t-Test gemacht habe, das habe ich doch richtig verstanden oder?

Das Ergebnis sieht wie folgt aus (mit Streudiagramm, beim sign. K-S zusätzlich Histogramm + P-P):
1) UV-> AV:
-> K-S-Test n.s.
-> kein auffälliges Streudiagramm (Varianzhomogenität + Linearität kann angenommen werden)
2) UV-> Mediator:
-> K-S-Test signifikant!
-> kein auffälliges Streudiagramm (Varianzhomogenität + Linearität kann angenommen werden)
-> zwar K-S-Test sign., aber Histogramm und P-P zeigen keine allzu große Abweichung
3) UV+Mediator->AV:
-> K-S-Test n.s.
-> kein auffälliges Streudiagramm (Varianzhomogenität + Linearität kann angenommen werden)

Hab ich das so richtig interpretiert (v.A. die Grafiken) oder liege ich bei was daneben? Vielen Dank nochmal!

P.S.: Kann ich bezüglich Varianzhomogenität auch den Levene-Test bei den Residuen anwenden, indem ich die standardisierten REsiduen in den t-Test für unabhängige Stichproben einfüge und dann die Vergleichsgruppen als Gruppenvariable nehme? Oder funktioniert das so nicht?
Zuletzt geändert von Timmytime am Mi 19. Jun 2013, 21:09, insgesamt 1-mal geändert.
Timmytime
Mitglied
Mitglied
 
Beiträge: 20
Registriert: Mo 8. Okt 2012, 01:01
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Voraussetzungen Regression+Mediationsanalyse nach Hayes

Beitragvon Timmytime » Di 16. Okt 2012, 19:33

Kann mir dazu vielleicht noch jemand Rückmeldung geben? Ich komme insbesondere bei der Interpretation der Varianzhomogenität der Residuen nicht weiter, keins der Beispielgrafiken der Lehrbücher sieht ähnlich aus (da sind überall im mittleren Bereich noch Werte, hier sind in zwei Fällen nur rechts und links welche) :?: Kann man da auch irgendwie mit dem Levene-Test arbeiten oder ist der in dem Kontext nicht angebracht (weil habe ich nirgends von gelesen in den Lehrbüchern bei der Regression).
Timmytime
Mitglied
Mitglied
 
Beiträge: 20
Registriert: Mo 8. Okt 2012, 01:01
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Voraussetzungen Regression+Mediationsanalyse nach Hayes

Beitragvon daniel » Mi 17. Okt 2012, 10:17

Für einen formalen Test auf Homoskedastie such mal nach Breusch–Pagan.

Sieht so aus, als arbeitest Du mit SPSS. Das ist insofern schlecht, als dass m.W. da keine heteroskedastie-robusten Standradfehler implementiert sind. Vielleicht hilft wenigstens zum testen das weiter: http://www.youtube.com/watch?v=3QcX4jqPn14
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Voraussetzungen Regression+Mediationsanalyse nach Hayes

Beitragvon Timmytime » Mi 17. Okt 2012, 10:33

Hallo Daniel,

werde ich mal nach suchen, danke. Wenn du dir die 3 Streudiagramme anguckst, liegt da deiner Einschätzung nach in einer (oder mehrerer) der Varianzheterogenität vor? Mein aktueller Stand ist, dass ich (im Gegensatz zu meinem oberen Beitrag) sage, dass unter 2) UV->Mediator ein leichter trichterförmiger Verlauf zu sehen ist, was auch Varianzheterogenität hinweist, bei den anderen beiden die Streudiagramme aber unauffällig seien. Ich bin mir aber ziemlich unsicher bei der Interpretation der Streudiagramme. Obwohl es viele Beispielgrafiken gibt, sehen die eigenen doch etwas anders aus und ein starkes Muster ist nirgends zu erkennen. Kannst du vielleicht noch deine Einschätzung dazu abgeben, das wäre echt toll!
Timmytime
Mitglied
Mitglied
 
Beiträge: 20
Registriert: Mo 8. Okt 2012, 01:01
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Voraussetzungen Regression+Mediationsanalyse nach Hayes

Beitragvon daniel » Mi 17. Okt 2012, 12:15

Bei 2) stimme ich zu, bei den anderen sieht es jetzt nicht dramatisch aus, aber man kann auch da was reininterpretieren.

Ich würde mal davon ausgehen, dass der Test die Nullhypothese der Homoskedastie ablehnt (übrigens: wie sehen denn nun eigentlich die Fallzahlen aus?). Die Frage ist dann, was tun? Ich tendiere dazu die Standardfehler von Anfang an robust zu schätzen, weil ich mir dann, gegeben ich bin von meinem Modell überzeugt, keine Gedanken um Heteroskedastie machen muss. Der Preis der Ineffizienz ist m.E. i.d.R. gering, weil ich bei Ergebnissen, die an dieser Annahme hänge ohnehin etwas vorsichtig wäre. Man kann da durchaus anderer Meinung sein. Einer meiner Dozenten (VWLer) meinte mal, er würde nie so leichtfertig die Effizienz opfern, wie das Sozialwissenschaftler i.d.R. tun. Ich denke es kommt wie immer auf die Details des Einzelfalls an, sodass eine allgemeingültige Empfehlung (wie sie sich so viele wünschen) schlicht nicht möglich ist.

Wie bereits angedeutet kommt bei Dir erschwerend die (vollkommen unverständliche und noch überflüssigere) Limitierung der Software hinzu, die keine robusten Standardfehler implementiert hat.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Nächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 12 Gäste

cron