Korrelation zwischen endogenen Variablen in Experiment

Korrelation zwischen endogenen Variablen in Experiment

Beitragvon abruegger » Mo 10. Dez 2012, 18:52

Guten Tag,

Eigentlich müsste es auf diese Frage bereits eine Antwort geben, aber ich habe trotz langem Recherchieren keine Antwort gefunden. Ich erlaube mir deshalb, meine Fragen hier zu posten:

Ich habe ein Strukturgleichungsmodell von einer experimentellen Studie mit mehreren Mediatoren und mehreren abhängigen Variablen. Wie ich aus anderen Studien weiss, sind diese abhängigen Variablen oft korreliert. Aus diesem Grund frage ich mich, ob ich dies nicht auch im Modell berücksichtigen sollte. Nun meine Frage:
1. Ist es sinnvoll, endogene Variablen in einer experimentellen Studie korrelieren zu lassen?
2. Falls ja, ist es in Ordnung, die Korrelation durch Kovarianzen zwischen den Residuen zu berücksichtigen?
3. Falls nein, welche Alternative gibt es?
4. Wäre es sinnvoller, für jede AV ein separates Modell zu rechnen?

Ich würde mich sehr über Tipps freuen.


Herzliche Grüsse,

Adrian
abruegger
Einmal-Poster
Einmal-Poster
 
Beiträge: 1
Registriert: Mo 10. Dez 2012, 18:37
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Korrelation zwischen endogenen Variablen in Experiment

Beitragvon Holgonaut » Mi 12. Dez 2012, 14:08

Hi Adrian,

Korraltionen /Kovarianzen zwischen endogenen Variablen sind keine schätzbaren parameter in einem SEM, da diese eine Implikation des Modells - d.h.
der Varianzen der exogenen Variablen und deren Effekte sind. Kovarianzen der Fehlerterme (nicht "Residuen") dagegen schon.

Wenn du sie auf null fixierst, impliziert dies Deine Annahmen, dass die exogenen Variablen im Modell die einzige gemeinsame Ursache der beiden endogenen
Variablen sind - d.h. m.E. meist unsinnig und unnötig. Daher sollte man die Kovarianzen schätzen.

Modelle fitten oft nicht, weil die Leute Restriktionen einbauen, derer sie sich nicht bewusst sind.

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

folgende User möchten sich bei Holgonaut bedanken:
abruegger

Re: Korrelation zwischen endogenen Variablen in Experiment

Beitragvon tztztz » Mo 7. Jan 2013, 20:37

Lieber Hoger,

die gleiche Frage wie von Adrian brennt mir auch schon länger auf den Lippen. Aus deiner Antwort bin ich aber leider nicht ganz schlau geworden, deshalb noch einmal hier die Frage ganz konkret:

Kann ich die Kovarianzen der Fehlerterme sinnvoll berechnen und interpretieren?

Wenn ich weiß, dass die Variablen als unabhängige behandelt große Korrelationen aufweisen, würde mir dann eine Korrelation ihrer Fehlerterme die gleiche Information ausgeben oder ist dieses vorgehen unzulässig?

Herzlichen Dank für deine Antwort!
tztztz
User
User
 
Beiträge: 39
Registriert: Sa 4. Jun 2011, 19:38
Danke gegeben: 1
Danke bekommen: 1 mal in 1 Post

Re: Korrelation zwischen endogenen Variablen in Experiment

Beitragvon Holgonaut » Mo 7. Jan 2013, 21:36

Hi tztztz,

Kann ich die Kovarianzen der Fehlerterme sinnvoll berechnen und interpretieren?


Was heißt berechnen? Du teilst dem Programm mit, dass sie geschätzt werden sollen. Die Interpretation ist schlecht möglich. Eine sign. Fehlerkovarianz
teilt dir lediglich mit, dass beide nach statistischer Kontrolle der exogenen Variablen, immer noch kovariieren - bzw. dass die exogenen Variablen nur zum Teil
erklären, warum beide endogene Variable kovarrieren.

Wenn ich weiß, dass die Variablen als unabhängige behandelt große Korrelationen aufweisen, würde mir dann eine Korrelation ihrer Fehlerterme die gleiche Information ausgeben oder ist dieses vorgehen unzulässig?


Das versteh ich nicht. Unabhängige/exogene Variablen haben keine Fehlerterme. Um noch mal klarzumachen, worum es geht: Stell dir ein Modell vor mit zwei exogenen
Variablen X1 und X2 und zwei endogenen Y1 und Y2. Beide exogene haben Effekte auf beide endogene. Wie du siehst, teilen Y1 und Y2 Ursachen (common causes). Diese gemeinsamen
Ursachen führen dazu, dass Y1 und Y2 korrelieren - genau wie ein Faktor, der Effekte auf zwei items im Fragebogen hatte, zur Korrelation dieser beiden items führt.

Wenn X1 und X2 die einzigen gemeinsamen Ursachen von Y1 und Y2 sind, erklären sie somit auch 100% der Kovarianz beide Variablen. Gibt es weitere gemeinsame Ursachen (z.B. X3), die aber im Modell ja nicht drin sind, oder wirken Y1 und Y2 auf sich selbst, dann können X1 und X2 eben nicht die gesamte Kovarianz erklären (es gibt also weitere Mechanismen, die zu einer Kovarianz von Y1 und Y2 beitragen. Lässt du die Fehlertermvarianzen unkorreliert, fittet das Modell nicht.

Die Frage ist also: Hast du die Annahme, dass X1/X2 die einzigen Ursachen sind und Y1 und Y2 keine Effekte aufeinander haben? Wenn ja, lässt du die Fehlerterme nicht kovariieren, wenn nein, lässt du sie kovariieren. Ganz einfach :)

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

folgende User möchten sich bei Holgonaut bedanken:
tztztz

Re: Korrelation zwischen endogenen Variablen in Experiment

Beitragvon tztztz » Di 8. Jan 2013, 13:35

Hi Holger,

vielen Dank für die Antwort! Ich glaube ich hab mich nicht ganz korrekt ausgedrückt, bzw. die Frage nicht genügend spezifiziert.

Ich stehe vor dem Problem, dass ich Daten mit Hilfe von SEM schätzen lassen möchte. Leider ist es so dass die Analyse meiner endogenen latenten Variable, die sich aus 4 Items (eigentlich Skalen a,b,c und d) zusammensetzen sollte, keine optimalen, sprich gefitteten, Werte ergibt. Die CFA ergibt Werte die darauf hinweisen, dass das Messmodell nicht ganz passen dürfte (mit CFI = .87, RMSEA = .13). Dennoch zeigen die vier Items (a,b,c,d) aber eine hohe Korrelation untereinander (diese genügen ja auch nur ganz knapp den erwünschten Werte nicht).
Da das Messmodell nicht passt, möchte ich das Problem damit umgehen, dass ich eben kein Messmodell für diese latente Variable spezifiziere und das ganze über eine Pfadanalyse berechne. Wenn ich die 4 Items (a,b,c,d) in der Pfadanalyse nun als endogene Variablen spezifiziere, dann kann ich diese untereinander nicht mehr korrelieren (obwohl ich doch weiß, dass diese das ziemlich stark tun, auch wenn der Einfluss aller erhobenen unabhängigen also exogenen Variablen berücksichtigt wird.). Das Hauptproblem besteht also darin, dass ich weiß, dass meine exogenen Variablen einen Einfluss auf diese 4 Items (a,b,c,d) haben aber eben nicht die gesamte Varianz dieser erklären können. Vermutlich gibt es noch andere Einflussgrößen, die aber nicht erhoben wurden/werden konnten, deshalb besteht auch nach Berücksichtigung der Einflüsse von den exogenen Variablen auf die Items (a,b,c,d) ein Zusammenhang zwischen diesen Items (a,b,c,d).
Dieses Zusammenhanges bewusst, möchte ich ihn natürlich auch noch in dem Modell ausdrücken Über Korrelationen der Items (a,b,c,d) ist dies aber nicht zulässig, weshalb sich die Frage ergibt ob ich die Fehlerterme dieser Items (a,b,c,d) einfach korrelieren könnte um diesen immer noch bestehenden Zusammenhang zwischen den Items auszudrücken.

So wie ich deine Antwort interpretiert habe, müsste das also möglich sein, oder etwa nicht?

Die Frage ist also: Hast du die Annahme, dass X1/X2 die einzigen Ursachen sind und Y1 und Y2 keine Effekte aufeinander haben? Wenn ja, lässt du die Fehlerterme nicht kovariieren, wenn nein, lässt du sie kovariieren. Ganz einfach :)


Danke für deine Mühe!

LG tztztz
tztztz
User
User
 
Beiträge: 39
Registriert: Sa 4. Jun 2011, 19:38
Danke gegeben: 1
Danke bekommen: 1 mal in 1 Post

Re: Korrelation zwischen endogenen Variablen in Experiment

Beitragvon Holgonaut » Di 8. Jan 2013, 16:18

Hi,

Ich stehe vor dem Problem, dass ich Daten mit Hilfe von SEM schätzen lassen möchte. Leider ist es so dass die Analyse meiner endogenen latenten Variable, die sich aus 4 Items (eigentlich Skalen a,b,c und d) zusammensetzen sollte, keine optimalen, sprich gefitteten, Werte ergibt.


Vielleicht liegt hier schon der gedankliche Fehler: Eine latente Variable setzt sich nicht aus Indikatoren zusammen, sondern liegt ihnen kausal zugrunde. Dass das Modell nicht fittet, zeigt, dass diese
Vorstellung falsch ist. Somit solltest du das Modell verbessern, stattdessen auf die Pfadanalyse auszuweichen und den misfit so unter den Teppich zu kehren. Dass diese Indikatoren selbst
gar keine Indikatoren sondern, bereits Skalen sind, macht das noch schlimmer. Du hast sicher eine Vielzahl unterschiedlicher latenter Variable, die sich in diesem Wirrwarr tummeln. Ich finde es schon lohnenswert, das
zu verbessern.

Eine Korrelation der vier Skalen ist zu unspezifisch für das latente Variablenmodell, da mehrere alternative Spezifikationen Korrelationen erzeugen.

Wenn ich die 4 Items (a,b,c,d) in der Pfadanalyse nun als endogene Variablen spezifiziere


Du benutzt sie einzeln? Oben bist du noch davon ausgegangen, dass die vier Skalen Indikatoren einer latenten Variable sind - nun springst du zum Gegenteil, nämlich, dass sie jede für sich eine einzelne latente Variable sind....ein ziemlich radikaler Sprung. Aber wegen mir....wenn das Sinn macht...

Der Rest des Problems ist exakt das, was ich über die Sinnhaftigkeit der Korrelation von Fehlertermen geschrieben hab.

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Re: Korrelation zwischen endogenen Variablen in Experiment

Beitragvon Phieez » Fr 18. Dez 2015, 18:33

Hallo zusammen,

endlich bin ich auf einen Thread gestoßen der mein Problem zumindest teilweise adressiert. Vielleicht kann mir ja jemand weiterhelfen.

Holgonaut hat geschrieben:Die Frage ist also: Hast du die Annahme, dass X1/X2 die einzigen Ursachen sind und Y1 und Y2 keine Effekte aufeinander haben? Wenn ja, lässt du die Fehlerterme nicht kovariieren, wenn nein, lässt du sie kovariieren. Ganz einfach :)


Meine Frage: Bedeutet die Aussage im Zitat dann nicht, dass man bei einer Mediation mit common causes nicht immer für die Kovarianzen der Fehlerterme zwischen dem Mediator und der DV kontrollieren müsste?

Ich schätze derweil ein SEM mit dem ich untersuchen will, ob die gemessene Sichtbarkeit einer Werbeanzeige einen guten Proxy für die Wahrscheinlichkeit darstellt, dass diese auch geklickt wird (Klickrate). Vereinfacht dargestellt: (Klickrate <- Sichtbarkeit, Eigenschaften des Werbeplatzes) (Sichtbarkeit <- Eigenschaften des Werbeplatzes).

Der Unterschied zwischen Kontrolle für Kovarianz und keiner Kontrolle, besteht in den Signifikanzen der Pfadkoeffizienten. Mit Kontrolle für Kovarianz sind nur noch die Pfadkoeffizienten des totalen Effekts der IVs (X1/X2) auf die DV (Y2) signifikant, jedoch nicht der Pfadkoeffizient vom Mediator (Y1) auf Y2. Die direkten und indirekten Effekte der IVs auf Y2 sind insignifikant, auf Y1 sind sie jedoch signifikant. Kontrolliere ich dagegen nicht für die Kovarianz der Fehlerterme von Y1 und Y2, ist plötzlich alles signifikant (was vorher schon signifikant war, ändert sich auch nicht im z-Wert). Ohne jetzt ins Detail gehen zu wollen, hätten beide Outcomes schon unterschiedliche Implikationen. (Notiz am Rande: ich finde übrigens eine inkonsistente Mediation, da sich das Vorzeichen mancher Pfadkoeffizienten zwischen dem direkten und indirekten Effekt unterscheidet, was auch meinen Annahmen entspricht, da die gemessene Sichtbarkeit in manchen Situationen biased ist, was der Messmethode geschuldet ist).

Weiß eventuell jemand, was die korrekte Herangehensweise wäre?
Phieez
Einmal-Poster
Einmal-Poster
 
Beiträge: 1
Registriert: Fr 18. Dez 2015, 17:09
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Korrelation zwischen endogenen Variablen in Experiment

Beitragvon Holgonaut » Sa 19. Dez 2015, 15:10

Hi,

wenn zwei endogene Variablen (entweder zwei Mediatoren, oder Mediator-outcome oder zwei outcomes) einen omitted common cause teilen, dann müssen die
Fehlerkovarianzen geschätzt werden. Voraussetzung dafür ist allerdings, dass die Prädiktoren starke Effekte haben und somit als Instrumente fungieren. Lies mal
was über Endogenität, dann wird das klar.

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts


Zurück zu Pfadanalyse, Strukturgleichungsmodelle & CFA

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 11 Gäste