Dringend: Formativ vs. reflektiv

Dringend: Formativ vs. reflektiv

Beitragvon Flavours » Sa 10. Mai 2014, 17:35

Hallo,
ich soll in der nächsten Woche die Grundlagen von Kausalanalysen vorstellen. Dabei stellt sich mir gerade folgende, sehr wichtige Frage:

Wenn ich formative und reflektive Messmodelle (egal ob für die latente exogene oder die latente endogene Variable) verwende, sollte ich PLS verwenden. AMOS und LISREL, so lese ich, können allerdings mittlerweile auch formative und reflektive Messmodelle berücksichten. Könnte mir jemand sagen, wie die kovarianzbasierte Methode das macht? Dies muss nicht sehr ausschweifend sein.

Und: Ich kann ein Konstrukt ja mit mehreren Dimensionen konzeptualisieren, wobei die Dimensionen wiederum latente Variablen sein können. Bisher habe ich es immer so gesehen, dass im Strukturmodell nur zwischen latent endogen oder exogen unterschieden wird. Aber nun frage ich mich, wie bilde ich es im Strukturmodell ab, wenn ich formative bzw. reflektive Dimensionen vorliegen habe? Geht das bei beiden Methoden also PLS vs. AMOS und LISREL?

Auch wenn jemand nicht beide Fragen beantworten kann, so würde ich mich sehr über eine Antwort auf zumindest eine Frage davon sehr freuen!

Danke
flavours
Flavours
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Sa 10. Mai 2014, 17:30
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Dringend: Formativ vs. reflektiv

Beitragvon Holgonaut » Do 15. Mai 2014, 13:18

Hi,

allem voran: PLS ist kein SEM, auch wenn das immer wieder behauptet wird. PLS modeliert KEINE latenten Variablen, und damit auch keine reflektiven Messmodelle. Es ist eher eine Art Regressionsanalyse und die Variablen sind
Arten von composites - auch wenn da Pfaddiagramme was anderes bedeuten. Es gibt mittlerweile eine Menge kritischer Literatur die dringend dazu rät, es nicht zu benutzen:

Antonakis, J., Bendahan, S., Jacquart, P., & Lalive, R. (2010). On making causal claims: A review and recommendations. The Leadership Quarterly, 21, 1086-1120.

Rouse, A. C., & Corbitt, B. (2008). There's SEM and "SEM": A critique of the use of PLS regression in information systems research. Paper presented at the Australasian Conference on Information Systems.

Dazu gab es ein ganzes Themenheft im Organizational Research Methods, 2014; Vol. 17, No. 2.


In einer mail in der mailing "organizational behavior" fasste John Antonakis die Kritikpunkte treffend zusammen:
-----------------------------------------------------------------
" I would strongly advise you to not use PLS path modeling and instead to use regular SEM or some other analytically derived method that can estimate simultaneous equations models. As we note in our paper:

1. PLS path modeling is not a SEM method; it thus cannot eliminate endogeneity bias via the instrumental variable method for models with observed or latent variables

2. PLS path modeling cannot eliminate the impact of measurement error

3. PLS path modeling cannot validate common-factor measurement models (i.e., models with latent variables)

4. It is not clear if PLS path modeling can provide valid inference for tests of coefficients

5. PLS path modeling does not necessarily have advantages of SEM in small sample size conditions

6. It is not clear if PLS path modeling can be used for exploratory modeling

Conclusion: Should you use PLS path modeling? Certainly not, particularly in cases of models having latent variables or specific endogeneity issues that require modeling procedures to eliminate the endogeneity bias. SEM has robust estimators that can be used when distributional assumptions are violated, it can model continuous, discrete, or ordered data, it has overidentification tests, it can directly estimate standard errors (or bootstrap them), it has analytical methods (Barlett-type) to correct for small sample bias in overidentification tests; in the worst case one is still better off using observed scales in the context of a 2sls (or 3sls) model, as compared to PLS parth modeling, because the former is a consistent estimator that can use the instrumental variable technique and has excellent small sample properties (as well as closed-form solutions to estimation).

Why is PLS path modeling so popular in some disciplines (e.g., MIS research?). I don't know. Here is a telling insight from Stas Kolenikov that I have parsed from a discussion on this topic on SEMNET a few years ago:

"of the big names who developed pretty much all of the mainstream methods we use routinely (Bentler, Bollen, Joreskog, Muthen, Satorra, Yuan, in an alphabetical order), nobody wrote a single line about PLS. This must tell something about how much they value the methodology."

Same goes for the econometrics literature (which I know pretty well); I have never seen PLS ever mentioned in there (except for an article in the Journal of Econometrics, published by Dijkstra, in 1983 showing that the standard PLS estimators are not a consistent estimators; although Dijkstra is currently developing a new approach in PLS--see references in our ORM article--it is still far away from the capabilities of SEM)".
-----------------------------------------------------------------


Zum Begriff "formativ": Mach Deine Vorstellung von dem entsprechenden Konstrukt expliziter. Viele Veröffentlichungen -z.B. im marketing Bereich - haben mit formativen Konstrukten ganz simple Aggregatkonstrukte gemeint, bei denen das Gesamtkonstrukt aus einzelnen Aspekten besteht. Diese Aspekte können simple gemessene items sind - woraus ein simpler Index entsteht, oder selbst latente Variablen, womit das Konstrukt ein stinknormales multidimensionales Konstrukt ist. Die Umsetzung dieser "Multi-Aspekt"-Aufassung in ein SEM war in meinen Augen schlicht eine kausale Misspezifikation, die auch dadurch bedingt ist, dass die kausalen Implikationen von SEM in den letzten Jahrzehnten immer mehr zugunsten einer vagen "Beziehungssprache" aufgeben wurden. Ein "formatives" SEM impliziert aber, dass es "kausale Indikatoren" gibt (eigentlich bereits ein sprachliches Unding), das kausale Effekte auf eine endogene Variable hat. Dies schließt bereits aus, dass diese Indikatoren TEIL dieser Variable sind, weil Ursache und Wirkung zwei verschiedene Entitäten sein müssen (eine Ursache von Y kann nicht gleichzeitig Teil von Y sein, siehe
Wilcox, J. B., Howell, R. D., & Breivik, E. (2008). Questions about formative measurement. Journal of Business Research, 61, 1219-1228.

Wenn die "Aspekte-Auffassung" hast und davon ausgehst, dass das Konstrukt ein Bündel von latenten Variablen ist und du willst dieses Bündel in ein SEM einbauen mit anderen Variablen, bist du gefordert, dir Gedanken zu machen, welche kausalen Effekte jede dieser Variablen hat. Vielleicht gibt es differentielle Effekte oder es hat gar nur eine Variable einen Effekt und die anderen mögen zwar Teil des theoretischen Konstrukts sein, aber keine kausale Rolle spielen.

Wenn du wissen willst, was ein SEM macht, google mal nach "Wrights path tracing rules". Es geht ganz grob darum, dass aus einem Muster von kausalen Effekten zwingend ein Muster aus Kovarianzen folgt. D.h., dass zwar aus Korrelationen keine Kausalität folgt, aber umgekehrt sehr wohl aus Kausaltität Korrelation folgt. Über diese Beziehung lassen sich Kausalstrukturen testen mit dem Ergebnis, dass eine Nicht-Passung (misfit) in irgendeiner Form gegen die Struktur spricht und so zu einer Re-Spezifikation führen muss. PLS (nochmal) bietet das nicht - auch deshalb weil die philosophische/ontologische Grundlage unklar ist. In SEM sind Variablen Ausdruck für tatsächlich existierende empirische Phänomene, die andere Phänomene beeinflussen. Bei Indizes/composites ist immer etwas artifizielles dabei. Natürlich kann man Indiezs auch als Variablen in ein SEM stecken, was zu den selben Unklarheiten führt.

Ich hoffe, das hilft.

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Re: Dringend: Formativ vs. reflektiv

Beitragvon Semson » Do 22. Mai 2014, 11:50

Hi,
ich habe gerade den Artikel "Improper Use of endogenous formative variables" von Cadogan und Lee gelesen und würde gerne über ein Paar Aspekte von formativen Konstrukten diskutieren. Das passt hier ganz gut zu, daher kein neuer Forenbeitrag.

So wie ich es verstanden habe, sind folgende Unterscheidungen/Fragen wichtig:

a) Handelt es sich bei der formativen Variable um eine composite Variable oder ein formatives latentes Konstrukt. Der Unterschied liegt darin, dass die composite Variable keinen Residualterm bekommt (bzw. auf 0 fixiert wird). Wenn ich ein formatives Konstrukt als composite Variable modelliere, gehe ich aber davon aus, alle theoretisch relevanten "Indikatoren" zu verwenden. Das halte ich aber nicht unbedingt für realitätsnah. Bei formativen latenten Variablen lasse ich einen Residualterm frei schätzen, aber dadurch wird dann unklar, (i) was verbirgt sich hinter dem Fehlerterm und (ii) welche Varianz hat eigentlich die formative latente Variable. Und wenn ich die Varianz nicht kenne, werden kausale Einflüsse auf weitere Variablen im Strukturmodell schwer interpretierbar.
Ich habe auch die Empfehlung gelesen, dass man aufgrund theoretischer Überlegungen die Indikator-Gewichte apriori festlegen sollte (z.B. auf Gleichheit restringieren).

b) Ist die formative Variable im Modell als exogene oder endogene Variable modelliert? Der exogene Fall ist nicht so problematisch, der endogene Fall aber schon. Ist die formative latente Variable im Strukturmodell als endogene Variable modelliert, lässt sich nicht differenzieren welcher Anteil der Varianz von den Indikatoren und was von anderen latenten Variablen kommt. Bzw. was ist eigentlich das formative Konstrukt?
Hier wird ja empfohlen, bei endogenen formativen Variablen die kausalen Pfade auf die Indikatorebene zu modellieren, anstelle der formativen Aggregatvariable. (Wobei Holgonaut ja in seinem Beitrag dagegen argumentiert, dass es sich bei formativen Konstrukten überhaupt um Aggregate handelt, sondern doch um etwas eigenes).

c) Hat das formative Konstrukt reflektive Indikatoren bzw. kausal nachfolgende Variablen (ingesamt mind. 2)? Es gibt Autoren, die dafür argumentieren, dass ein formatives Konstrukt dadurch identifiziert werden kann, dass man ihm z.B. zwei reflektive Indikatoren zuordnet. Ist das formative Konstrukt dann nicht eigentlich nur ein reflektives Konstrukt mit zwei Indikatoren, dass durch 3 manifeste Variablen vorhergesagt wird? Also eine Art MIMIC-Modell? Der ursprüngliche formative Gedanke kommt doch garnicht mehr zu tragen.

Es gibt ja sinnvolle Anwendungen von formativen Konstrukten. Aber gibt es einen best-practice-weg um sie zu modellieren?
Also, wenn ich zum Beispiel SES nehme. Das würde ich formativ modellieren und zwar mit Fehlerterm, weil ich mit Schulbildung, Einkommen und Jobstatus (oder sowas) sicher nicht alles abgedeckt habe, was den Sozio-ökonomischen Status bestimmt (z.B. Bildung der Eltern). Im Modell würde SES entweder als Kontrollvariable, oder halt als exogene latente Variable ins Modell eingebaut werden und wäre durch Pfade zu anderen latenten Konstrukten identifiziert.

Bei endogenen formativen Variablen bin ich unschlüssig. Nehmen wir mal das formative latente Konstrukt ökologisches Verhalten als Beispiel. Mülltrennungsverhalten, Verkehrsmittelwahl und Konsum von Ökoprodukten könnten die Indikatoren sein. Da würde ich wieder einen Residualterm modellieren und die Einflüsse der vorhergehenden exogenen Variablen (welche auch immer) auf die formativen Indikatoren modellieren.

Würde mich freuen, wenn jemand Lust hat ein bisschen darüber zu diskutieren.
Semson
Power-User
Power-User
 
Beiträge: 80
Registriert: Mi 27. Nov 2013, 11:22
Danke gegeben: 2
Danke bekommen: 15 mal in 15 Posts

Re: Dringend: Formativ vs. reflektiv

Beitragvon Semson » Mo 26. Mai 2014, 11:16

Nochmal in Kurzform: Gibt es überhaupt eine legitime Anwendung formativer Variablen, oder sollte man es einfach lassen?
Semson
Power-User
Power-User
 
Beiträge: 80
Registriert: Mi 27. Nov 2013, 11:22
Danke gegeben: 2
Danke bekommen: 15 mal in 15 Posts

Re: Dringend: Formativ vs. reflektiv

Beitragvon Holgonaut » Mo 26. Mai 2014, 13:27

Hallo Semson,

ich hab Dein posting schon früh gesehen, aber momentan sehr wenig Zeit um genau darauf einzugehen. Du stellst in der Tat interessante und zentrale Fragen:

a) Handelt es sich bei der formativen Variable um eine composite Variable oder ein formatives latentes Konstrukt.


Ich habe einiges an Literatur gelesen - allem vor an die special issues in Psychological methods (2007, Ausgabe 12) und Journal of Business Research (2008, 61).
Vor allem Howell, Wilcox und Breivik (in beiden special issues vertreten) weisen darauf hin, dass die Marketing Leute - allem voran Diamantopolous formative Konstrukte
immer als composites konzeptualsiert haben - während SEM-Umsetzungen, die Effekte sog. "kausaler Indikatoren" (ein misnomer!) als Ursachen des latenten Konstrukts vorsehen.
Dies lässt sich nur durch die mangelnde kausale Genauigkeit bei der Spezifikation erklären, die in den letzten Jahrzehnten im SEM-Bereich Einzug gehalten hat.

Die Implikationen eines formativen MODELLS sind aber:
a) Kausale Indiaktoren sind URSACHEN - nicht Bestandteile der latenten Variable, weil kausale Konzeptionen eine Unabhängigkeit von Ursache und Wirkungen implizeren.
Dies macht auch klar warum diese Variablen keine kausalen INDIKATOREN sind, sondern ganz normale Antezendenzen.
b) EIne latente Variable (wie jede Variable) ist eine singuläre / eindimensionale Entität und daher kann sie auch ganz normal über reflektive Indikatoren gemessen werden. Und damit wiederum ist sie
eine latente Variable wie jede andere auch.
c) Anstatt einen kausalen Effekt von kausalen INDIKATOREN (also Messungen z.B. in einem Fragebogen) zu konzeptualisieren (woraus folgt, dass Messungen zur latenten Variable führen) macht es meist
mehr Sinn, diese Indikatoren als messfehlerbehaftete Indikatoren von entsprechenden latenten Variablen zu sehen, die dann selbst die Effekte auf die latente Variable haben.

Beispiel für all diese Punkte könnte sein, dass die (latente) Bildung, das (latente) Einkommen und der (latente) berufliche Status den allgemeinen sozialen Status beeinflussen. Alle vier Variablen sind existierende Entitäten.
Der soziale Status wäre nicht einfach die Summe sondern die Folge dieser Ursachen. Er würde aber selbst und unabhängig von diesen Ursachen existieren (muss er auch, wenn er Wirkungen auf andere Variablen
haben muss).

Wie du siehst:
a) Man kann formative Variablen als simplen Index konzeptualsieren. Hier hat die Index-Variable keinen Existenzstatus, weil sie einfach aus den Facetten zusammengesetzt wurde.
b) Man kann formative Variablen als eigenständig existierende, latente Variablen sehen und postulieren, dass sie eine Folge der kausalen Antezedenzen (nicht Indikatoren) sind.

Und natürlich hast du recht, ich kann durch die Fixierung des Fehlerterms der latenten Variable die Index-Vorstellung in ein SEM übersetzen. Generell halte ich solche Modelle (d.h. mit oder ohne Fixierung) für schwierig, weil sie
zwar identifziert sein mögen (sofern man genug outcomes hat), aber deren Fehlerkovarianzen eigentlich geschätzt werden müssten, da man sonst unterstellt, dass die latente formative Variable einzige gemeinsame Ursache
der outcomes ist. Das ist ein Aspekt, den ich in der Literatur noch nie disktuiert gesehen habe...

Ich hoffe, dass ich so die wesentlichen Punkte abgedeckt habe ;)

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Re: Dringend: Formativ vs. reflektiv

Beitragvon Holsteinerin22 » Do 28. Jul 2016, 15:23

Hallo Holgonaut, Hallo Semson,

eure Beiträge sind insgesamt sehr hilfreich in diesem Thread, doch versteht man als "Anfänger" natürlich nicht alles.

Die Grundsätzliche Kritik gegen PLS kann ich in der Tat nachvollziehen, die Begründungen gegen formativer Variablen nicht ganz.

Grundsätzliches ist doch so, das formativ oder reflektiv die Faktorladungen zwischen dem Konstrukt und den Items verändern.

Ich hab auch ein Beispiel:

Informationsgehalt ist ein antecendent von "Qualität der Werbung". Dabei wird Informationsgehalt in 3 Items in Form einer 5-Likert-Skala gemessen. Die 3 Items sind:
1)Die Werbung gibt mir relevante Information
2)Die Werbung beinhaltet aktuelle Information
3)Die Werbung ist eine gute Informationsquelle
(Die Auswahl der Items ist nicht zu beachten)

Nun stellten sich folgende Fragen: Wie ist (A) die Beziehung zwischen den 3 Items und der Variable Informationsgehalt und (B) die Beziehung zwischen der Variable Informationsgehalt und dem Konstrukt Qualität der Werbung?

Grundsätzlich würde ich sagen: Steigt der Informationsgehalt, steigt auch die Qualität der Werbung----> somit wäre die Beziehung bei (B) für mich FORMATIV
Bei (A) wäre das aber nicht so einfach zu sagen: Steigen z.B, die relevanten Informationen (gemessen in Item 1) dann steigt auch der Informationsgehalt ingesamt. Somit -> Formativ. Aber: Gleichzeitig kann ausgegangen werden, das eine Verschlechterung des Informationsgehalts auf die 3 Items auswirkt. Das wäre dann Reflektiv.
Da verstehe ich einfach nicht, in welcher Form die Beziehung stehen soll?

Freue mich über Meinungen.

Lieben Gruß
Holsteinerin22
Holsteinerin22
Mitglied
Mitglied
 
Beiträge: 21
Registriert: Mi 8. Jun 2016, 14:38
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post


Zurück zu Pfadanalyse, Strukturgleichungsmodelle & CFA

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron