Strukturgleichungsmodell bei kleiner Stichprobe

Strukturgleichungsmodell bei kleiner Stichprobe

Beitragvon whereisthesunshine » Di 5. Jul 2011, 09:16

Liebe Community,
ich stehe vor folgenden Problemen:
Meine Dozentin verlangt ein Struktugleichungsmodell von mir in meiner Diplomarbeit bei einer Stichprobe von N=99, was gelinde gesagt schon von vornherein gar nicht gut ist... da SEM für große Stichprobe geeignet sind... aber gut.

Meine Annahmen lauten wie folgt:
Partizipation --> Affektives Commitment (AC)
Kommunikationsqualität --> AC
Qualität der Austauschbeziehung zwischen MA und FK --> AC

Darüber hinaus soll ein weiteres Modell (mit Kommunikationsqualität als Mediator des Zusammenhang von Partizipation und AC) geprüft werden.

Der Fragebogen zu AC hat 15 Items, zu Kommunikationsqualität 8, zu Partizipation 4 und zur Austauschqualität 7. Dies sind sehr viele freie Parameter für eine derart kleine Stichprobe.

Ich habe mich dann dazu entschlossen auf die Methode des Item Parceling zurückzugreifen und Indikatoren zusammenzufassen. Hier tauchte dann mein erstes Problem auf. Welche Faktorenanalyse rechen? Da ich den Konstrukten Eindimensionalität unterstellt habe resultierten meiner Ansicht nach konfirmatorischen Faktorenanalysen mit einem Faktor. Dies berechnete ich in AMOS. Es ist anzumerken, dass ich 3 Itemmissings hatte. In unserer Statistikvorlesung habe ich gelernt, dass AMOS Missing mit Hilfe der FIML schätzt und folglich habe ich ein Häkchen bei Analysis Properties-> Estimates->Estimate Means and Intercepts gesetzt. Leider kann Amos dann weder den Mardia Test noch multivariate Ausreißer anzeigen-oder liegt hier schon mein Fehler?

Dann habe ich die standardisierten Regressionsgewichte (als Faktorladungen interpretiert) betrachtet und analog des Vorgehens von Little et al. (2002) die Parcels gebildet. Somit habe ich weder auf multivariate Normalverteilung überprüft (Bootstrap war auch nicht möglich) noch multivariate Ausreißer kontrolliert. Hier kommt meine Frage: Ist es legitim aufgrund der Ausgangsanzahl an Items für Partzipation zwei Parcels, für die Austauschqualität drei Parcels, für Kommunikation und Commitment vier Parcels zu bilden? Ist die FA das richtige Instrument um die Faktorladungen zu bestimmen (dies ist das einzige Ziel dieses Schritts)?

Wenn ich so vorgehe, dann ergibt sich ein sehr guter ModellFit meines Gesamtmodells. Leider wird jedoch kein Regressionsgewicht signifikant und hinzu kommt, dass zwischen Kommunikation und Commitment ein negativer Zusammenhang angezeigt wird.... hier bin ich für alle Ideen offen, die dies erklären könnten...


Ich möchte bemerken, dass ich diesen Beitrag bereits in einem weiteren Forum gepostet habe, dort freundlicherweise auf dieses Forum verwiesen hat. Also hoffe ich hier auf Hilfe...

Ich danke jedem einzelnen User im Voraus, der sich die Zeit nimmt und eventuell eine Anmerkung/Idee hat!!! Ich bin schlicht verzweifelt...
whereisthesunshine
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Di 5. Jul 2011, 09:13
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Strukturgleichungsmodell bei kleiner Stichprobe

Beitragvon whereisthesunshine » Di 5. Jul 2011, 09:17

whereisthesunshine
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Di 5. Jul 2011, 09:13
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Strukturgleichungsmodell bei kleiner Stichprobe

Beitragvon STATWORX » Mi 6. Jul 2011, 20:22

1. Also, wenn Du 3 Missing Values hast, dann entferne diese Beobachtungen aus dem Datensatz sodass Du einen vollständigen Datensatz hast. Ob Du das Modell jetzt mit 99 oder 96 Obs rechnest macht m.E. keinen Unterschied.
2. Tipp: Schau Dir doch mal ein PLS-Pfadmodell an. Das ist ein (immer wichtiger werdender) alternativer Ansatz zur Modellierung von SGM, der nur sehr wenige Anforderungen an die Daten stellt. Insbesondere ist es für kleine Stichprobengrößen geeignet. Das könnte in Deinem Fall durchaus eine Option sein. Die Schätzung erfolgt über einen iterativen Algorithmus, t-Werte werden über Bootstrap ermittelt. Die Software (SmartPLS) ist (im Gegensatz zu AMOS) ausgereift und sehr benutzerfreundlich.

Überblick: http://www.ibl-unihh.de/ap21_Stand_Juni2010.pdf

VG
STATWORX
Foreninhaber
Foreninhaber
 
Beiträge: 85
Registriert: Di 14. Jun 2011, 19:45
Danke gegeben: 0
Danke bekommen: 18 mal in 18 Posts

folgende User möchten sich bei STATWORX bedanken:
whereisthesunshine

Re: Strukturgleichungsmodell bei kleiner Stichprobe

Beitragvon whereisthesunshine » Mi 6. Jul 2011, 22:02

Vielen Dank Statworx! Der Link ist super und ich werde mich heute Abend intensiv mit dem Programm und den Annahmen dieses Ansatzes auseinandersetzen-ich hab in jedem Fall schon was davon gehört!
whereisthesunshine
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Di 5. Jul 2011, 09:13
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Strukturgleichungsmodell bei kleiner Stichprobe

Beitragvon aufdemEnspurt » Mo 23. Apr 2012, 14:20

Hallo whereisthesunshine!

Ich hoffe, Du liest diese Nachrichten noch... denn: ich habe gerade genau das gleiche Problem wie Du vor knapp einem Jahr!! Leider konnte ich den Link nicht öffnen; kannst Du mir aber sagen, wie Du damals vorgegangen bist??? - Du würdest mir unglaublich helfen!

Viele dankbare Grüße!
aufdemEnspurt
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mo 23. Apr 2012, 14:17
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Strukturgleichungsmodell bei kleiner Stichprobe

Beitragvon STATWORX » Mo 23. Apr 2012, 16:21

Hallo,

google mal nach "smartpls universität hamburg". Bei mir ist es der 3. Hit bei Google. "Universität Hamburg, Eine anwendungsorientierte Einführung..."

VG
STATWORX
STATWORX
Foreninhaber
Foreninhaber
 
Beiträge: 85
Registriert: Di 14. Jun 2011, 19:45
Danke gegeben: 0
Danke bekommen: 18 mal in 18 Posts

Re: Strukturgleichungsmodell bei kleiner Stichprobe

Beitragvon Holgonaut » Di 24. Apr 2012, 09:37

Hi Leute

2. Tipp: Schau Dir doch mal ein PLS-Pfadmodell an. Das ist ein (immer wichtiger werdender) alternativer Ansatz zur Modellierung von SGM, der nur sehr wenige Anforderungen an die Daten stellt. Insbesondere ist es für kleine Stichprobengrößen geeignet. Das könnte in Deinem Fall durchaus eine Option sein. Die Schätzung erfolgt über einen iterativen Algorithmus, t-Werte werden über Bootstrap ermittelt. Die Software (SmartPLS) ist (im Gegensatz zu AMOS) ausgereift und sehr benutzerfreundlich.


Ich möchte zumindest meinen Gegenstandpunkt zur Geltung bringen. Dass PLS immer wichtiger ist, ist etwas, gegen das man mit aller Macht ankämpfen sollte. PLS ist m.E. eine cheating Methode und
auch nicht durch die angeblichen Vorteile der besseren Schätzung von Koeffizienten bei kleiner Stichprobe (die wenn das Modell falsch ist keine Bedeutung haben) gerechtfertigt ist.

PLS-Nutzer, die ich kenne, gehen dann zu PLS über, wenn SEM nicht fittet - d.h. wenn die Realtität ihnen Hinweise gibt, dass irgendwas an ihren Modellen problematisch ist.

Ich zitier einfach mal Antonakis, der das besser und profunder beschrieben hat als ich es kann:

"The PLS problem. Researchers in some fields (particularly information systems and less so in some management
subdisciplines) use what has been referred to as Partial-Least Squares (PLS) techniques to test path models or latent variable
(particularly composite) models.We discuss this modeling method briefly, because it is quite popular in other fields yet PLS has no
important advantages of regression or OLS. Because it seems to be slowly creeping into management research we feel it is
important to warn researchers to not use PLS to test their models. PLS estimates are identical to OLS in saturated models with
observed variables. Whether modeling composites in PLS or indexes/parcels in saturated regression models will not change
estimates by much (Temme, Kreis, & Hildebrandt, 2006).

The problem with PLS, however, is that it cannot test systems of equations causally (i.e., overidentifying restrictions cannot be
tested) nor can it directly estimate standard errors of estimates. Because the model's fit cannot be tested, the modeller cannot
know if model estimates are biased. Also, its apparent advantages over regression-based (OLS and 2SLS) or covariance-based
modeling (e.g., SEM) is rather exaggerated (see Hair, Black, Babin, Anderson, & Tatham, 2006; Hwang, Malhotra, Kim, Tomiuk, &
Hong, 2010; Marcoulides & Saunders, 2006; McDonald, 1996); recently it has been also shown that PLS can experience
convergence problems (Henseler, 2010). PLS users commonly repeat the mantra that “PLS is good for prediction, particularly in
early phases of theory development whereas SEM models are good for theory testing;” this comment suggests that one cannot
predict using SEM or 2SLS, which is obviously a baseless assertion.We really find it odd that those using PLS would knowingly not
want to test their model when they could use more robust tests.

In a recent simulation PLS was found to perform worse than SEM (both in conditions of correct and misspecification); also,
although a new approach, referred to as generalized structured component analysis, has been proposed as a better alternative to
PLS (because it is similar to SEM in the sense that it can test model fit), it does not provide for better estimation when the model is
correctly specified (Hwang et al., 2010). Interesting in this simulation is that the new method performed better under conditions
of model misspecification (which makes sense given that it is a limited-information estimator); however, it is unclear as to
whether this estimation approach is better than other limited-information (e.g., 2SLS) estimators (e.g., Bollen et al., 2007).
Other apparent advantages of PLS are that it makes no distributional assumptions regarding variables and does not require
large sample sizes; however, regression or two-stage least squares analysis do not make any assumptions either about
independent variables and can estimate models with small sample sizes. More importantly, there are estimators build into
programs like MPlus, LISREL, EQS, and Stata that can accommodate a large class of models, using robust estimation and various
types of variables, which might not be normally distributed or continuous (e.g., dichotomous, polytomous, ordered, counts,
composite variables, etc.). Thus, given the advances that have been made today in statistics software, there is no use for PLS
whatsoever (see in particular McDonald, 1996). We thus strongly encourage researchers to abandon it".

Antonakis, J., Bendahan, S., Jacquart, P., & Lalive, R. (2010). On making causal claims: A review and recommendations. The Leadership Quarterly, 21, 1086-1120.

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Re: Strukturgleichungsmodell bei kleiner Stichprobe

Beitragvon Holgonaut » Di 24. Apr 2012, 10:03

Hi

denn: ich habe gerade genau das gleiche Problem wie Du vor knapp einem Jahr!! Leider konnte ich den Link nicht öffnen; kannst Du mir aber sagen, wie Du damals vorgegangen bist??? - Du würdest mir unglaublich helfen!


Vielleicht kannst du ja mal schildern, was genau Dein Problem ist.

Schau dir auch mal das d-separation-Kriterium von Pearl an: http://ftp.cs.ucla.edu/pub/stat_ser/r370.pdf - Seite 17.

Das bezieht sich auf Bedingungen, die Daten erfüllen müssen, wenn die angenommene Kausalstruktur korrekt ist - was sich einfach über Partial-Korrelationen testen lässt.

Hier ist eine Video-Reihe, die glaub ich ganz nett ist:
http://www.youtube.com/watch?v=IjoWqnH6 ... ure=relmfu
http://www.youtube.com/watch?v=zJIK5uOy ... ure=relmfu
http://www.youtube.com/watch?v=aA-gTNxy ... ure=relmfu
http://www.youtube.com/watch?v=8PfJHryd ... ure=relmfu


Nachteil ist, dass die Messmodelle nicht getestet werden können, weil hier manifeste Variablen untersucht werden. Und die Korrektheit der Messmodelle ist halt nun mal das Fundament,
auf dem weitere Analysen beruhen. D.h. das würde ich in jedem Fall testen wollen, auch wenn die Annahmen nicht stimmen. Meiner Erfahrung nach liegen da oft große Probleme, die auch häufig
ein fundamentales Missverständnis des Verhältnisses zwischen Messungen und den zugehörigen hypothetischen Konstrukten implizieren (Stichwort Realismus vs. Konstruktivismus/Positivismus).

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Re: Strukturgleichungsmodell bei kleiner Stichprobe

Beitragvon aufdemEnspurt » Di 24. Apr 2012, 11:42

Hallo Holger,

vielen Dank für Deinen Einsatz!! Vielleicht kannst Du mir ja wirklich weiterhelfen, denn eigtl. würd ich auch gern mit AMOS weiterarbeiten...

Bild

-> http://www.bilder-hochladen.tv/pic/mfIZuPW6/

Mein Problem kann ich am beigefügten Bild erläutern. Es zeigt mein Basismessmodell. Daran ist evtl. schon ersichtlich, welche Probleme auftauchen (zumal ich leider kompletter Anfänger bin, mich in alles neu einarbeite)....

- hab nur eine Stichprobe von n=94, um das Modell zu testen
- wollte Teilmodelle testen; das hat auf Prädiktorenseite schon ganz gut geklappt, auf Kriterienseite bin ich (oder AMOS) mit zweiter latenter Ebene überfordert
- Wie minimiere ich meine Anzahl fehlender Parameter? (Fakotoren sind schon aggregierte Werte)
- Gibt es eine Möglichkeit an Modifikationsindizes ranzukommen, auch wenn ich mit fehlenden Werten schätze?
- aus meinem Messmodell habe ich mehrere Hypothesen abgeleitet; bspw. dass aus einer hohen Ausprägung bei F1 eine hohe Ausprägung bei F5, F7, ...Fn folgt. Ist es sinnvoll bzw. überhaupt möglich, diese Annahmen in einfachen Strukturgleichungsmodellen (ohne übergeordnete latente Variable) zu testen?

Wenn Du auf eine oder mehrere Fragen eine Antwort hast, erwartet Dich ewige Dankbarkeit :)

Viele Grüße
Melissa
aufdemEnspurt
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mo 23. Apr 2012, 14:17
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Strukturgleichungsmodell bei kleiner Stichprobe

Beitragvon Holgonaut » Mi 25. Apr 2012, 13:53

Hi,

ja, ein N=94 ist extrem gering, das ist eine Limitation.

- wollte Teilmodelle testen; das hat auf Prädiktorenseite schon ganz gut geklappt, auf Kriterienseite bin ich (oder AMOS) mit zweiter latenter Ebene überfordert


Das versteh ich nicht. Was heißt Prädiktoren- und Kriteriumsseite?


Wie minimiere ich meine Anzahl fehlender Parameter? (Fakotoren sind schon aggregierte Werte)


Auch das versteh nicht nicht - was meinst du mit Anzahl fehlender (?) Parameter? Und was meinst du mit der Klammer? Welche Faktoren? Und wie können Faktoren aggregierte Werte sein? Ein Faktor ist eine
latente Variable, die mehrere Indikatoren beeinflusst.

Gibt es eine Möglichkeit an Modifikationsindizes ranzukommen, auch wenn ich mit fehlenden Werten schätze?


Ich bin kein AMOS - Experte, daher weiß ich das nicht. Die Modifiaktionsindizes solltest du aber versuchen zu vermeiden, weil diese lediglich sagen, wie der Fit verbesserbar ist, wenn du fixierte
Parameter freischätzt. Das macht nur Sinn, wenn lediglich das Fehlen / Restringieren tatsächlich freier Parameter das zentrale Problem des Modells ist. Oder mit anderen Worten: Es wird angenommen, dass die
bestehende Struktur korrekt ist - nur, dass halt eben ein paar Effekte fehlen, die eigentlich reingehören. Das ist oft eine Fehlannahme, weil die Probleme bereits in der fehlerhaften Struktur liegen (v.a. der Messmodelle).

- aus meinem Messmodell habe ich mehrere Hypothesen abgeleitet; bspw. dass aus einer hohen Ausprägung bei F1 eine hohe Ausprägung bei F5, F7, ...Fn folgt. Ist es sinnvoll bzw. überhaupt möglich, diese Annahmen in einfachen Strukturgleichungsmodellen (ohne übergeordnete latente Variable) zu testen?


Hypothesen werden aus theoretischen Argumenten abgeleitet, nicht aus irgendwelchen Modellen. Die Hypothese(n) wird/werden dann mittels Empirie (z.B. Modelle) GETESTET. Wenn das gut läuft, ist das theoretische Argument "corroborated" (sensu Popper, also gestützt durch Evidenz), was eben gleichzeitig impliziert, dass es auch falsch sein kann, weil es das wirklich wahre Modell dummerweise dieselbe empirische Situation erzeugen würde.

Was du mit "übergeordnete latente Variable" meinst, weiß ich nicht.

Zu Deinem Modell: Du hast second - order - Faktoren, auf denen jeweils 3 Primärfaktoren laden. Damit ist jeder second-order-Faktor gerade identifiziert, was bedeutet, dass du ihn nicht testen kannst. Du könntest quasi jedwelche 3 korrelierenden Faktoren nehmen, darauf einen second-order-Faktor setzen (der dann natürlich nonsens ist, weil es ihn nicht gibt), aber du erhälst keine Möglichkeit, dass zu erkennen). D.h. du brauchst starke theoretische Argumente, dass den jeweils 3 Faktoren eine sinnvolle gemeinsame Ursache zugrundeliegt - und diese gemeinsame Ursache auch die "Brücke" der 3 Faktoren zu allen anderen Variablen im Modell ist. Beispiel

F1 <-\
F2 <-- SOF1 --> Y
F3 <-/

Dieses Modell sagt, dass die Kovarianz der 3 F's vollständig durch SOF1 beding/erklärt wird UND
dass die Kovarianzen zwischen jedem einzelnem F-Faktor und Y über SOF1 läuft/mediiert wird und sich zudem aus dem Produkt von Ladung von F# auf SOF1 mal dem Effekt von SOF1 auf Y zusammensetzt.

Denk mal darüber nach, ob du das für jede Deiner Variablen so bejahen kannst. Ein Missfit Deines Model impliziert, dass eine oder mehrerer dieser Annahmen falsch ist.

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Nächste

Zurück zu Pfadanalyse, Strukturgleichungsmodelle & CFA

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 6 Gäste

cron