von Holgonaut » So 31. Jan 2016, 00:25
Hi,
ein sign. Chi-Quadrat-Wert sagt, dass entweder die Daten den Annahmen nicht entsprechen (Multinormalverteilung und kontinuierliche Skalen) oder Fehler in der Struktur
des Modells vorliegen, und diese groß genug /systematisch sind, dass dies nicht durch den Stichprobenfehler erklärt werden können.
Die Stichprobengröße alleine verursacht keinen misfit / sign. Chi-Quadrat-Test! Wie bei jedem anderen statistischen Test steigt mit dem N die power, vorhandene Abweichungen von der H0 (seihen sie groß oder klein) zu entdecken. Man erhält mit steigendem N quasi einen klareren - und nicht von Stichprobenschwankungen vernebelten Blick auf das Modell.
Nun sollte man aber die Tatsache, dass die o.g.Annahmen ja quasi nie richtig vorliegen, nicht als Standard-Ausrede benutzen, um den misfit wegzuerklären. Genauso sollte man nicht in die Falle des "conversion errors" tappen und aus der Tatsache, dass bei großem N triviale Fehler des Modells zu einem misfit führen umdrehen und einen misfit bei großem N durch triviale Fehler begründen. Die können trivial sein, müssen es aber nicht.
Die sinnvolle Reaktion ist, die Implikationen des Modells zu kennen (lern was über d-separation, Pfadregeln und implizite vs. empirische Korrelationen) und untersuche dedektivisch, wo und ob eine Misspezifikation liegen können. Schau dir die lokalen Problem an (werden bestimmte Korrelationen nicht erklärt?) und versuch theoriebasiert
zu überlegen, wodurch das Problem verursacht sein könnte.
Ich geb mal ein Beispiel. Angenommen du hast ein simples Mediatormodell (X --> M --> Y).
Dieses Modell fittet nicht. Erste Frage: Was ist der Grund für den Misfit -d.h. welche zentrale Annahme an die Daten macht dieses Modell?
Zweite Frage: Welche Erklärungen gibt es für diese Verletzung dieser zentralen Annahme? (Antwort gibts unten - aber überleg selbst.
Grüße
Holger
-------------------
Annahme: DIe Korrelation zwischen X und Y ist 0 gegeben M (d.h. wenn man aus der Korrelation von X und Y M auspartialisiert, verschwindet sie). Der misfit liegt daran, dass diese Annahme verletzt ist (d.h. die bedingte Korrelation oben ist nicht 0).
Erklärungen dafür:
a) Es gibt einen direkten Effekt von X auf Y
b) Es gibt einen reziproken Effekt von Y auf X
c) Es gibt eine ausgeschlossene Drittvariable, die X und Y beeinflusst
d) die Fehlerkorrelation zwischen M und Y (Cov_M,Y) ist nicht 0 (was dieses Modell impliziert) - Erklärungen dafür wiederum: d1) Y beeinflusst M, d2) eine ausgschlossene Variable beeinflusst Y und M