Hi
Sehe ich das richtig: ohne Prüfung der Struktur mit Modelltest (CFA / SEM) oder echter Kreuzvalidierung (EFA und nochmal EFA an anderer Stichprobe) keine Realität?
Die Realität ist da, ob du eine CFA, EFA oder sonst was machst. Das Ziel, wenn du eine realistische Wissenschaftsauffassung (mehr unten) hast, ist, mit Deinem Modell, diese Realität
abzubilden. Eine perfekte Abb. wird es nie geben (es ist halt ein Modell), aber das Modell ist zumindest dann korrrekt spezifiziert, wenn es a) Variablen enthält, die in der Realität vorkommende
Phänomene widerspiegeln (und nichts Artifizielles) und b) die Beziehungen oder kausalen Effekte, die diese Phänomene auf andere - gemessene oder latente - Phänomene hat enthält. Zu dem
enthält ein Modell Restriktionen (z.B. auf 0 oder andere Werte fixierte Effekte), die es testbar machen.
Wie ich in meinem ersten posting hoffentlich illustrustrieren konnte, kann ein empirisches Modell (EFA oder CFA) falsch sein und dennoch an die Daten angepasst sein (extremes Beispiel war das Korrelations-Beispiel). 'Eine CFA hat zumindest den Vorteil, dass du Theorie reinsteckst und diese Theorie testest und so lernst. Eine EFA kann natürlich auch das richtige Modell treffen, aber du legst
Dein Schicksal hier halt in einen Algorithmus, der die Arbeit für dich macht. Außerdem sind die Kritierien schwammig, ab wann du eine Lösung akzeptierst.
Zum zweiten Punkt: Hmm, das möcht ich jetzt nicht wiederholen, aber eine simple Wiederholung eines Modelltests oder EFA an derselben oder einer weiteren Stichprobe stärkt Schlussfolgeurngen über die Korrektheit nicht (wieder: das Korrelations-Beispiel.
Was genau meinst Du damit?
Jetzt müssen wir etwas in tiefere Gewässer: Man kann Haltungen Gegenüber Wissenschaft und Realität in grob (sehr grob) zwei Lager unterteilen:
a) Konstruktivismus/Empirismus/Positivismus
b) (Kritischer) Realismus
"a" nimmt an, dass es unsinnig ist, nach der Realität zu forschen, da "Realität" ein soziales Konstrukt ist. Ebenso ist "Kausalität" Mumpitz - weil das was wir sehen/testen/messen können eh nur Assoziationen sind, aus denen unser Geist den Eindruck von Ursache-Wirkung herstellt. Ebenso sind Konstrukte Begriffe, die zwar irgendwo empirische Phänomene beschreiben, aber man legt sich nicht
fest, ob ein Konstrukt etwas Reales beschreibt.
"b" geht davon aus, dass es eine objektive Realität mit latenten oder beobachtbaren Phänomenen gibt, die kausale Einflüsse auf andere Phänomene haben. Es mag schwierig oder sogar unmöglich sein, diese durch Wissenschaft zu entdecken, aber prinzipiell ist dies durch Versuch und Irrtum machbar.
Die a-Haltung war /ist sehr vertreten in der Psychologie und oft unbewusst. Z.B. war Pearson ein extremer Gegner realistischer Haltungen (deshalb wurde sein Korrelationskoeffizient so berühmt, weil er lediglich Zusammenhänge beschreibt und den den verhassten Kausalitätsbegriff vermeiden hilft. Dieser Fokus auf Korrelationen (wir haben hier sogar eine eigene Kategorie dafür
) ist tief eingebrannt). Konstrukte sind meist ontologisch (d.h. was ihre existentielle Seite anbelangt) unspezifisch; häufig wird mit Aggregaten von gemessenen Variablen gearbeitet (Kennzeichen von Empirismus/Positivismus/Behaviorismus: man bleibt auf der Datenebene und vermeidet "latente Variablen"). Sieh als Beispiel die Big 5: Dies sind durch den lexikalischen Ansatz entstanden, in dem man sehr viele Eigenschaftswörter aggregiert hat zu Super-Kategorien. Nachträglich wird diesen Big 5 dann aber plötzlich eine eigene Existenz zu gesprochen - und sogar kausale Effekte postuliert. Dies beißt sich mit der Historie (siehe Borsboom, 2006). Auch der Fokus auf der Regressionsanalyse als Technik zur Maximierung der "prädiktiven Validität" (was ein unsinniger Begriff ist) anstatt Testung kausaler Effektw und der Varianzaufklärung als wichtigstem Ersatzkriterium (statt Wahrheit) ist ein Ausläufer (was nicht heißt, dass das unwichtig ist).
Auch reflektiert die Hauptkomponentenanalyse diesem Ansatz.
Die b-Haltung entspricht SEM - hier geht man davon aus, dass das Modell existierende Variablen hat, die Effekte haben. Seinerzeit wurde Sewell Wright sehr für diese Ziele von Pfadanalysen (SEM mit beobachteten Variablen) angefeindet. Diesem Denken entspricht das Faktorenmodell. Hier könnte man jetzt die ganze o.g. erneut aufzählen, eben halt auf ihr Gegenteil bezogen.
Ich hoffe das hilft. HIer noch ein paar Lese-Tipps:
Borsboom, Denny. (2006). The attack of the psychometricians. Psychometrika, 71(3), 425-440.
Borsboom, Denny. (2008). Psychometric perspectives on diagnostic systems. Journal of Clinical Psychology, 64(9), 1089-1108.
Hayduk, Leslie A., & Pazderka-Robinson, Hanna. (2007). Fighting to understand the world causally: Three battles connected to the causal implications of structural equation models. In W. Outhwaite & S. Turner (Eds.), Sage Handbook of Social Science Methodology (pp. 147-171). London: Sage Publications.
das heißt, man muss dann so lang CFAs probieren, bis man ein Modell gefunden hat, das passt? bzw. kann auch SEM probieren, weil man da noch genauer spezifizieren kann (Kreuzladungen und Fehlerkorrelationen)?
Nein, du musst so lange testen-und neu aufbauen - und testen - bist du hoffentlich das korrekte Modell hast. Dummerweise weißt du das nie. And so the story goes..
Zum letzten Satz: Auch in einer CFA kann man Doppelladungen und Fehlerkorrelationen spezifizieren. Der Unterschied CFA / SEM ist, dass bei der CFA keine Struktur unter den latenten Variablen spezifziert wird sondern alles frei korreliert.
Grüße
Holger