Hallo zusammen! Ich dachte mir ich probiere es mal mit einer Fragestellung, die mir etwas Kopfzerbrechen bereitet:
Mein Ziel ist es aus einem Fragebogen mit 15 Elementen (dichotomous, "check-all-that-apply") eine Typologie zu entwickeln. Die Probanden machen Angaben zu ihrer Tätigkeit, die ich klassifizieren möchte, bspw. nach ihrer "Komplexität", etc. Der Bogen besteht aus zwei existierenden und validierten (allerdings in einem anderen Kontext) Instrumenten, die zusammengefügt wurden. Ich habe zwei Datenerhebungen, einmal N=1000 und dann N=200 zu einem anderen Zeitpunkt, aber ähnlichen Bedingungen.
Mein bisheriger Ansatz hat drei Schritte:
1) Dimensionalitätsreduzierung (hab ich einfach mal so aus dem Englischen übersetzt, hoffe das geht) via Exploratory Graph Analysis (EGA)
1) a) EGA ("TMFG" und "glasso") durchführen mit N=1000 Datensatz: 4-Faktorstruktur bzw. 2-Faktorstruktur
1) b) zur Kontrolle Parallel-Analysis durchgeführt: 4-Faktor/2-PC
1) c) (aus Interesse) EFA (tetrachoric, Promax rotation) mit nfactors=4 (andere Struktur als EGA)
Also ein 4-Faktormodell -->
2) Bestätigende CFA (WLSMV) mit N=200 Datensatz
2) a) EGA-Modell: zwei Items laden nicht
2) a) aa) ein Item gelöscht, eines theoretisch "sinnvoll" umgeschichtet
2) b) EFA-Modell: lädt, aber selbes Item problematisch
2) b) aa) Item gelöscht
2) c) "Theoretisches"-Modell basierend auf der bereits validierten Struktur für beide Instrumente zusammengefügt (also eher an den Haaren herbeigezogen ...), selbes Item problematisch
2) c) aa) Item gelöscht
Zu meinem erstaunen sind die Fit-Indizes ausgezeichnet für alle drei justierten Modelle (SRMR, RMSEA, CFI alle im vorgesehenen Rahmen). Nachdem das problematische Item (das zugegeben etwas schwierig zu verstehen ist / schlecht formuliert ist) gelöscht wurde, sind auch die Reliabilitätswerte hervorragend (Cronbachs Alpha ~.88/McDonald's Omega ~.86).
Bevor ich nun zum dritten Schritt übergehe (Mittelwerte interpretieren und anschließend Regressionsanalyse mit mehreren anderen Variablen im Datensatz) wollte ich mich erkundigen, ob ich nicht etwas falsch mache in meiner Herangehensweise. Ist das genannte Verfahren überhaupt eine angemessene Methode um eine "empirische Typologie" zu entwickeln? Falls ja, welche Methode zur Dimensionalitätsreduzierung ist angebracht, da beide unterschiedliche Ergebnisse produzieren (allerdings die gleiche Anzahl an Faktoren)? Zuletzt, falls 1 und 2 passen sollten, wieso passen drei relativ unterschiedliche Modelle so gut, wie trifft man in diesem Fall eine Entscheidung?
Danke schonmal!
Grüße
Tim