Liebe Community,
ich brauche eure Hilfe bei meiner Bachelor-Arbeit. Ich untersuche die Beteiligungsintention an einer freiwilligen Tätigkeit (abhängige Variable), die durch 6 Prädikatoren erklärt werden soll. Zur Operationalisierung meines Modells, habe ich aus der Literatur bereits getestete Items verwendet (5er-Likert-Skalen/ 1 = stimme voll zu und 5 = stimme überhaupt nicht zu). Die Stichprobe aus meiner Online-Befragung beträgt n=423.
Die konfirmatorische Faktorenanalyse zeigt mir nun nach Ausschließen von 3 Items, dass die Faktoren meinem hypothetischen Modell entsprechen. Das KMO-Kriterium beträgt 0,892 und die Items weisen zufriedenstellende Faktorladungen zwischen 0,6 und 0,8 auf.
So weit so gut, meine Freude wurde durch die multiple Regressionsanalyse ein wenig getrübt. Von den 6 Prädikatoren (Scores aus der Faktorenanalyse), weisen immerhin 4 signifkante, auch wenn nicht allzu hohe Effekte auf (Beta-Koeffizienten zwischen 0,137 und 0,359). Mein R^2 beträgt 0,25. Multikollinearität und Autokorrelation liegen nicht vor.
Und jetzt zu meinem Problem: Die Annahme der Homoskedastizität und der Normalverteilung der Residuen wird verletzt! Leider muss ich auch dazu sagen, dass 2 der Prädikatoren und die AV stark rechtsschief sind (+0,9 bis +1,9). Ich habe durch das logarithmieren der AV versucht, die Schiefe und dadurch die Verletzung der Annahmen zu reduzieren, leider mit keinem zufriedenstellenden Ergebnis (R^2 und die Regressionskoeffizienten haben sich kaum verändert und das geschilderte Problem ist immer noch vorhanden). Die Prädikatoren möchte ich aufgrund der Interpretierbarkeit ungerne antasten. Ich versuche seit Tagen, eine Lösung für das Problem zu finden. Je mehr ich mich reinlese, desto verwirrter bin ich. Ich hoffe, dass mir hier jemand weiter helfen kann.
Konkret würde ich gerne wissen:
1. Rechtfertigt die Begründung des zentralen Grenzwertsatzes tatsächlich die Güte meines Modells bei einer Stichprobe von n=432? In der multiplen Regression wurden davon allerdings nur 287 Fälle berücksichtigt. Es kommt mir zu einfach vor, die Verletzung dieser wichtigen Annahmen mit nur zwei/drei Sätzen "zu übergehen".
2. Neben dem Logarithmieren habe ich zudem in diesem Forum ein paar mal gelesen, dass man mit "robusten Standardfehlern" rechnen kann. Ich glaube, ich verstehe den Hintergund dieser Vorgehensweise, aber nicht wie ich das in SPSS anstellen soll?
3. Mein R^2 von 0,25 erscheint mir nicht allzu hoch. Liegt das an der Schiefe der AV?
Ich entschuldige mich vorab, falls ich mein Problem nicht statistisch sauber geschildert habe oder "blöde" Denkfehler enthalten sind. Ich freue mich über eure Hilfe!
Gruß, Laura