Homoskedastizität und Normalverteilung der Residuen verletzt

Alle Verfahren der Regressionanalyse.

Homoskedastizität und Normalverteilung der Residuen verletzt

Beitragvon Lau-ra » Fr 27. Nov 2015, 16:38

Liebe Community,

ich brauche eure Hilfe bei meiner Bachelor-Arbeit. Ich untersuche die Beteiligungsintention an einer freiwilligen Tätigkeit (abhängige Variable), die durch 6 Prädikatoren erklärt werden soll. Zur Operationalisierung meines Modells, habe ich aus der Literatur bereits getestete Items verwendet (5er-Likert-Skalen/ 1 = stimme voll zu und 5 = stimme überhaupt nicht zu). Die Stichprobe aus meiner Online-Befragung beträgt n=423.

Die konfirmatorische Faktorenanalyse zeigt mir nun nach Ausschließen von 3 Items, dass die Faktoren meinem hypothetischen Modell entsprechen. Das KMO-Kriterium beträgt 0,892 und die Items weisen zufriedenstellende Faktorladungen zwischen 0,6 und 0,8 auf.

So weit so gut, meine Freude wurde durch die multiple Regressionsanalyse ein wenig getrübt. Von den 6 Prädikatoren (Scores aus der Faktorenanalyse), weisen immerhin 4 signifkante, auch wenn nicht allzu hohe Effekte auf (Beta-Koeffizienten zwischen 0,137 und 0,359). Mein R^2 beträgt 0,25. Multikollinearität und Autokorrelation liegen nicht vor.

Und jetzt zu meinem Problem: Die Annahme der Homoskedastizität und der Normalverteilung der Residuen wird verletzt! Leider muss ich auch dazu sagen, dass 2 der Prädikatoren und die AV stark rechtsschief sind (+0,9 bis +1,9). Ich habe durch das logarithmieren der AV versucht, die Schiefe und dadurch die Verletzung der Annahmen zu reduzieren, leider mit keinem zufriedenstellenden Ergebnis (R^2 und die Regressionskoeffizienten haben sich kaum verändert und das geschilderte Problem ist immer noch vorhanden). Die Prädikatoren möchte ich aufgrund der Interpretierbarkeit ungerne antasten. Ich versuche seit Tagen, eine Lösung für das Problem zu finden. Je mehr ich mich reinlese, desto verwirrter bin ich. Ich hoffe, dass mir hier jemand weiter helfen kann.

Konkret würde ich gerne wissen:

1. Rechtfertigt die Begründung des zentralen Grenzwertsatzes tatsächlich die Güte meines Modells bei einer Stichprobe von n=432? In der multiplen Regression wurden davon allerdings nur 287 Fälle berücksichtigt. Es kommt mir zu einfach vor, die Verletzung dieser wichtigen Annahmen mit nur zwei/drei Sätzen "zu übergehen".

2. Neben dem Logarithmieren habe ich zudem in diesem Forum ein paar mal gelesen, dass man mit "robusten Standardfehlern" rechnen kann. Ich glaube, ich verstehe den Hintergund dieser Vorgehensweise, aber nicht wie ich das in SPSS anstellen soll?

3. Mein R^2 von 0,25 erscheint mir nicht allzu hoch. Liegt das an der Schiefe der AV?

Ich entschuldige mich vorab, falls ich mein Problem nicht statistisch sauber geschildert habe oder "blöde" Denkfehler enthalten sind. Ich freue mich über eure Hilfe!

Gruß, Laura
Lau-ra
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Fr 27. Nov 2015, 12:24
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Homoskedastizität und Normalverteilung der Residuen verl

Beitragvon PonderStibbons » Fr 27. Nov 2015, 19:39

Die Modellresiduen sollten normalverteilt sein (korrekt: aus einer normalverteilten Grundgesamtheit stammen), damit der Signifikanztest nicht verzerrt wird. bei ausreichend großen Stichproben (ich habe noch keine Simulation mit n > 60 gesehen, wo es noch Effekte von extrem nichtnormalen Verteilungen gab) gilt diese Voraussetzung als nicht mehr erforderlich.

Und, bitte, verzichte auf da Herumtransformieren, außer Du weißt ganz genau, was die Ergebnisse davon dann bedeuten. Allerdings kenne ist die AV nicht.

Was die robusten Standardfehler in SPSS betrifft, da bin ich persönlich überfragt.

Wieso Dir ein R2 von 0.25 nicht allzu hoch erscheint, solltest Du vielleicht erläutern. Welchen Wert hast Du denn begründet erwartet? Es ist ein R von immerhin 0.5, und das angesichts von recht unreliablen Messungen. Mir kommt das eher verdächtig hoch vor. Da die Inhalte der Studie aber wenig nachvollziehbar beschrieben sind, lässt sich konkret nichts dazu sagen.

mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Homoskedastizität und Normalverteilung der Residuen verl

Beitragvon Lau-ra » Sa 28. Nov 2015, 13:52

Vielen Dank vorab für deine Antwort! Ich habe leider noch einge Fragen...

PonderStibbons hat geschrieben:Die Modellresiduen sollten normalverteilt sein (korrekt: aus einer normalverteilten Grundgesamtheit stammen), damit der Signifikanztest nicht verzerrt wird. bei ausreichend großen Stichproben (ich habe noch keine Simulation mit n > 60 gesehen, wo es noch Effekte von extrem nichtnormalen Verteilungen gab) gilt diese Voraussetzung als nicht mehr erforderlich.


Heißt das, wenn meine Grundgesamtheit nicht normalverteilt ist, dann können es auch die Residuen nicht sein und somit darf korrekterweise keine lineare Regression angewandt werden? Mein Histrogramm und P-P-Diagramm sehen folgendermaßen aus:

Bild


PonderStibbons hat geschrieben: Wieso Dir ein R2 von 0.25 nicht allzu hoch erscheint, solltest Du vielleicht erläutern. Welchen Wert hast Du denn begründet erwartet? Es ist ein R von immerhin 0.5, und das angesichts von recht unreliablen Messungen. Mir kommt das eher verdächtig hoch vor. Da die Inhalte der Studie aber wenig nachvollziehbar beschrieben sind, lässt sich konkret nichts dazu sagen.


Mir ist bewusst, dass es keinen einheitlichen Richtwert für ein R^2 gibt und auch, dass die Höhe von dem jeweiligen Forschungsfeld abhängig ist. In der Sozialforschung z.B., wie in meiner Arbeit, ist ohnehin mit eher geringeren Werten zu rechnen, da viele Einflussgrößen nicht erfasst werden können. Dennoch bin ich in der Literatur auf einige Empfehlungen gestoßen, die die Güte der Anpassung einer Regressionsfunktion beschreiben.
Chin (1998, S. 323) bezeichnet z.B. ein R^2 ab 0,67 als substanziell, ab 0,33 als moderat und ab 0,19 als schwach. Huber et al. (2007, S. 45) beschreiben, dass bereits ein R^2 ab 0,3 als substanziell anzusehen ist. Homburg und Baumgartner (1995b, S. 172) fordern ein R^2 von mindestens 0,4. Folge ich Chins Einstufung, so ist mein R^2 also eher schwach für eine multiple Regression.

Kannst du mir begründen, warum du vermutest, dass meine Messung unreliabel ist?

Zum näheren Hintergrund meiner Studie: meine AV ist die "Beteiligungsintention an einer freiwilligen Tätigkeit", meine UV sind 6 Motive: soziale Beziehungen, Soziale Anerkennung, Freude an der Tätigkeit, Wertüberzeugungen, Erfahrungen sammeln und Selbstwerterhöhung. Letztere 4 Prädikatoren sind signifikant. Ich habe alle Konstrukte und die dazugehörigen Items der Literatur entnommen. Eine Überprüfung der Skalen mittels Cronbachs Alpha und der Trennschärfe lieferte gute Ergebnisse.
Lau-ra
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Fr 27. Nov 2015, 12:24
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Homoskedastizität und Normalverteilung der Residuen verl

Beitragvon strukturmarionette » Sa 28. Nov 2015, 14:35

Hi,

Kannst du mir begründen, warum du vermutest, dass meine Messung unreliabel ist?

- PonderS meinte viell, das Du es versäumt hast, bei der Operationalisieurng der Latenten Variablen Reliabilität zu prüfen. Zumindest berichtestt Du nicht darüber.

Heißt das, wenn meine Grundgesamtheit nicht normalverteilt ist, dann können es auch die Residuen nicht sein und somit darf korrekterweise keine lineare Regression angewandt werden?

- Nein. Die NV-Annahme bezieht sich auf die Residuen und ist wichtig für die Inferenzstatistik bei der MR.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 8 Gäste