Regressionsanalyse trotz nicht normalverteilter Daten?

Alle Verfahren der Regressionanalyse.

Regressionsanalyse trotz nicht normalverteilter Daten?

Beitragvon JuliaK » Mi 24. Aug 2011, 16:47

Hallo zusammen,

ich habe eine Frage, da ich so langsam an meinen Daten verzweifle.
Ich habe etwas komplizierte Daten vorliegen, die nicht normalverteilt und dazu noch ziemlich stark schief sind. Zur Überprüfung meiner Hypothesen müsste ich eine Regressionsanalyse durchführen.

Liest man sich durch einschlägige Fachliteratur, findet man für die Regressionsanalyse allerdings überall u.a. die Bedingung, dass die Daten normalverteilt sein müssen.

Es wäre toll, wenn mir jemand sagen könnte, was nun zu tun ist? Gibt es eine Alternative zur Regression?

Schon jetzt 1000 Dank für eure Antworten!
JuliaK
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 24. Aug 2011, 16:41
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse trotz nicht normalverteilter Daten?

Beitragvon daniel » Mi 24. Aug 2011, 17:42

JuliaK hat geschrieben:Liest man sich durch einschlägige Fachliteratur, findet man für die Regressionsanalyse allerdings überall u.a. die Bedingung, dass die Daten normalverteilt sein müssen.

Ich frage jetzt nicht was diese "einschlägige Fachliteratur" ist, denn ich weiß, dass in dieser Richtung leider sehr viel Unsinn verzapft wird, auch von "Fachleuten".

Die lineare Regression setzt keine normalverteilten Daten voraus.
(Wir sollten hier mal FAQs zur linearen Regerssion anlegen und diese Frage ganz an den Anfang stellen.)

Was normalverteilt sein soll sind die Fehler (Residuen) der linearen Regression -- und auch diese Annhame ist bei großen Fallzahlen irrelevant.

Um Alternativen zu nennen müsste man wissen um welche Daten, Frage etc. es sich handelt. Bill Gould hat gerade eine sehr interessanten blog Beitrag verfasst, der erklärt (oder zumindest andeutet) warum eine poisson Regression mit robusten Standardfehlern einer Logarithmierung des outcomes vorzuziehen ist. (http://blog.stata.com/2011/08/22/use-po ... -a-friend/)

Wenn Du mal nachlesen möchtest welche Annahmen für welche Eigenschaften der linearen Regerssion wirklich nögitg sind, dann empfehle ich mal in ein Statistikbuch (und zwar Ökonometriebücher ohne solche Zusätze wie "... für Sozialwissenachftler" oder "... für Psychologen" oder ähnliches) zu schauen.

Harte Kost aber zum Nachschlagen top (m.E. eine Art Bibel) :
Greene, W. (2008). Econometric Analysis. Prentice Hall.

Weniger hart aber immer noch "statistisch" genug
Verbeek, M. (2008). A Guide to Modern Econometrics. John Wiley & Sons.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Regressionsanalyse trotz nicht normalverteilter Daten?

Beitragvon JuliaK » Do 25. Aug 2011, 11:34

Vielen Dank schonmal für deine Hinweise/Tips.

Komme leider immernoch nicht wirklich klar. Vielleicht mal etwas mehr zu meinen Daten:

Erhoben wurden Aussagen, die auf einer 5-stufigen Likert-Skala eingeschätzt werden mussten. Aus mehreren Items (Aussagen) wurden, wie immer, entsprechende Skalen. Ich habe nun die Skalenmittelwerte jedes Falles vorliegen. Für zwei der Skalen möchte ich überprüfen, ob ein Zusammenhang besteht und ob Skala a einen Einfluss auf Skala b hat. Die Hypothese lautet in etwa so:

Wenn die Stichprobe die Ausprägung der Skala a positiv eingeschätzt haben, dann weisen sie eine höhere Einschätzung der Skala b auf.

Die Korrelation liegt bei .189*, betrachte ich das Streudiagramm kann ich überhaupt keine anständige Linie erkennen, die durch die Punktwolke geht (siehe Bild anbei).

Folglich kann ich ja gar keine lineare Regression rechnen....

Was mache ich mit den Daten, bzw. meiner Hypothese??? Ich steh echt aufm Schlauch :cry: .

Vielen Dank!
Dateianhänge
Bild1.png
Streudiagramm
Bild1.png (51.29 KiB) 27679-mal betrachtet
JuliaK
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 24. Aug 2011, 16:41
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse trotz nicht normalverteilter Daten?

Beitragvon daniel » Do 25. Aug 2011, 19:48

JuliaK hat geschrieben:Für zwei der Skalen möchte ich überprüfen, ob ein Zusammenhang besteht

Was für ein Zusammenhang? Ein linearer, ein exponentieller, ein U-Förmiger ... ?

... und ob Skala a einen Einfluss auf Skala b hat.

Das wirst Du mit einer Querschnittserhebung kaum testen können.

Die Hypothese lautet in etwa so:
Wenn die Stichprobe die Ausprägung der Skala a positiv eingeschätzt haben, dann weisen sie eine höhere Einschätzung der Skala b auf.

Wenn Du Deine Hypothese nur auf die Stichprobe beziehst, wozu dann überhaupt groß inferenzstatistische Verfahren? Lass Dir den Mittelwert (oder Median) von Skala b für die Gruppe anzeigen, die Skala a negativ einschätzt und den für die Gruppe, die Skala a positiv einschätzt. Ist der zweite größer als der erste hast Du Deine Hypothese bestätigt.

betrachte ich das Streudiagramm kann ich überhaupt keine anständige Linie erkennen, die durch die Punktwolke geht (siehe Bild anbei).

Weshalb der Korrelationskoeffizient auch relativ klein ausfällt. Der lineare Zusammenhang der beiden Skalen ist demnach nicht sehr stark. Das war aber auch nicht Deine Hypotehse.

Folglich kann ich ja gar keine lineare Regression rechnen....

Kannst Du schon. Allerdings stellt sich die Frage wozu? Wenn Du lediglich überprüfen willst, ob die beiden Skalen zusammenhängen und sich Deine Hypotehse (die noch sehr viel eingeschränkter ist) ohnehin nur auf Deine Stichprobe bezieht, dann ist ein Vorgehen wie oben beschreiben vollkommen ausreichend.

Vielleicht kann ich mehr (oder bessere) Ratschläge geben, wenn Du Deine Forschungsfrage inhaltlichdarstellst. (Zusätzlich sind natürlich Informationen zur Stichprobe sinnvoll).
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Regressionsanalyse trotz nicht normalverteilter Daten?

Beitragvon bele » Di 30. Aug 2011, 14:50

JuliaK hat geschrieben:Die Hypothese lautet in etwa so:

Wenn die Stichprobe die Ausprägung der Skala a positiv eingeschätzt haben, dann weisen sie eine höhere Einschätzung der Skala b auf.

Die Korrelation liegt bei .189*

Ist das die Pearson-Korrelation? Dann solltest Du prüfen ob Deine Hypothese nicht eher zu Kendall's tau oder Spearmann's r passt.

Geht es um Deine Stichprobe oder um die Grundgesamtheit? Im letzteren Fall solltest Du außer den Korrelationskoeffizienten auch die Irrtumswahrscheinlichkeit p berichten. Möglicherweise ist dann schon klar dass Du die Nullhypothese beibehalten musst.

JuliaK hat geschrieben:betrachte ich das Streudiagramm kann ich überhaupt keine anständige Linie erkennen, die durch die Punktwolke geht (siehe Bild anbei).

Wenn ich das Diagramm betrachte ist es zu groß für meinen Bildschirm. Einige Kreise sehen dicker aus als andere. Sind das dann mehrere Fälle mit identischen Parametern? Dass könnte Deine visuelle Beurteilung beeinträchtigen.

JuliaK hat geschrieben:Was mache ich mit den Daten, bzw. meiner Hypothese???

p berichten und sagen warum Du eine Regression rechnen willst und nicht mit einer Korrelation zufrieden bist.


Gruß,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 13 Gäste

cron