Multiple Regression- Prüfung Voraussetzungen

Alle Verfahren der Regressionanalyse.

Multiple Regression- Prüfung Voraussetzungen

Beitragvon Newtothis » Mi 3. Mär 2021, 23:16

Hallo zusammen,

Ich sitze derzeit an der Vorbereitung einer multiplen linearen Regressionsanalyse für ein empirisches Forschungsprojekt und komme trotz eingehender Google-Recherche und Durchforsten von Literatur gerade nicht weiter.

Für mein Projekt untersuche ich die Wirkung verschiedener uVs (verbessertes Angebot, Preisvorteile, Komfort) auf die „Entscheidung zur Onlinebuchung“ (aV). Alle Variablen ergeben sich aus mehreren Likert-Items (von 1-5 - stimme gar nicht zu-stimme vollkommen zu), die in SPSS zu einer Likert-Skala mittels Mittelwertberechnung zusammengefasst wurden. (Ist es eigtl egal, ob MEAN oder SUM zur Zusammenfassung, solang einheitlich?) - n=97

1. Prüfung der Linearität - ich prüfe zunächst die Linearität mittels der bivariaten Darstellung der aV mit den einzelnen uVs. Aufgrund der zusammengefassten Likert-Skalen für alle Variablen und der Tendenz der Teilnehmer zur Onlinebuchung (z. B. Aufgrund eines besseren Angebots) sind die meisten Punkte auf beiden Achsen zwischen 4 und 5 abgebildet. Wie lässt sich daraus eine Linearität ableiten? Siehe hier: https://ibb.co/GMZQGzp
2. Aus diesem Bild lässt sich bereits erkennen, dass es schwierig sein wird, eine Normalverteilung zu unterstellen. Sowohl für die aV als auch für die uVs bestätigen Schiefe und Kurtosis keine Normalverteilung - siehe die Beispiele:

https://ibb.co/yWBJsxp

https://ibb.co/yBQpVfk

https://ibb.co/ZckB52B


Wie gehe ich damit um und wie kann ich dennoch die Regression weiterrechnen? Es ist doch bei Likert-Skalen davon auszugehen, dass je nach Thema keine Normalverteilung zwischen stimme gar nicht zu und stimme vollkommen zu erwartet werden kann. Welche Möglichkeiten habe ich zum weiteren Vorgehen?

Vielen Dank für eure Hilfe.
Newtothis
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 3. Mär 2021, 22:40
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regression- Prüfung Voraussetzungen

Beitragvon PonderStibbons » Mi 3. Mär 2021, 23:22

Nicht die abhängige Variable und schon gar nicht die unabhängigen Variablen müssen (in der Grundgesamtheit) normalverteilt sein.
Wer hat Dir den Mist erzählt?

Bei kleinen Stichproben sollen die Residuen des Modells aus einer normalverteilten Grundgesamtheit stammen; ab ca. n > 30 ist
auch das entbehrlich.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Newtothis

Re: Multiple Regression- Prüfung Voraussetzungen

Beitragvon Newtothis » Mi 3. Mär 2021, 23:55

PonderStibbons hat geschrieben:Nicht die abhängige Variable und schon gar nicht die unabhängigen Variablen müssen (in der Grundgesamtheit) normalverteilt sein.
Wer hat Dir den Mist erzählt?

Bei kleinen Stichproben sollen die Residuen des Modells aus einer normalverteilten Grundgesamtheit stammen; ab ca. n > 30 ist
auch das entbehrlich.


Vielen Dank für die schnelle Antwort von dir. Das war das beste Beispiel, den Wald vor lauter Bäumen nicht zu sehen. :)
Das hat mir schon geholfen. Ich hatte es verwechselt und nicht bedacht, dass ich erst die Regression rechnen muss und die Residuen dann auf Normalverteilung prüfen kann. Leider konnte die Normalverteilung nach Shapiro-Wilk und Kolmogorov-Smirnov nicht bestätigt werden. Kann ich alternativ auch nach Schiefe und Kurtosis urteilen (Schiefe -0,639, Kurtosis 1,657)? Das Histogramm sieht auch nicht mehr allzu schlimm aus:
https://ibb.co/MkxLD2Z

Und hat ggf. jemand ein Feedback bzgl. der Prüfung der Linearität?

Vielen Dank schon mal vorab für alle Rückmeldungen!
Newtothis
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 3. Mär 2021, 22:40
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regression- Prüfung Voraussetzungen

Beitragvon bele » Do 4. Mär 2021, 08:49

Hallo Newtothis,

Normalverteilung der Residuen ist ein Teil des Modells und wie wir wissen, sind alle Modelle falsch. Der häufig zitierte Satz lautet "Alle Modelle sind falsch. Manche Modelle sind nützlich".

Wenn es darum ginge, ob eine SpaceShuttle Mission gelingt oder misslinkt, dann sollte man da bestimmt nochmal nachforschen. Für die praktischen Belange einer Bachelor- oder Masterarbeit wären mir die gezeigten Residuen "normal genug" wenn sie auch nicht "streng normalverteilt" sind. Einfach einer jener Punkte, in denen das Modell falsch ist, aber trotzdem nützlich sein kann.

Wenn ich mir die abhängige Variable anschaue, dann ist die Summe doch ganz schön oft an der oberen Zensierungsgrenze von 20. Ich glaube, ich würde mal ein Verfahren ausprobieren, dass eine solche Sättigung an den Rändern gut abbilden kann, beispielsweise anstelle einer Geraden eine logistische Funktion anpassen (generalisiertes lineares Modell), wenn das im Rahmen Deiner statistischen Möglichkeiten ist.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

folgende User möchten sich bei bele bedanken:
Newtothis

Re: Multiple Regression- Prüfung Voraussetzungen

Beitragvon PonderStibbons » Do 4. Mär 2021, 09:33

PonderStibbons hat geschrieben:Bei kleinen Stichproben sollen die Residuen des Modells aus einer normalverteilten Grundgesamtheit stammen; ab ca. n > 30 ist
auch das entbehrlich.

Hier ist n = 96.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Newtothis

Re: Multiple Regression- Prüfung Voraussetzungen

Beitragvon Newtothis » So 7. Mär 2021, 23:31

Nochmal vielen Dank an euch für die Antwort. Hat direkt geholfen, einige Unsicherheiten zu beseitigen.
Ich bin nur weiterhin verunsichert wegen der Vorabprüfung der bivariaten Linearität zwischen aV und den jeweiligen uVs. Aufgrund der zusammengefassten Likert-Skalen (mittels Summenbildung) und der häufigen Angabe von "stimme vollkommen zu" (=5) sammeln sich die Ergebnisse im Punktdiagramm wie bereits von @bele korrekt festgestellt am oberen Ende des Diagramms.

Ist der Vorschlag zur Rechnung einer logistischen Regression eine absolute Voraussetzung oder könnte ich das Modell ebenso als Multiple Lineare Regression weiterrechnen, ohne dass die Ergebnisse völlig daneben sind? Dann müsste ich mich jetzt nicht komplett in eine neue Methode einarbeiten und würde die Linearität einfach annehmen, weil ich die Annahme schlüssig erklären kann.
Hier zusätzlich nochmal die Streudiagramm-Matrix (nur mit Mittelwertbildung, hatte ich auch probiert) - bei Betrachtung der obersten Reihe im kleineren Format könnte man zumindest einigermaßen eine positive Linearitätsannahme bestätigen, oder? https://ibb.co/T8BVX1y


Vielen Dank vorab und VG,
Christian
Newtothis
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 3. Mär 2021, 22:40
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regression- Prüfung Voraussetzungen

Beitragvon bele » Mo 8. Mär 2021, 08:52

Hallo Christian,

ich hatte geschrieben

wenn das im Rahmen Deiner statistischen Möglichkeiten ist.

was soll ich noch schreiben zu

Newtothis hat geschrieben:Ist der Vorschlag zur Rechnung einer logistischen Regression eine absolute Voraussetzung oder könnte ich das Modell ebenso als Multiple Lineare Regression weiterrechnen,

Rechne erstmal eine normale kleinste-Quadrate Regression und wenn die Residuen ungefähr gut aussehen und keine Space Shuttle-Mission davon abhängt kannst Du das machen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

folgende User möchten sich bei bele bedanken:
Newtothis

Re: Multiple Regression- Prüfung Voraussetzungen

Beitragvon Newtothis » Mi 10. Mär 2021, 04:45

Rechne erstmal eine normale kleinste-Quadrate Regression und wenn die Residuen ungefähr gut aussehen und keine Space Shuttle-Mission davon abhängt kannst Du das machen.


Hallo Bernhard,

leider ist genau das nicht der Fall. Die Untersuchung der Residuen zeigt ein eindeutiges Bild von Heteroskedastizität.
Jetzt komme ich wahrscheinlich nur noch mit komplexeren Verfahren weiter, oder?

Ich habe bereits in SPSS die Nutzung robuster Standardfehler (HC3) ausprobiert. Die vor der Diagnose der Heteroskedastizität noch von SPSS bestätigte (teils höchste) Signifikanz der uVs ist nach der Berechnung mittels HC3 nicht mehr vorhanden. Die uVs sind nun insignifikant.

Zusätzlich zeigt das Streudiagramm für die Autokorrelation, dass die Residuen nicht randomisiert verteilt sind.

https://ibb.co/mbTPwNK

Habt ihr noch Ideen/Vorschläge, wie ich weitermachen kann?

Viele Grüße,
Christian
Newtothis
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 3. Mär 2021, 22:40
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste