Multiple lineare Regression -Normalverteilung- Bootstrapping

Alle Verfahren der Regressionanalyse.

Multiple lineare Regression -Normalverteilung- Bootstrapping

Beitragvon Kleiner_Mari » Do 14. Sep 2023, 15:25

Hallo liebe Forum-Mitglieder,

ich bin ein wenig überfragt bei meiner multiplen linearen Regressionsanalyse, die ich durchführen möchte.
Zu meiner Studie (Studienpopulation n = 120): Ich möchte untersuchen, ob Diabetes einen Einfluss auf Depressionen hat ( AV ist ein Fragebogen mit einem Score von 0 bis 100). Dies habe ich bereits mit einer ANOVA gemacht, möchte nun aber schauen, ob weitere Variablen (wie Geschlecht, BMI, Alter etc.) auch einen Einfluss auf Depressionen haben und somit Confounder sind. Dazu wollte ich nun eine multiple lineare Regression mit der Rückwärts-Methode in SPSS durchführen. Als signifikanter Einflussfaktor bleibt nach der Berechnung nur noch Diabetes und Geschlecht übrig. Wenn ich nun auf Normalverteilung der Residuen als Voraussetzung für die Regressionsanalyse teste, kommt hier leider keine Normalverteilung heraus und somit dürfte ich die multiple lineare Regressionsanalyse gar nicht anwenden... Wie gehe ich nun weiter vor? Ich habe schon überlegt, Bootstrapping anzuwenden, aber irgendwie kann ich das nicht in Kombination mit der Rückwärts-Methode durchführen...

Ich hoffe, ihr könnt mir helfen. Vielen Dank schon mal! :)
Kleiner_Mari
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Do 14. Sep 2023, 15:10
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Multiple lineare Regression -Normalverteilung- Bootstrap

Beitragvon PonderStibbons » Do 14. Sep 2023, 16:34

Zu meiner Studie (Studienpopulation n = 120): Ich möchte untersuchen, ob Diabetes einen Einfluss auf Depressionen hat ( AV ist ein Fragebogen mit einem Score von 0 bis 100).

Manipulierst Du das Auftreten von Diabetes experimentell, oder hast Du andere Elemente in Deinem Forschungsdesign,
die es gestatten werden, Kausalaussagen zu machen? Andernfalls wäre es vielleicht sachgerechter von
"ist assoziiert mit" oder "es besteht eine Beziehung zwischen" zu schreiben. Vielleicht beeinflusst auch
Depression das Auftreten von Diabetes. Und/oder beide haben gemeinsame Ursachen.
Dies habe ich bereits mit einer ANOVA gemacht, möchte nun aber schauen, ob weitere Variablen (wie Geschlecht, BMI, Alter etc.) auch einen Einfluss auf Depressionen haben und somit Confounder sind. Dazu wollte ich nun eine multiple lineare Regression mit der Rückwärts-Methode in SPSS durchführen.

Lass das mit der automatischen Variablenselektion unbedingt sein. Das resultierende Modell
ist mit hoher Wahrscheinlichkeit über-angepasst (overfitted) und hat falsche Standardfehler
und falsche p-Werte. Empfehlenswert ist, sich aufgrund von Wissen über den Sachverhalt
relevante "Confounder" auszusuchen und die dann in einem Block zu verwenden. Statt einen
Algorithmus ein nicht generalisierbares Ergebnis erzeugen zu lassen.
Als signifikanter Einflussfaktor bleibt nach der Berechnung nur noch Diabetes und Geschlecht übrig.

Ach so, das Kind ist schon in den Brunnen gefallen. Ich würde trotzdem vorschlagen, das
ganze nochmal mit Einfügen in einem einzigen Schritt und ohne Selektion durchzuführen.
Wenn ich nun auf Normalverteilung der Residuen als Voraussetzung für die Regressionsanalyse teste, kommt hier leider keine Normalverteilung heraus und somit dürfte ich die multiple lineare Regressionsanalyse gar nicht anwenden

Die Annahme ist nicht besonders wichtig, und bei ausreichender Stichprobengröße
(n > 30 wird oft genannt) irrelevant.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Kleiner_Mari

Re: Multiple lineare Regression -Normalverteilung- Bootstrap

Beitragvon Kleiner_Mari » Do 14. Sep 2023, 18:03

Vielen Dank für die ausführliche Antwort. Dann werde ich deinem Rat folgen und die Variablen dann in einem Schritt einfügen.
Das sind ja gute Nachrichten, dass meine Stichprobe anscheinend groß genug ist für die Verletzung der Normalverteilungs-Voraussetzung. Ich habe aber leider auch keine Homoskedastizität. Dann müsste ich wahrscheinlich allein schon deshalb trotzdem Bootstrapping durchführen, oder?

Du hast mir wirklich schon sehr weitergeholfen, danke! :)
Kleiner_Mari
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Do 14. Sep 2023, 15:10
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Multiple lineare Regression -Normalverteilung- Bootstrap

Beitragvon PonderStibbons » Do 14. Sep 2023, 21:28

Ich habe aber leider auch keine Homoskedastizität. Dann müsste ich wahrscheinlich allein schon deshalb trotzdem Bootstrapping durchführen, oder?

Kommt aufs Ausmaß an.

Es gibt außerdem -> robuste Standardfehler zur Korrektur bei Heteroskedastizität.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste