Schrittweise Regression

Alle Verfahren der Regressionanalyse.

Schrittweise Regression

Beitragvon Scooby_538 » Mi 22. Nov 2023, 13:15

Liebe Community,

ich stecke bei einem Problem in meiner Arbeit fest, vielleicht hat jemand da einen schlauen Gedanken dazu. Ich möchte untersuchen, ob 7 UVs einen Einfluss auf 1 AV haben. Genauer: Haben "Geschlecht", "Eigenes Einkommen", "Alter", "Arbeitslosigkeit", etc. einen Einfluss auf die Lebenszufriedenheit. Hierfür wollte ich den Ansatz einer Regression nutzen. Dabei ist mir der Ansatz der Schrittweisen Regression aufgefallen. An sich eine gute Methode, die mir in einem Video von "Statistik am PC" (Shout-out an Björn) gezeigt wurde. Es soll sich dabei jedoch um eine Methode handeln, die sehr explorativ ist und man "füttert" das Regressionsmodell mit so vielen Daten wie möglich und lässt es rechnen und bekommt am Ende signifikante Einflussvariablen raus. Nicht sehr "sauber" da man nicht direkt Hypothesengeleitet sondern eben explorativ arbeitet.
Wenn man vorher Theorie zu den 7 UVs hat und begründet, warum man einen Einfluss vermutet + Hypothesen dazu formuliert, kann dann die schrittweise Regression ein Ansatz sein, den man so in der Arbeit hat? Oder empfiehlt sich eher ein anderer Ansatz? Wäre es z. B. "sauberer" eine multiple Regression mit den 7 UVs zu rechnen und dann die nicht signifikanten zu entfernen? Ich habe das ganze mit der schrittweisen Regression bereits gerechnet. Im Modell werden nur 5 von den 7 UVs aufgenommen.


Vielen Dank für alle Gedanken zum Thema!
Scooby_538
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 18. Jun 2021, 13:30
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Schrittweise Regression

Beitragvon PonderStibbons » Mi 22. Nov 2023, 14:27

Dabei ist mir der Ansatz der Schrittweisen Regression aufgefallen. An sich eine gute Methode,

Eher eine unausrottbare statistische Krätze.

Wieso kommst Du von " Ich möchte untersuchen, ob 7 UVs einen Einfluss auf 1 AV haben" auf schrittweise Variablenselektion?
Selbst wenn diese nicht von massiven Problemen geplagt wäre, es wäre immer noch nicht unmittelbar klar, in welchem Bezug
das konkret zu Deinem Anliegen steht.
Nicht sehr "sauber" da man nicht direkt Hypothesengeleitet sondern eben explorativ arbeitet.

Das ist nicht der springende Punkt. Unzählige Arbeiten und Analysen sind explorativ und völlig in Ordnung
(wobei ich zugegebenermaßen nicht so recht weiß, was mit "sauber" gemeint ist). Die mechanische Variablenselektion
sorgt für überangepasste, nicht über die Stichprobe hinaus generalisierbare Modelle und falsche p-Werte.
Wenn Du eine lineare Regression mit 7 zufallsgenerierten Prädiktoren und einer zufallsgenerierten abhängigen
Variable rechnest, ist die Wahrscheinlichkeit groß, dass schrittweise Variablenselektion aus dem Zufallsrauchen
ein Modell mit statistisch signifikanten "Effekten" konstruiert.
https://towardsdatascience.com/stopping ... 818b3f52df
Wäre es z. B. "sauberer" eine multiple Regression mit den 7 UVs zu rechnen und dann die nicht signifikanten zu entfernen?

Ich weiß wie gesagt nicht, was unter "sauber" konkret zu verstehen ist. -- Warum und wozu willst Du sie entfernen?
Es wäre eine präzisere und konkrete Fragestellung nützlich. "Ich möchte untersuchen, ob 7 UVs einen Einfluss auf 1 AV haben"
bedeutet möglicherweise 7 bivariate Analysen, oder die Betrachtung des Gesamtmodells, oder die Interpretation der einzelnen
Koeffizienten innerhalb des Gesamtmodells, oder vielleicht auch alles dies, oder auch etwas anderes. Hintergrund, Thema
und Verwendungszweck der Studie, Stichprobengröße und Natur der Variablen zu wissen würde es zu diskutieren erheblich
erleichtern.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Schrittweise Regression

Beitragvon bele » Mi 22. Nov 2023, 17:04

Um das mit der "unausrottbaren Krätze" besser zu verstehen und überhaupt zu verstehen, warum wir so begeistert von schrittweisen Ein- und Ausschluss von Variablen sind, empfehle ich Dir, diesen Thread und die darin verlinkten Abschnitte durchzulesen.
post52933.html?hilit=Stepwise#p52933

LG, Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5920
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1401 mal in 1387 Posts

Re: Schrittweise Regression

Beitragvon Holgonaut » Do 23. Nov 2023, 13:49

Hallo zusammen,

ich hab nicht viel hinzuzufügen, außer, dass bei nur 7 Prädiktoren sowieso kein Grund für irgendeine Selektion ist. Selektionsmethoden sind dann relevant, je mehr das p (Anzahl Prädiktoren) in Richtung N oder so darüber hinaus geht. Dann wär aber ein LASSO Modell sinnvoller, v.a. ein gebettet in einen cross-validation Ansatz, um die von PonderStibbons adressierte overfitting Gefahr zu reduzieren.

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste