Kriterium Rückwärtselimination

Alle Verfahren der Regressionanalyse.

Kriterium Rückwärtselimination

Beitragvon eldudowizdz » Fr 4. Apr 2014, 18:44

Hallo zusammen,

innerhalb meiner Diplomarbeit möchte ich den Einfluss eines Prädiktors X1 auf das Kriterium Y mittels multipler Regression darstellen. In der Literatur gibt es inkonsistente Ergebnisse zu weiteren Variablen (X2, X3...) welche ebenfalls Einfluss auf Y haben. Daher wurden X2, X3... ebenfalls erhoben. Solche "potenziellen Prädiktoren", nehme ich ebenfalls in das Regressionsmodell auf, wenn diese signifikant (zweiseitig) mit dem Kriterium korrelieren. Um solche Prädiktoren zu entfernen, welche in dem Regressions-Modell nur insignifikant zur Varianzaufklärung beitragen, benutze ich das Merkmalsselektionsverfahren Rückwärtselimination. Das Ausschluss-Kriterium für das Entfernen eines Prädiktors bei einer Rückwärtselimination ist in SPSS per default auf .10 eingestellt. Kann mir vielleicht jemand erklären warum dieses nicht auch, wie etwa beim Vorwärtsverfahren, bei .05 liegt? Ein Kriterium von .10 führt dazu, dass auch Prädiktoren die nur insignifikant zur Varianzaufklärung des Kriteriums beitragen in dem Modell enthalten bleiben, denn hier wird immer das .05 Kriterium zur Bewertung der Prädiktoren genutzt. Die insignifikanten Prädiktoren erschweren meine Interpretation und führen, wenn ich es richtig verstanden habe, auch zu einer verzerrten Schätzung der Regressionskoeffizienten (Eid, 2011). Ich würde nur sehr ungerne ohne einer besseren Begründung das Kriterium von .10 auf .05 ändern. Hat vielleicht jemand eine Quelle zu diesem Thema? In verschiedenen Standardwerken von Eid, Field, Bortz, Pedhazur, Rudolf usw. habe ich keine Lösung gefunden.

Über jeden Tipp wäre ich sehr dankbar!
eldudowizdz
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Do 19. Jul 2012, 12:52
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Kriterium Rückwärtselimination

Beitragvon PonderStibbons » Fr 4. Apr 2014, 19:21

Warum das von SPSS auf 0,10 statt 0,05 gesetzt ist, kann ich leider nicht
beantworten. Ich weiß auch nicht, ob eine solche Begründung bei der
konkreten Problemlösung hilft (leider ist das alles nur abstrakt dargestellt,
Fragestellung, Analyseziel, Stichprobengröße, Zahl der Prädiktoren
bleiben unbekannt) - Dein Vorgehen wirkt problematisch. Vorselektion
anhand Signifikanzkriterien (was zu verzerrten Tests in der "eigentlichen"
Regression führt, die nicht mehr berücksichtigen kann, wieviele Variablen
bereits vorher gecheckt und verworfen wurden), und dann eine stepwise-
Variablenselektion (die extreme Kritik an stepwise Verfahren ist leicht
recherchierbar, nehme ich an), was zusammengenommen zu einem
massiven Risko von overfitting und nicht über die Stichprobe hinaus
generalisierbaren Ergebnissen führt. Da spielt das Kriterium 0,10 versus
0,05 ja nun doch eine untergeordete Rolle.

Just my 2pence

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 8 Gäste