Multiple Regression - Interpretation der Koeffizienten

Alle Verfahren der Regressionanalyse.

Multiple Regression - Interpretation der Koeffizienten

Beitragvon Sirsimmerl123 » Fr 10. Nov 2017, 20:07

Hallo zusammen,

ich benötige dringend Hilfe, da ich gerade an einem Paper schreibe und das Ganze baldmöglichst einreichen muss :/

Hier mein Problem:

Ich habe eine multiple Regression gerechnet und dabei die backward-selection Methode verwendet um zu schauen, welche meiner Prädiktoren meine AV am besten vorhersagen. Laut Modellzusammenfassung enthält mein finales Modell (also das welches bei der Tabelle "Modellzusammenfassung" am Ende steht) insgesamt 7 UV's. Was mich nun aber verwirrt ist, dass wenn ich zu der Tabelle "Koeffizienten" gehe, hier nur 4 der 7 Prädiktoren signifikant sind (also kleiner 0,05).

Nun weiß ich nicht, ob ich jetzt die 7 UV's als Prädiktoren berichte (obwohl drei davon ja nicht signifikant sind) oder am Ende nur die 4 UV's, obwohl das finale Modell ja eigentlich 7 UV's enthält?

Ich wäre ganz arg dankbar für jeden Tipp, was ich im Results-Teil des Papers jetzt nun genau berichte ...

Viele Grüße und danke schonmal!
Sirsimmerl123
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 10. Nov 2017, 19:55
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regression - Interpretation der Koeffizienten

Beitragvon PonderStibbons » Fr 10. Nov 2017, 21:44

ich benötige dringend Hilfe, da ich gerade an einem Paper schreibe und das Ganze baldmöglichst einreichen muss :/

Wie sehr dringend bzw, wie sehr bald, und was für ein Typ Paper und bei wem einzureichen?

Ich habe eine multiple Regression gerechnet und dabei die backward-selection Methode verwendet

Das ist schlecht. Es führt zu overfitting, verzerrten p-Werten, irreführenden Modellen und nicht generalisierbaren Testergebnissen.
https://www.stata.com/support/faqs/stat ... -problems/
https://en.wikipedia.org/wiki/Stepwise_ ... #Criticism

Besser Du rechnest ein Modell auf Basis theoretischer Überlegungen und fügst die interessierenden Variablen von Dir aus ein, oder mechanische Variablenselektion. EDIT: ohne mechanische Variablenselektion.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Sirsimmerl123

Re: Multiple Regression - Interpretation der Koeffizienten

Beitragvon Sirsimmerl123 » Sa 11. Nov 2017, 19:54

Lieber PonderStibbons,

vielen Dank für deine schnell Antwort!

Ich bin mir bewusst, dass die backward-selection kein wirklich gute Methode ist. Das Problem ist aber, dass ich (mit meinen begrenzten Statistik-Kenntnissen), leider keine bessere Alternative kenne.

Vielleicht hast du ja noch eine Idee:

Für meine Untersuchung haben die Probanden einen Fragebogen mit ca. 25 Fragen ( = alles potentielle UV's) zu soziodemographischen Daten und einen Fragebogen zu ihrer aktuellen Belastung ( = AV) ausgefüllt. Die Betreuer meiner Arbeit wollen nun, dass ich so etwas wie ein Risikoprofil von Probanden mit besonders hoher Belastung erstelle (also sowas wie bspw.: Männer unter 40, die nicht verheiratet sind und und und... sind besonders belastet).

Das Problem ist, dass es beinahe zu jedem der 25 Fragebogen-Items einige Studien gibt, die zeigen, dass genau dieser Parameter einen signifikanten Einfluss auf den Belastungsscore hat. Ergo ist es schwierig über inhaltliche Kriterien UV's auszuwählen, weil im Grunde genommen dann alle 25 in Frage kommen.

Daher bin ich jetzt so vorgegangen, dass ich erst einmal univariate Regressionen für jede einzelne potentielle UV gerechnet und die ausgewählt habe, die unter einem Signifikanzniveau von 0.2 gelegen sind (dieses Vorgehen hatte ich so in einigen Untersuchungen gefunden). Dann habe ich die übriggebliebenen 7 UV's, wie bereits erwähnt, in eine multiple Regression gepackt und dann die backward-selection verwendet, wobei noch 4 übrig geblieben sind ...

Ich bin mir bewusst, dass das so nicht optimal ist und ich wäre daher unheimlich dankbar, wenn dir ein alternatives Vorgehen einfällt.

Danke!
Sirsimmerl123
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 10. Nov 2017, 19:55
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regression - Interpretation der Koeffizienten

Beitragvon PonderStibbons » Sa 11. Nov 2017, 23:53

Ich bin mir bewusst, dass die backward-selection kein wirklich gute Methode ist. Das Problem ist aber, dass ich (mit meinen begrenzten Statistik-Kenntnissen), leider keine bessere Alternative kenne.

Jede ist besser. Du rechnest ein Modell auf Basis theoretischer Überlegungen und fügst die interessierenden Variablen von Dir aus ein, ohne mechanische Variablenselektion.

Für meine Untersuchung haben die Probanden einen Fragebogen mit ca. 25 Fragen ( = alles potentielle UV's) zu soziodemographischen Daten und einen Fragebogen zu ihrer aktuellen Belastung ( = AV) ausgefüllt. Die Betreuer meiner Arbeit wollen nun, dass ich so etwas wie ein Risikoprofil von Probanden mit besonders hoher Belastung erstelle (also sowas wie bspw.: Männer unter 40, die nicht verheiratet sind und und und... sind besonders belastet).

Ohne Angabe der Stichprobengröße lässt sich das leider kaum gescheit diskutieren.
Und die Fragestellung erscheint mir extrem diffus.
Daher bin ich jetzt so vorgegangen, dass ich erst einmal univariate Regressionen für jede einzelne potentielle UV gerechnet und die ausgewählt habe, die unter einem Signifikanzniveau von 0.2 gelegen sind (dieses Vorgehen hatte ich so in einigen Untersuchungen gefunden). Dann habe ich die übriggebliebenen 7 UV's, wie bereits erwähnt, in eine multiple Regression gepackt und dann die backward-selection verwendet, wobei noch 4 übrig geblieben sind ...

Das führt zu overfitting, verzerrten p-Werten, irreführenden Modellen und nicht generalisierbaren Testergebnissen.
Ich bin mir bewusst, dass das so nicht optimal ist und ich wäre daher unheimlich dankbar, wenn dir ein alternatives Vorgehen einfällt.

Du rechnest ein Modell auf Basis theoretischer Überlegungen und fügst die interessierenden Variablen von Dir aus ein, ohne mechanische Variablenselektion. Die diffuse Fragestellung scheint allerdings kein multivariates Verfahren zu erfordern, " Risikoprofil" ist etwas anders als eine Modellgleichung. Wenn die Fragestellung und die Nutzanwendung der Ergebnisse einigermaßen klar sind, ergibt sich womöglich ein passendes Vorgehen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Multiple Regression - Interpretation der Koeffizienten

Beitragvon Sirsimmerl123 » Mo 13. Nov 2017, 15:16

Ok, das klingt überzeugend! Ich bespreche das mal mit meinen Betreuern ...

Vielen Dank für die Zeit und Mühe!

S.
Sirsimmerl123
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 10. Nov 2017, 19:55
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 16 Gäste

cron