Multiple Lineare Regression mit Bootstrapping

Alle Verfahren der Regressionanalyse.

Multiple Lineare Regression mit Bootstrapping

Beitragvon jana_msh » Sa 17. Apr 2021, 18:39

Hallo zusammen,

ich habe eine Multiple Lineare Regression (MLR) mit Bootstrapping durchgeführt.
Bootstrapping habe ich benutzt, da meine Residuen nicht normalverteilt waren und somit eine Annahme der MLR verletzt ist.

SPSS spuckt mir jetzt 2 Tabellen aus: 'Koeffizienten' und 'Bootstrap für Koeffizienten'. Siehe Beispielbild anbei.

Die Zahlen sind war sehr ähnlich aber trotzdem unterschiedlich. Welchen Output muss ich in meiner Thesis beschreiben?
Wichtig sind mir die Signifikanzen (p-values) und Koefizienten.

DANKE!

Viele Grüße,
Jana
jana_msh
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 7. Mär 2021, 11:39
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Multiple Lineare Regression mit Bootstrapping

Beitragvon strukturmarionette » Sa 17. Apr 2021, 20:18

Hi,

- zunächst berichten den Stichprobenumfang hier

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

folgende User möchten sich bei strukturmarionette bedanken:
jana_msh

Re: Multiple Lineare Regression mit Bootstrapping

Beitragvon PonderStibbons » Sa 17. Apr 2021, 20:20

Bootstrapping habe ich benutzt, da meine Residuen nicht normalverteilt waren und somit eine Annahme der MLR verletzt ist.

Das ist bei einer Stichprobengröße ab ca. n > 30 nicht von Belang.
SPSS spuckt mir jetzt 2 Tabellen aus: 'Koeffizienten' und 'Bootstrap für Koeffizienten'. Siehe Beispielbild anbei.
Die Zahlen sind war sehr ähnlich aber trotzdem unterschiedlich. Welchen Output muss ich in meiner Thesis beschreiben?
Wichtig sind mir die Signifikanzen (p-values) und Koefizienten.

Ich kann dem insegesamt keider nicht ganz folgen. Dies ist kein SPSS-Forum. & ich sehe kein Bild.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
jana_msh

Re: Multiple Lineare Regression mit Bootstrapping

Beitragvon jana_msh » Sa 17. Apr 2021, 21:38

Hallo zusammen,

meine Stichprobe sind 289 Fälle.
Ich muss leider alles mit Literatur begründen und habe nichts dazu gefunden, dass die Normalverteilungsannahme der Residuen bei einer gewissen Stichprobengröße hinfällig ist..

Ich kann aktuell leider, warum auch immer, kein Bild hochladen :/

TABELLE 1:

Koeffizientena
Modell Nicht standardisierte Koeffizienten Standardisierte Koeffizienten T Sig.
RegressionskoeffizientB Std.-Fehler Beta
1 (Konstante) 12.210 1.550 7.880 0.000
Connection to region -0.398 0.183 -0.132 -2.176 0.030


TABELLE 2:

Bootstrap für Koeffizienten
Modell RegressionskoeffizientB Bootstrapa
Verzerrung Std.-Fehler Sig. (2-seitig) BCa 95% Konfidenzintervall
Unterer Oberer
1 (Konstante) 12.210 0.082 1.581 0.000 9.069 15.671
Connection to region -0.398 0.004 0.175 0.025 -0.721 -0.051

Das sind die beiden Tabellen. Ich habe nur einen unabhängige Variable (connection to region) drinnen gelassen und der Übersichtlichkeit wegen alle anderen gelöscht.
jana_msh
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 7. Mär 2021, 11:39
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Multiple Lineare Regression mit Bootstrapping

Beitragvon PonderStibbons » Sa 17. Apr 2021, 22:38

Ich muss leider alles mit Literatur begründen und habe nichts dazu gefunden, dass die Normalverteilungsannahme der Residuen bei einer gewissen Stichprobengröße hinfällig ist..

Zentraler Grenzwertsatz. S.a. FAQ #4 in https://psychologie.uni-graz.at/de/biol ... -list/faq/

Davon ab, weiß ich nicht, wieso Du die Frage stellst. Wenn Du meinst, bootstrap ist erforderlich, dann berichtest
Du dessen Ergebnis. Wenn nicht, dann das Ergebnis der "normalen" Analyse.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Multiple Lineare Regression mit Bootstrapping

Beitragvon Manuelisus » Mo 14. Jun 2021, 15:09

Nach Bühner & Ziegler (2009, S. 674) ist erst bei Abwesenheit von residuellen Außreißern und zu-gleich 100 Fällen pro Bedingung eine Verletzung der Normalverteilung von Residduen als weniger problematisch bei Regressionsanalysen einzustufen Lumley, Diehr, Emerson und Chen (2002)

Entsprechend kann man nicht davon ausgehen das bei N = 30 die Residduen sich langsam der Normalverteilung annähern.

Andere Autoren schließen den zentralen Grenzwertsatz sogar vollständig aus.
Der zentrale Grenzwertsatz (CLT) sagt nichts über die Verteilung der Residuen in einem statistischen Modell aus.† Sie können normal sein oder nicht, abhängig von der zugrunde liegenden Verteilung der Fehlerterme. Der CLT ist ein Theorem, das die asymptotische Verteilung des standardisierten Stichprobenmittelwerts und anderer standardisierter Größen betrifft, die durch Summation von Variablen gebildet werden. Er wird leider so expansiv fehlinterpretiert, dass er auf alle möglichen Größen angewandt wird, auf die er nicht zutrifft. Die Fehlinterpretation der CLT als Behauptung der asymptotischen Normalität der zugrunde liegenden Werte, die im Modell verwendet werden, ist leider ein allgegenwärtiger Fehler.
Manuelisus
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mo 7. Okt 2019, 10:17
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Multiple Lineare Regression mit Bootstrapping

Beitragvon PonderStibbons » Mo 14. Jun 2021, 21:52

Allerdings verstehe ich das Argument nicht ganz.

https://en.wikipedia.org/wiki/Central_l ... Regression
Regression analysis and in particular ordinary least squares specifies that a dependent variable depends according to some function upon one or more independent variables, with an additive error term. Various types of statistical inference on the regression assume that the error term is normally distributed. This assumption can be justified by assuming that the error term is actually the sum of many independent error terms; even if the individual error terms are not normally distributed, by the central limit theorem their sum can be well approximated by a normal distribution.

Nebenbei geht es sowieso nicht darum, dass Residuen sich der Normalverteilung annähern (das kann nicht sein),
sondern ob die Standardfehler korrekt geschätzt werden.

Eine lineare Regression mit 1 binären Prädiktor ist übrigens vollkommen äquivalent einem t-Test.

Eine Reihe von Simulationsstudien konnte zeigen, dass nicht-normal verteilte Residuen bereits bei kleinen
Stichproben in der Regel kein Problem darstellen.

https://blog.minitab.com/en/adventures- ... n-analysis
https://www.jclinepi.com/action/showPdf ... %2930485-7
https://www.biorxiv.org/content/10.1101/498931v2.full

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron