Interpretation bivariate/multiple Regression

Alle Verfahren der Regressionanalyse.

Interpretation bivariate/multiple Regression

Beitragvon reutinfreak » Do 18. Mär 2021, 14:20

Hallo zusammen.

Ich befasse mich im Rahmen meiner Bachelorarbeit zum ersten mal mit Regressionsanalysen.
Ich habe zunächst zu all meinen erklärenden Variablen bivariate lineare Regressionsmodelle erstellt und anschließend ein multivariates.

Was kann ich daraus schließen, wenn einige Variablen in der bivariaten Regression nicht signifikant waren, jetzt aber in der multivariaten auf einmal signifikant sind? Multikollinearität besteht im Modell keine.
Außerdem ist das Vorzeichen bei beiden Variablen auch andersherum, als man es vermuten würde. Ich komme hierbei nicht wirklich weiter. Wie kann ich ein solches Verhalten interpretieren?


Liebe Grüße
Jonas
reutinfreak
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 18. Mär 2021, 14:09
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Interpretation bivariate/multiple Regression

Beitragvon PonderStibbons » Do 18. Mär 2021, 16:39

Was kann ich daraus schließen, wenn einige Variablen in der bivariaten Regression nicht signifikant waren, jetzt aber in der multivariaten auf einmal signifikant sind?

Schwer zu sagen. Signifikant/nicht signifikant sind keine informativen Angaben. Gegenstand der Analyse, Stichprobengröße, Zahl und Art der der Variablen, Beziehungen der Prädiktoren untereinander, Höhe der Korrelationskoeffizienten und Regressionskoeffizienten sind nicht genannt.
Außerdem ist das Vorzeichen bei beiden Variablen auch andersherum, als man es vermuten würde.

Ahso.
ch komme hierbei nicht wirklich weiter. Wie kann ich ein solches Verhalten interpretieren?

Wie soll man das wissen ganz ohne konkrete Informationen?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
reutinfreak

Re: Interpretation bivariate/multiple Regression

Beitragvon reutinfreak » Do 18. Mär 2021, 18:36

Hallo PonderStibbons und vielen Dank für Deine Antwort,

die Analyse soll den Einfluss verschiedener Merkmale auf den Lagewert von Wohnungen prüfen. Untersucht werden 138 Wohnungen, welchen einen Wohnlagewert zwischen 10 (sehr gut) bis 50 (sehr schlecht) aufweisen. Ich habe 14 erklärende Variablen, davon sind 3 Dummy-Variablen. Im multiplen Regressionsmodell enthalten sind davon 7 Variablen und 2 Dummy-Variablen enthalten:

- Milieu der Hedonisten (Dummy-Variable für Image)
- Milieu der Expeditiven (Dummy-Variable für Image)
- Durchgrünung
- Arbeitslosenquote
- Lärmbelastung
- Hangneigung
- Feinstaubbelastung
- Bebauungsdichte
- Entfernung zur nächsten ÖPNV Haltestelle

Konkret geht es um die beiden Merkmale Durchgrünung (also Grünanteil in %) und Bebauungsdichte (ebenfalls in %). Beide waren in den bivariaten Analysen insignifikant (p=0,841 und 0,313), in der multiplen Regression dann aber signifikant (p=0,019 und 0,013). Außerdem besagt mein Modell, dass ein höherer Grünanteil bzw. eine niedrigere Bebauungsdichte einen höheren Wohnlagewert zur Folge hat (also eine schlechtere Wohnlagequalität).

Ich weiß nun nicht, wie ich dieses Verhalten deuten soll.
Ich hoffe diese Informationen helfen weiter.


Liebe Grüße
Jonas
reutinfreak
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 18. Mär 2021, 14:09
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Interpretation bivariate/multiple Regression

Beitragvon PonderStibbons » Do 18. Mär 2021, 19:55

Könnte der Fall eines -> Suppressoreffekts sein. Werden andere Variablen mit berücksichtigt,
tritt die Beziehung zutage, die im bivariaten Fall verdeckt schien. Allerdings wüsste ich nach wie
vor gerne die Koeffizienten im bivariatenund multivariaten Fall. Dass es anscheinend in
die "verkehrte" Richtung geht, kann nicht an der Codierung der beiden UV liegen?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
reutinfreak

Re: Interpretation bivariate/multiple Regression

Beitragvon reutinfreak » Do 18. Mär 2021, 20:22

Hier die Koeffizienten im multivariaten Fall:
Bild
Die Koeffizienten für den bivariaten Fall sind einmal hier:
Bild
und einmal hier:
Bild
Was meinst Du mit der Codierung? Die Variablen wurden in % gemessen und anschließend logarithmiert.

Liebe Grüße
Jonas
reutinfreak
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 18. Mär 2021, 14:09
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Interpretation bivariate/multiple Regression

Beitragvon PonderStibbons » Do 18. Mär 2021, 23:21

Ja, das ist interessant. Grün ist mit Wert der Wohnlage nicht assoziiert. Bei gleichzeitiger Berücksichtigung von Milieu, Staub, Lärm usw.
ist mehr Grün assoziiert mit weniger wertvoller Wohnlage. Kann nicht sein? Nun kenne ich Kontext, Untersuchungspopulation oder auch
mögliche unberücksichtigte Drittvariablen nicht. Scheint mir eine Frage des Sachwissens zu sein, nicht so sehr eine methodische, das
zu interpretieren.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
reutinfreak

Re: Interpretation bivariate/multiple Regression

Beitragvon Holgonaut » Fr 19. Mär 2021, 09:38

Hallo Ihr beiden,

ich teile PonderStibbons Einschätzung, dass es ein Suppressoreffekt ist. Nur ist ein Suppressoreffekt halt ein Phänomen und keine Erklärung. M.E. dürfte der Grund sein, dass v.a. Bebauungsdichte ein Einflussfaktor der meisten anderen Prädiktoren ist aber keinen direkten Effekt auf den Lagewert hat. Im ökonometrischen Kontext spricht man von einer Instrumentalvariable. Wenn jetzt eine oder mehrere Prädiktoren a) keinen oder einen geringen Effekt auf den Lagewert haben und b) deren Beziehung durch ausgeschlossene confounder bedingt wird, entsteht das Suppressorphänomen.

Ergebnis ist, dass man einen verzerrten oder spurious Effekt der Prädiktoren und des Instruments bekommt. Das ist wichtig, weil Suppressoreffekte im psychologischen Kontexten oft als wichtiges und interessantes Phänomen betrachtet werden, die etwas "zu Tage" fördern, was die bivariaten Zusammenhänge verschleiern. Das Gegenteil ist der Fall: Hier sind bivariate Zusammenhänge oft valider als die multiple Regression. Das bezeichnet man auch als Z-Bias, der passiert, wenn man bei vorhandenem confounding ein Instrument kontrolliert.

Es gibt nun 3 Möglichkeiten.
1) Two-stage-least squares und nutzen der Bebauungsdichte als Instrument in der ersten Gleichung. Wäre mal interessant ob es das bringt
2) SEM, was dasselbe ermöglicht
3) Going exploratory mit dem freeware Programm TETRAD (googeln). Das ist sicher kein Orakel, aber kann unplausible Strukturen rauskegeln, einen Bereich legitimer Kandidaten ausgeben oder sogar den ein oder anderen Effekt klar identifizieren (unter der Restriktion der vorhandenen Daten und Variablen).

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

folgende User möchten sich bei Holgonaut bedanken:
PonderStibbons, reutinfreak

Re: Interpretation bivariate/multiple Regression

Beitragvon PonderStibbons » Fr 19. Mär 2021, 12:21

Wenn jetzt eine oder mehrere Prädiktoren a) keinen oder einen geringen Effekt auf den Lagewert haben und b) deren Beziehung durch ausgeschlossene confounder bedingt wird, entsteht das Suppressorphänomen.

Danke,das ist sehr hilfreich, vor allem der Hinweis darauf, dass die bivariaten Beziehungen valider sind/sein können.
Bei b) bin ich mir jetzt aber nicht sicher, welche Beziehung angesprochen ist.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Interpretation bivariate/multiple Regression

Beitragvon reutinfreak » Fr 19. Mär 2021, 12:35

Hallo und vielen Dank für eure Antworten.

Ich bin zwar immer noch ganz schön verwirrt, aber ich versuche mal auszudrücken, was ich denke verstanden zu haben.

    1.) Das Phänomen "bivariat=insignifikant; multivariat=signifikant" deute ich so:
    Die Durchgrünung und die Bebauungsdichte haben keinen direkten Einfluss auf den Lagewert, sondern auf andere Variablen, wie bspw. die Feinstaubbelastung (= Scheinkorrelation?). Wie kann ich rausfinden, auf welche Variablen sie Einfluss haben?
    2.) Eigentlich sollten die Koeffizienten beider Parameter gegen null gehen, da eine Scheinkorrelation vorliegt. Der Anteil der Durchgrünung (Koeffizient: 2,312) und der Bebauungsdichte (Koeffizient: -5,190), der ja in meinem Modell existiert (sogar mit "falschem" Vorzeichen), lässt sich vermutlich auf Variablen zurückführen, die nicht im Modell enthalten sind.

Sollten Durchgrünung/Bebauungsdichte dann aber trotzdem im Modell bleiben?

Meinst Du, die bivariaten Ergebnisse sind allgemein (von allen Parametern) valider, oder lediglich von der Bebauungsdichte und der Durchgrünung?

Zu den genannten Möglichkeiten:
1.) Das habe ich mal versucht, bin allerdings nicht weitergekommen. Weißt Du zufällig, ob das auch in JASP geht?
2.) SEM meint doch den Standardfehler, was genau soll ich damit machen?
3.) Habe versucht damit zunächst eine Regression zu machen. Hata auch geklappt, allerdings sind die Signifikanzen und Koeffizienten ziemlich unterschiedlich zu meinen Ergebnissen, welche ich in JASP erhalten habe.


Liebe Grüße
Jonas
reutinfreak
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 18. Mär 2021, 14:09
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Interpretation bivariate/multiple Regression

Beitragvon Holgonaut » Fr 19. Mär 2021, 14:46

PonderStibbons hat geschrieben:
Wenn jetzt eine oder mehrere Prädiktoren a) keinen oder einen geringen Effekt auf den Lagewert haben und b) deren Beziehung durch ausgeschlossene confounder bedingt wird, entsteht das Suppressorphänomen.

Danke,das ist sehr hilfreich, vor allem der Hinweis darauf, dass die bivariaten Beziehungen valider sind/sein können.
Bei b) bin ich mir jetzt aber nicht sicher, welche Beziehung angesprochen ist.


Hi, vielen Dank für das nette Feedback. Der Punkt b bezieht sich auf den Effekt der ursprünglichen Prädiktoren. Die Struktur des Problems sieht so aus

W --> X <---> Y

Der Doppelpfeil zeigt hier, dass die Beziehung zwischen X und Y spurious ist und durch einen oder mehrere unobserved confounder verursacht sind. Diese Struktur führt dazu dass
1) X und Y korrelieren bzw. X einen Regressionseffekt auf Y hat
2) W mit Y nicht korreliert
3) Es allerdings eine Korrelation von W und Y unter Kontrolle von X gibt
4) D.h. fügt man W als Kovariate in eine Regression von X auf Y ein, gibt es einen seltsamen "Effekt" von W auf Y und der "Effekt" von X auf X wird noch mal erhöht. Aber wie die Struktur zeigt, ist keiner dieser Effekte valide. Das zentrale Stichwort lautet hier "collider bias" (X ist ien collider auf dem Pfad , der X und Y verbindet.

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

folgende User möchten sich bei Holgonaut bedanken:
PonderStibbons

Nächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 12 Gäste

cron