Mult. lin. Regression: Keine Korrelation zwischen UV u. AV

Alle Verfahren der Regressionanalyse.

Mult. lin. Regression: Keine Korrelation zwischen UV u. AV

Beitragvon zahlenwahn » Mo 3. Dez 2012, 18:55

Hallo allerseits!

Habe ein Problem, bei dem ich nicht so recht weiter komme.

Es ist so, dass ich ein multiples lineares Regressionsmodell mittels schrittweiser Regression berechne (dass dieses Verfahren nicht notwendigerweise das Beste ist, ist mir bewusst). Meine Prädiktoren bzw. "unabhängigen Variablen" üben im Regressionsmodell allesamt unterschiedliche starke signifikante Einflüsse auf die Zielvariable (bzw. "abhängige Variable", Kriterium) aus. Multikollinearität liegt nur in einem unkritischen Maße vor. Alle Prädiktoren haben auch unter Auspartialisierung der anderen noch einen Einfluss. Bis dahin alles gut.
Allerdings ist es so, dass bei einer einfachen Korrelationsmatrix (OHNE Berücksichtigung etwaiger statistischer Zusammenhänge der UVs) zwei der vier UVs KEINEN signifikanten Einfluss auf die AV haben. Der signifikante Einfluss kommt also nur in der Modellkombination in Verbindung mit den anderen zustande. Hierzu kommen meine Fragen:
- Wie heißt dieser Zustand in der korrekten Statistik-Sprache? Gibt es hierfür einen Begriff?
- Kennt jemand von Euch ein Lehrbuch o.ä., wo dies beschrieben ist, so dass ich mich darauf berufen kann?

Habt vielen Dank!
zahlenwahn
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mo 3. Dez 2012, 18:45
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Mult. lin. Regression: Keine Korrelation zwischen UV u.

Beitragvon daniel » Mo 3. Dez 2012, 19:13

Wie heißt dieser Zustand in der korrekten Statistik-Sprache? Gibt es hierfür einen Begriff?


Du möchtest nach "suppressor effects" suchen. Ein Anfang wäre: http://www.nd.edu/~rwilliam/stats2/l35.pdf
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

folgende User möchten sich bei daniel bedanken:
zahlenwahn

Re: Mult. lin. Regression: Keine Korrelation zwischen UV u.

Beitragvon zahlenwahn » Mo 3. Dez 2012, 19:28

Danke daniel, aber Suppressor-Variablen sind es grad nicht, denn die benannten UVs korrelieren untereinander nicht. Vielleicht habe ich mich etwas unbeholfen ausgedrückt.

Ich versuche es mal so:

Modell (vereinfacht): y = b1 * x1 + b2 * x2 + b3 * x3 + b4 * x4
- x1 und x2 korrelieren einzeln mit y
- x3 und x4 korrelieren einzeln nicht mit y
- x1, x2, x3 und x4 korrelieren untereinander nicht
- Werden die Einflüsse von x1 und x2 auf y auspartialisiert, korreliert x3 mit y
- Werden die Einflüsse von x1, x2 und x3 auf y auspartialisiert, korreliert x4 mit y
- Ein schrittweise berechnetes Regressionsmodell weist signifikante Einflüsse von x1, x2, x3 und x4 auf y aus
Sinngemäß: Der Einfluss von x3 und x4 wird erst unter Berücksichtigung der Kontrollvariablen (x1, x2) sichtbar.

Ich suche in erster Linie ein Beispiel aus der Literatur, wo es so ähnlich ist...
zahlenwahn
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mo 3. Dez 2012, 18:45
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Mult. lin. Regression: Keine Korrelation zwischen UV u.

Beitragvon Holgonaut » Mo 3. Dez 2012, 22:31

Hi,

das klingt sehr spooky...Wenn die vier Prädiktoren nicht untereinander korrelieren, sind Regressionskoeffizienten gleich, egal ob alle, 3, 2 oder nur ein Prädiktor im Modell ist....

Siehe (Simulation in R):
x1 = rnorm(20000)
x2 = rnorm(20000)
x3 = rnorm(20000)
x4 = rnorm(20000)
y = .8*x1 + .8*x2 + .8*x3 + .8*x4 + rnorm(20000)
data = as.data.frame(cbind(x1,x2,x3,x4,y))

summary(lm(y~x1+x2+x3+x4))
summary(lm(y~x1)) #Das kann man jetzt für alle durchnudeln - Die Regressionseffekte sind alle .8

Von da aus bin ich etwas verwirrt..

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Re: Mult. lin. Regression: Keine Korrelation zwischen UV u.

Beitragvon PonderStibbons » Mo 3. Dez 2012, 22:58

- x1 und x2 korrelieren einzeln mit y

Was heißt dies? |r| > 0.00 ? |r| > 0,2 oder ein anderer Grenzwert?
- x3 und x4 korrelieren einzeln nicht mit y
- x1, x2, x3 und x4 korrelieren untereinander nicht

D.h. r=0.00 bzw. r ist sehr klein?

Oder geht es präzise beschrieben um "inferenzstatistisch
signifikant" versus "inferenzstatistisch nicht signifikant"?
In dem Fall: wie hoch sind denn konkret die Koeffizienten?
Und wie groß ist die Stichprobe?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Mult. lin. Regression: Keine Korrelation zwischen UV u.

Beitragvon zahlenwahn » Di 4. Dez 2012, 01:33

Sorry, hab mich etwas unpräzise ausgedrückt.

Ich meine: die Variablen x1 und x2 haben bei einer einfachen Korrelation einen statistisch signifikanten (Irrtumswahrscheinlichkeit unter 5 bzw. unter 1%) Einfluss auf y (Korrelationskoeffizienten liegen betragsmäßig bei 0,4 bis 0,7). Die Variablen x3 und x4 haben bei einer einfach Korrelation keinen statistisch signifikanten Einfluss auf y (Korrelationskoeffizienten liegen betragsmäßig vielleicht bei 0,05 bis 0,1; Irrtumswahrscheinlichkeit liegt so bei 40-50%).

Wenn ich allerdings z.B. x3 und y auf einer partiellen Korrelation hin überprüfe und dabei x1 und x2 als Kontrollvariablen nehme ("auspartialisiere"), dann habe ich einen statistisch signifikanten Einfluss von x3 auf y, selbiges bei einer (stepwise) Regression.

Man könnte es auch so formulieren: Die Größen x3 und x4 haben nur in Kombination mit x1 und x2 einen signifikanten Einfluss auf y. Inhaltlich macht das übrigens sogar Sinn, aber das ist ne andere Geschichte.
zahlenwahn
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mo 3. Dez 2012, 18:45
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Mult. lin. Regression: Keine Korrelation zwischen UV u.

Beitragvon daniel » Di 4. Dez 2012, 12:26

Wird für jede Korrelation/Regression das gleich sample verwendet?

Ansonsten schließe ich mich Holger an, und klinke mich an dieser Stelle aus. Wenn die Prädikatoren untereinander nicht korrelieren (davon ist im letzten post übrigens gar nicht mehr die Rede), dann ist es im Prinzip nicht möglich, dass sich die Regressionsgewichte in den unterschiedlichen Modellen verändern.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 10 Gäste