Kovariate in Regression?

Alle Verfahren der Regressionanalyse.

Kovariate in Regression?

Beitragvon enidan » Do 9. Jun 2011, 12:49

hallo zusammen,

ich schreibe gerade meine MA und habe eine komische Frage:

meine Betreuerin meinte, ich muss, bevor ich eineRegressionsanalyse rechne, schauen ob bspw. das Alter oder die Betriebszugehörigkeit meine AV beeinflusst und mir dafür die Korrelation von Alter und meiner AV anschauen.

Nun habe ich eine Korrelation von .45 bei Betriebszugehörigkeit und AV (p<.05). Ist das nun eine Kovariate?
Was muss ich bei der regression nun berechnen? Muss ich das in SPSS eingeben?

ich bin für jede Antwort dankbar, konnte nichts in meinen Büchern finden.

LG
enidan
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Do 9. Jun 2011, 12:43
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Kovariate in Regression?

Beitragvon daniel » Do 9. Jun 2011, 13:54

enidan hat geschrieben:ich [...] habe eine komische Frage:

Ich zähle drei Fragen, die ich auch herausgegriffen habe. Leider wird bei keiner dieser Fragen klar, was Du konkret wissen möchtest.

Ist das nun eine Kovariate?

Ich verstehe die Frage nicht. Wenn Du sie als Kovariate benutzt, dann ist es eine, ansonsten nicht. Kovariate ist im Rahmen der Regression ein äquvivalenter Ausdruck zu "unabhängige Variable".

Was muss ich bei der regression nun berechnen?

Es ist mir schleierhaft, was Du hier wissen möchtest. Technisch werden im Rahmen der Regrssion Koeffizineten, Standardfehler, t-Werte, multiple Korrelationskoeffizinten, etc. geschätzt.
Da Du nichts zu Deiner Forschungfrage, Datengrundlage, etc. schreibst kann diese Frage inhaltlich nicht beantwortet werden.

Muss ich das in SPSS eingeben?

Was ist denn "das"?

Wenn Du wissen möchtest wie Du eine Regression in SPSS durchführst, schlage ich vor diese Frage in der entsprechenden Kategorie zu stellen.

[...]konnte nichts in meinen Büchern finden.

Nach was hast Du denn gesucht?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Kovariate in Regression?

Beitragvon enidan » Do 9. Jun 2011, 14:26

Entschuldige, ich habe mich wohl missverständlich ausgedrückt.

Laut meiner Dozentin muss ich überprüfen ob bpsw. das Alter eine Korrelation zu meiner Av (die ich in der regression habe) aufweist. Falls ja, soll ich sie als Kovariate in meiner Regression berücksichtigen

Das Ergebnis: .45 (auf einem Signifikanzniveau von 5%).

Wie gehe ich nun in meiner weiteren Berechnung mit dem Wert um? Das Ergebnis ist ja keine hohe Korrelation. Hat das Konsequenzen bei meiner Regressionsrechnung? Wenn ja, welche?

Muss ich das Alter nun in die Regressionsrechnung als UV immer mit aufnehmen?

Liebe Grüße
enidan
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Do 9. Jun 2011, 12:43
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Kovariate in Regression?

Beitragvon daniel » Do 9. Jun 2011, 19:56

enidan hat geschrieben:Das Ergebnis: .45 (auf einem Signifikanzniveau von 5%).
[...]Das Ergebnis ist ja keine hohe Korrelation.

Du hast nicht viel Erfahrung mit empirischen Daten oder? Korrelationen wie in Einführungslehrbüchern von 0.7 aufwärts findest Du vielleicht in ökonomischen Makrodaten, aber niemals in den Sozial- und Humanwissenschaften. Kurz: diese Korrelation ist relativ hoch.
Hat das Konsequenzen bei meiner Regressionsrechnung? Wenn ja, welche?

Kann ich nicht eindeutig beantworten, da ich das Modell nicht kenne. Wenn Du ein nicht-lineares Modell schätzt sind Deine Koeffizienten sicher verzerrt, bei einem linearen Modell höchst wahrscheinlich. Es wäre dann kein Problem, wenn Du ein lineares Modell schätzen würdest und Alter mit keiner Deiner Prädikatoren korrelieren würde. Das ist sehr unwahrscheinlich.

Muss ich das Alter nun in die Regressionsrechnung als UV immer mit aufnehmen?

In den meisten Fällen ja.

Mehr kann ich nicht sagen, wenn ich das Modell und weitere Informationen nicht habe, mit denen Du sehr sparsam bist.

Es wäre (gegeben genügend Zeit und Interesse) sicher auch eine gute Idee sich zumindest mal ein paar Einführungstexte zur Regression, die man da schätzen will anzuschauen. Ich persönlich finde es immer sehr unbefriedigend, wenn ich nicht weiß, was ich da eigentlich mache.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Kovariate in Regression?

Beitragvon Holgonaut » Fr 10. Jun 2011, 09:07

Hi,

als Zusatz möchte ich mal folgenden Artikel empfehlen:

Spector, P. E., & Brannick, M. T. (2011). Methodological urban legends: The misuse of statistical control variables. Organizational Research Methods, 14(2), 287-305.

Darin wird vor dem atheoretisch begründeten Gebrauch von Kontrollvariablen gewarnt.

Kurze Botschaft: Füge die Variablen als UVs in Deine Regression ein, von denen du theoretisch annimmst, dass sie einen Effekt haben
Bivariate Korrelationen sagen darüber nix aus - d.h. eine vorliegende Korrelation heißt nicht, dass die Variable einen Effekt hat und
eine n.s. Korrelation sagt nicht, dass die Variable keinen Effekt hat.

Gruß
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Re: Kovariate in Regression?

Beitragvon daniel » Fr 10. Jun 2011, 10:06

Holgonaut hat geschrieben:Kurze Botschaft: Füge die Variablen als UVs in Deine Regression ein, von denen du theoretisch annimmst, dass sie einen Effekt haben
Bivariate Korrelationen sagen darüber nix aus - d.h. eine vorliegende Korrelation heißt nicht, dass die Variable einen Effekt hat und
eine n.s. Korrelation sagt nicht, dass die Variable keinen Effekt hat.


Zunächst mal, danke für die Literatur. Des weiteren stimme ich zu, dass theoretische Überlegungen immer zentral sind. Aber, eine bivariate Korrelation mit dem Outcome und einem Deiner Prädikatoren führt zu verzerrtem Koeffizient für diesen Prädikator* -- Theorie hin oder her.

In nicht-linearen Modellen genügt schon die Korrelation zum Outcome.

Das Problem mit der theoretischen Begründung des Auslassens von Variablen betshet darin, dass die Tendenz/Versuchung groß ist, aus Faulheit haarsträubende Stories zu erfinden, warum diese oder jene Variable (gegeben bivariate Korrelation) nun multivariat keinen Einfluss haben soll.

Es ist natürlich ein Balance-Akt, das Modell korrekt zu spezifizieren. Wenn man sich aber die Konsequenzen der Vernachlässigung "wichtiger" Variablen (omitted variable bias) mit denen der Aufnahme "unwichtiger" Variablen (Effizienzverlust) vergleicht, tendiere ich dazu eher zu viel als zu wenig aufzunehmen, auch dann wenn nicht hinter jeder "Kontrollvariable" eine ausgereifte Theorie steht.

Leider lässt sich zum vorliegenden Fall immer noch nichts genaueres sagen, da wir nicht wissen welches Outcome denn nun modelliert werden soll.

* Zugegeben: falls der Koeffizient für diese omitted Variable im multivariaten Modell tatsächlich exakt Null ist (und wie wahrscheinlich ist das wohl), kommt es nicht zur Verzerrung.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Kovariate in Regression?

Beitragvon Holgonaut » Sa 11. Jun 2011, 19:25

Hi Daniel,

Aber, eine bivariate Korrelation mit dem Outcome und einem Deiner Prädikatoren führt zu verzerrtem Koeffizient für diesen Prädikator*

falls der Koeffizient für diese omitted Variable im multivariaten Modell tatsächlich exakt Null ist


Das ist ja der Punkt: An der Korrelation der Kovariaten siehst du das nicht. Wenn ihr Effekt (nicht "im Modell", sondern "in der Welt" ;) ) nicht vorhanden ist,
und sie mit dem Prädiktor korreliert, dann folgt eine Korrelation daraus. Aus der Korrelation rück-zuschließen auf eine verzerrene Wirkung, geht eben nicht.
Korrelationen folgen aus Effektmustern - nicht andersrum.

Ich stimm dir zu, lieber zu viel als zu wenig. Praxis ist aber, dass man sich über *wirklich* wichtige omitted variables keine Gedanken macht und dann standard-
mäßige KV (Alter, Geschlecht, Branche) reinnimmt. Und Spector et al. weisen eben auch korrekt darauf hin, dass einfaches Auspartialisieren manchmal (je
nach Rolle der KV im Modell) zur Verzerrung führt.

Das Problem mit der theoretischen Begründung des Auslassens von Variablen betshet darin, dass die Tendenz/Versuchung groß ist, aus Faulheit haarsträubende Stories zu erfinden, warum diese oder jene Variable (gegeben bivariate Korrelation) nun multivariat keinen Einfluss haben soll.


Das versteh ich nicht. Ich hab noch nie gesehen, dass jemand für KEINEN Effekt argumentieren musste. Man muss/sollte FÜR einen Effekt und damit Aufnahme
in das Modell argumentieren.

Gruß
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Re: Kovariate in Regression?

Beitragvon daniel » Sa 11. Jun 2011, 22:39

Holgonaut hat geschrieben:An der Korrelation der Kovariaten siehst du das nicht. Wenn ihr Effekt (nicht "im Modell", sondern "in der Welt" ;) ) nicht vorhanden ist,

Ich glaube wir sind beide (zumidest grob) der gleichen Meinung. Und dass man von Korrelationen nicht auf Effekte schließen kann, ist klar. Die interessante Frage ist, was ich aus dem Regressionskoeffizienten schließen soll/kann, der bereits durch Korrelationen verzerrt wird, nicht nur durch Effekte. In diesem Sinne kann der Artikel ein guter Denkanstoß sein, auch was Diskusionen um "gute" Instrumentvariablen angeht -- aber das ist ein anders Thema.

Ich denke, dass eine nicht vorhandene Beziehung zwischen Alter (oder Geschlecht) und anderen Variablen "in der Welt" meist eine Illusion ist. Natürlich hat Alter, versanden als bloße Zahl, keinen "Effekt" auf irgendetwas, aber es hängen soviele psychologische, biologische und soziologische Konstrukte mit dem Alter zusammen, dass ein "Nulleffekt" des Alters, verstanden als Proxy, wohl in den meisten Fällen theoretisch ausgeschlossen ist.

Ich hab noch nie gesehen, dass jemand für KEINEN Effekt argumentieren musste. Man muss/sollte FÜR einen Effekt und damit Aufnahme
in das Modell argumentieren.


Ich denke diese Argumentation hat meist zwei Seiten, die leider leicht verdeckt werden, wenn man in seinem Kämmerchen vor sich hin werkelt, weil es schwer sein kann verschiedene Perspektiven zu betrachten, wenn man von seinem Modell überzeugt ist. Aber sobald Du Dein Modell vor Fachpublikum präsentierst (sei es ein/e Dozent/in, sie es auf einer Konferenz oder der/die Reviewer eines Journals) und gefragt wirst, warum Du diese oder jene Variable nicht kontrolliert hast, dann musst Du Dich schon rechtfertigen und begünden, warum Du keinen Effekt prognostizierst. Wie oben bereits erwähnt sollte es bei Alter für Fachpublikum in den meisten Fällen relativ leicht sein, plausible Gründe anzuführen, die für eine Kontrolle sprechen.

Im hier vorliegenden Fall, gegeben einer bivariaten Korrelation, ist es m.E. schon zu begrüden warum man das Alter nicht kontrollieren muss. Wie kommt denn die Korrelation zustande, wenn es kein Effekt ist? Klar, gibt es darauf Antworten, aber die muss man m.E. auch explizit anführen, wenn man auf eine Kontrolle verzichten möchte.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Kovariate in Regression?

Beitragvon Holgonaut » Sa 11. Jun 2011, 23:54

Hi Daniel

Die interessante Frage ist, was ich aus dem Regressionskoeffizienten schließen soll/kann, der bereits durch Korrelationen verzerrt wird, nicht nur durch Effekte


Das versteh ich nicht. Ich weiß nicht, was du meinst, wenn du sagst, dass ein Regressionskoeffizient durch eine Korrelation verzerrt ist. Er ist dann verzerrt, wenn weitere Prädiktoren, die mit dem betreffenden Prädiktor korrelieren, nicht im Modell sind (u.a., mal die typischen anderen Gründe für Endogenität im Moment außen vor gelassen).

Zum zweiten Punkt: Wenn der Reviewer meint, die betreffende KV sollte ins Modell, so hängt es davon ab, was er/sie als Begründung angibt: a) weil man das immer so macht (Ritual), oder b) weil er/sie glaubt, dass sie einen Effekt hat. Nun ja, pragmatischerweise würde ich dann seiner Theorie folgen und es mal testen. Aber ich persönlich nehme die Prädiktoren in das Modell, von denen ich glaube, dass sie einen Effekt haben, oder zumindest es für möglich halte und eine verzerrende Wirkung ausschließen möchte.

Warum das bei Alter der Fall sein sollte, hängt vom Modell ab. Das kann mal sinnvoll sein. Aber wie gesagt: Die Korrelation zwischen Alter und der AV ist kein Grund. Wenn Alter mit dem Prädiktor korreliert, dann korreliert es *in der Folge* mit der AV: (r(KV,AV) = r(KV,Präd)*B(Präd,AV).

Ich denke, dass eine nicht vorhandene Beziehung zwischen Alter (oder Geschlecht) und anderen Variablen "in der Welt" meist eine Illusion ist. Natürlich hat Alter, versanden als bloße Zahl, keinen "Effekt" auf irgendetwas, aber es hängen soviele psychologische, biologische und soziologische Konstrukte mit dem Alter zusammen, dass ein "Nulleffekt" des Alters, verstanden als Proxy, wohl in den meisten Fällen theoretisch ausgeschlossen ist.


M.E. lieferst du selbst hier das Modell, dass Alter eine Kovariate der wesentlichen kausalen (z.B. biologischen) Variablen ist - ohne eigentlichen Effekt. Die Korrelation des Alters mit der/den AV ist eine reine Scheinkorrelation. Einbeziehung oder Ausschluss des Alters in Modellen mit diesen kausalen Variablen hätte daher keine Wirkung.

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Re: Kovariate in Regression?

Beitragvon daniel » So 12. Jun 2011, 00:41

Holgonaut hat geschrieben:[...] Er ist dann verzerrt, wenn weitere Prädiktoren, die mit dem betreffenden Prädiktor korrelieren, nicht im Modell sind

Entschuldige, ich schätze ich habe da ein bisschen was durcheinander geworfen. Bin wohl nicht so sehr konzentiert. Ich dachte darum geht es hier die ganze Zeit?

myself hat geschrieben:Wenn Du ein nicht-lineares Modell schätzt sind Deine Koeffizienten sicher verzerrt, [...]
Es wäre dann kein Problem, wenn Du ein lineares Modell schätzen würdest und Alter mit keiner Deiner Prädikatoren korrelieren würde.


Zum zweiten Punkt: Wenn der Reviewer meint, die betreffende KV sollte ins Modell, so hängt es davon ab, was er/sie als Begründung angibt: a) weil man das immer so macht (Ritual), oder b) weil er/sie glaubt, dass sie einen Effekt hat. Nun ja, pragmatischerweise würde ich dann seiner Theorie folgen und es mal testen. Aber ich persönlich nehme die Prädiktoren in das Modell, von denen ich glaube, dass sie einen Effekt haben, oder zumindest es für möglich halte und eine verzerrende Wirkung ausschließen möchte.

Pragmtisch muss der Reviewer nichts begründen -- leider. Wenn Du nicht begründest, warum Du die Variable nicht aufnimmst, wird der Artikel eben nicht gedruckt. Soviel zu dem, was Wissenschaft sein sollte und was sie tatsächlich (leider) ist.

Dein Vorgehen würde ich grundsätzlich unterschreiben. Es ging mir nur darum Situationen aufzuzeigen, die eine Argumentation, oder besser eine Verteidigung, der "nicht-Kontrolle" nötig machen.

Warum das bei Alter der Fall sein sollte, hängt vom Modell ab. [...]

Richtig. Allerdings nicht nur inhaltlich.

Die Korrelation zwischen Alter und der AV ist kein Grund [...]

, solange es ein lineares Modell ist, was aus dem Post nicht hervorgeht und auch schlecht rückgeschlossen werden kann, da das Outcome weder inhaltlich noch auf operationalisierter Ebene spezifiziert wird.

M.E. lieferst du selbst hier das Modell, dass Alter eine Kovariate der wesentlichen kausalen (z.B. biologischen) Variablen ist - ohne eigentlichen Effekt. Die Korrelation des Alters mit der/den AV ist eine reine Scheinkorrelation. Einbeziehung oder Ausschluss des Alters in Modellen mit diesen kausalen Variablen hätte daher keine Wirkung.

Das ist richtig. Der Koeffizient von Alter sollte dann in der Regrssion auch Null sein. Ich ging von dem Fall aus, bei dem wir nicht an der Wirkung dieser Variablen interessiert sind, sie also ledilich kontrolliert werden sollen. Wie in der Realität üblich, haben wir diese Variablen auch nicht (oder zumidest nicht erschöpfend) gemessen. Das Alter sollte dann m.E. zumindest als Proxy für die konfundierenden Faktoren kontrolliert werden.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 14 Gäste

cron