Diverse Fragen zur Regression

Alle Verfahren der Regressionanalyse.

Diverse Fragen zur Regression

Beitragvon clueless » Do 4. Okt 2012, 15:54

Hey!

Vielleicht sollte ich mich gleich vorweg für diesen und wahrscheinliche weitere Threads entschuldigen, aber ich bin grade dabei meine Diplomarbeit zu schreiben und hätte da ein paar eher grundlegende Fragen. Viele von euch kennen wahrscheinlich die Situation, dass man nach einem "Basic"-Statistikkurs ein empirisches Meisterwerk aus dem Arm schütteln soll ;) Vielen Dank daher gleich mal an alle die mir ein wenig aus der Patsche helfen! Ich werde versuchen die Fragen so einfach und genau wie möglich zu stellen, damit sie kurz und knapp beantwortet werden können (sorry, dass alle Begriffe auf Englisch sind => der Kurs war auf Englisch :P).

Vielleicht kurz grob zum Projekt: es geht um die Entlohnung von Führungskräften (cross-sectional, vorerst mal nur 1 Jahr betrachtet, lin. mult. regr.), als Programm verwende ich entweder Excel oder SPSS
Folgende Fragen hätte ich:

1) ad Kontrollvariablen:
Wie kontrolliere ich neben den hauptsächlich erklärenden unabhängigen Variablen (interval/ratio data) für verschiedene Branchen/Länder (nominal data)? Angenommen ich habe 3 Länder => 2 Dummies und je nach Signifikanz eine Aussage darüber ob Unterschiede zwischen den Ländern bestehen oder 3 Regressionen und vergleichen, ob die unabhängigen Variablen für jede Region signifikant sind? Vorteile/Nachteile?

2) ad Varianz erklärt durch einzelne unabhängige Variablen
Leider führte ein früher schon geposteter Thread zu diesem Thema ins Leere, daher nochmal die gleiche Frage. R² gibt mir die Erklärungskraft des Modells als Ganzes an => wieviel Varianz wird aber durch die einzelnen unabhängigen Variablen erklärt? Kann ich durch die beta-weights aus SPSS bzw. durch das Standardisieren der Daten den Einfluss der Koeffizienten auf die abhängige Variable auf die Gesamterklärungskraft prozentuell umlegen?

3) ad Relative/Absolute Vergleiche in Regression
Angenommen ich will vereinfacht folgenden Zusammenhang testen => die Veränderung von Gehältern (abhängige Variable) in Abhängigkeit zur Veränderung des Marktwertes der Unternehmen (eine der unabhängigen Variablen). Das Sample umfasst allerdings unterschiedlich große Firmen und somit sollte der Zusammenhang im obersten bzw. untersten Quartil ein anderer sein (wenn man die Firmen trennen würde), ich nehme mal an, dass der Koeffizient bei größeren Firmen geringer wäre und bei kleineren Firmen höher. Wie sieht es nun aus, wenn ich relative Größen nehme => also die prozentuelle Änderung des Gehalts vs. die prozentuelle Änderung des Marktwertes. Wie würdet ihr dieses Problem (unterschiedliche Firmengröße) angehen?

4) ad LOG
Ist vielleicht mit Punkt 3 verbunden. In diesem Kurs haben wir gelernt, dass die log-lineare Regression benutzt wird um alles in Form von Elastizitäten auszudrücken. Lässt sich damit Punkt 3 lösen? Eigentlich nicht oder - die Elastizitäten wären für die unterschiedlichen Quartile ebenfalls anders. Ich habe in einigen Papers gesehen, dass die abhängige Variable als absolut festgelegt wurde, die unabhängigen teils absolut und teils als LN(Variable). Ich habe mal gelesen, dass der Logarithmus die Verteilung einzelner Variablen "bereinigen" kann, um sie normaler zu "hinzubiegen". Gibt es auch noch andere Gründe, warum ich den Logarithmus von einer Variable in die (normale, absolute) Regression integriere?

Ich weiß...Fragen über Fragen. Wär euch wirklich dankbar, wenn sich wer darum annehmen würde.
clueless
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 4. Okt 2012, 15:01
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Diverse Fragen zur Regression

Beitragvon PonderStibbons » Fr 5. Okt 2012, 08:28

Ein unterschiedlich enger Zusammenhang zwischen zwei Variablen je
nach Ausprägung einer weiteren Variable ist eine Wechselwirkung.
Wechselwirkungen lassen sich als Produkt der beteiligten Prädiktoren
in das Modell aufnehmen.

Zur Interpretation des Einflusses korrelierter Prädiktoren kannst Du
recherchieren nach Strukturkoeffizienten / structure coefficients in
multiple regression.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Diverse Fragen zur Regression

Beitragvon clueless » Di 23. Okt 2012, 16:12

Vielen Dank für die Antwort!
Ich hab jetzt bewusst ein wenig gewartet ob noch spezifischere Dinge kommen, aber vielleicht lässt sich damit ja schon ein Großteil der Probleme bewältigen.

PonderStibbons hat geschrieben:Ein unterschiedlich enger Zusammenhang zwischen zwei Variablen je
nach Ausprägung einer weiteren Variable ist eine Wechselwirkung.
Wechselwirkungen lassen sich als Produkt der beteiligten Prädiktoren
in das Modell aufnehmen.


Ich nehme an du beziehst dich damit auf 1) ad Kontrollvariablen.
Ich schreib mal wie ich mir das erkläre und würde dich/euch bitten dem ggF zuzustimmen bzw. es zu korrigieren.
Sagen wir ich hätte vereinfacht folgende Regression: abhängige variable (Gehalt) / unabhängige variablen (Firmengröße, Profitabilität, Alter, Land) und möchte jetzt einfach testen, ob es Unterschiede in den einzelnen Ländern gibt.
Wenn ich nur generell wissen will, ob es einen Unterschied gibt (ohne spezifischer zu werden), reicht es wenn ich für Land einen Dummy anlege (bzw. Anzahl der Möglichkeiten-1 Dummies) und schaue, ob einer der Dummies signifikant ist. Wenn ichs genauer wissen will, mache ich einen Interaktionsterm und multipliziere meine Dummies mit sämtlichen unabhängigen Variablen und schaue wieder ob etwas signifikant ist oder nicht (Änderung der Steigung - signifikant ja/nein).
Habe ich das so richtig verstanden?

PonderStibbons hat geschrieben:Zur Interpretation des Einflusses korrelierter Prädiktoren kannst Du
recherchieren nach Strukturkoeffizienten / structure coefficients in
multiple regression.


Ich nehme an du beziehst dich damit auf 2) ad Varianz erklärt durch einzelne unabhängige Variablen
Ich schreib wieder mal wie ich mir das erkläre und würde dich/euch bitten dem ggF zuzustimmen bzw. es zu korrigieren.
Die beta-weights aus SPSS sind die Koeffizienten die ich erhalten würde, wenn ich meine Daten vor Durchführung der Regression standardisiere (minus Mittelwert / STABW). Somit bekomme ich eine unverfälschtere Vorstellung davon wieviel Einfluss die einzelnen unabhängigen Variablen auf meine abhängige Variable haben. Sofern die einzelnen Prädikatoren untereinander nicht korreliert sind (was ja so gut wie nie vorkommt) würden mir die quadrierten beta-weights jeweils die Varianz liefern, die von den einzelnen unabhängigen Variable erklärt wird und in Summe R² ergeben (somit eigentlich nichts anderes als die normalen Korrelationskoeffizienten zwischen der abhängigen und jeweils einer unabhängigen Variable). Sofern verschiedene Prädikatoren aber korreliert sind wird die Aussage der beta-weights verfälscht und die einzelnen Korrelationskoeffizienten würden in Summe mehr als R² ergeben (da die gemeinsame Varianz öfter gerechnet würde).
Mit Strukturkoeffizienten löse ich dieses Problem indem ich mir jeweils die Korrelation zwischen den unabhängigen Variablen und dem Erwartungswert der Regression anschaue. In Summe ergeben meine quadrierten Strukturkoeffizienten immer 1.00. Wenn ich jetzt wissen will, wieviel mir eine einzelne unabhängige Variable erklärt, muss ich einfach nur den quadrierten Strukturkoeffizienten mit R² multiplizieren und ich hab mein Ergebnis.
Passt so, oder?

Wäre toll, wenn sich noch jemand den Punkten 3 und 4 annehmen könnte.
Vielen Dank gleich mal!
clueless
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 4. Okt 2012, 15:01
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 12 Gäste

cron