Hey!
Vielleicht sollte ich mich gleich vorweg für diesen und wahrscheinliche weitere Threads entschuldigen, aber ich bin grade dabei meine Diplomarbeit zu schreiben und hätte da ein paar eher grundlegende Fragen. Viele von euch kennen wahrscheinlich die Situation, dass man nach einem "Basic"-Statistikkurs ein empirisches Meisterwerk aus dem Arm schütteln soll Vielen Dank daher gleich mal an alle die mir ein wenig aus der Patsche helfen! Ich werde versuchen die Fragen so einfach und genau wie möglich zu stellen, damit sie kurz und knapp beantwortet werden können (sorry, dass alle Begriffe auf Englisch sind => der Kurs war auf Englisch ).
Vielleicht kurz grob zum Projekt: es geht um die Entlohnung von Führungskräften (cross-sectional, vorerst mal nur 1 Jahr betrachtet, lin. mult. regr.), als Programm verwende ich entweder Excel oder SPSS
Folgende Fragen hätte ich:
1) ad Kontrollvariablen:
Wie kontrolliere ich neben den hauptsächlich erklärenden unabhängigen Variablen (interval/ratio data) für verschiedene Branchen/Länder (nominal data)? Angenommen ich habe 3 Länder => 2 Dummies und je nach Signifikanz eine Aussage darüber ob Unterschiede zwischen den Ländern bestehen oder 3 Regressionen und vergleichen, ob die unabhängigen Variablen für jede Region signifikant sind? Vorteile/Nachteile?
2) ad Varianz erklärt durch einzelne unabhängige Variablen
Leider führte ein früher schon geposteter Thread zu diesem Thema ins Leere, daher nochmal die gleiche Frage. R² gibt mir die Erklärungskraft des Modells als Ganzes an => wieviel Varianz wird aber durch die einzelnen unabhängigen Variablen erklärt? Kann ich durch die beta-weights aus SPSS bzw. durch das Standardisieren der Daten den Einfluss der Koeffizienten auf die abhängige Variable auf die Gesamterklärungskraft prozentuell umlegen?
3) ad Relative/Absolute Vergleiche in Regression
Angenommen ich will vereinfacht folgenden Zusammenhang testen => die Veränderung von Gehältern (abhängige Variable) in Abhängigkeit zur Veränderung des Marktwertes der Unternehmen (eine der unabhängigen Variablen). Das Sample umfasst allerdings unterschiedlich große Firmen und somit sollte der Zusammenhang im obersten bzw. untersten Quartil ein anderer sein (wenn man die Firmen trennen würde), ich nehme mal an, dass der Koeffizient bei größeren Firmen geringer wäre und bei kleineren Firmen höher. Wie sieht es nun aus, wenn ich relative Größen nehme => also die prozentuelle Änderung des Gehalts vs. die prozentuelle Änderung des Marktwertes. Wie würdet ihr dieses Problem (unterschiedliche Firmengröße) angehen?
4) ad LOG
Ist vielleicht mit Punkt 3 verbunden. In diesem Kurs haben wir gelernt, dass die log-lineare Regression benutzt wird um alles in Form von Elastizitäten auszudrücken. Lässt sich damit Punkt 3 lösen? Eigentlich nicht oder - die Elastizitäten wären für die unterschiedlichen Quartile ebenfalls anders. Ich habe in einigen Papers gesehen, dass die abhängige Variable als absolut festgelegt wurde, die unabhängigen teils absolut und teils als LN(Variable). Ich habe mal gelesen, dass der Logarithmus die Verteilung einzelner Variablen "bereinigen" kann, um sie normaler zu "hinzubiegen". Gibt es auch noch andere Gründe, warum ich den Logarithmus von einer Variable in die (normale, absolute) Regression integriere?
Ich weiß...Fragen über Fragen. Wär euch wirklich dankbar, wenn sich wer darum annehmen würde.