Hallo,
ich schreibe aktuell an meiner Masterarbeit und muss hierfür eine Regressionsanalyse durchführen. Das Thema der Masterarbeit ist nachzuweisen, dass es einen Zusammenhang zwischen der Zinsdifferenz eines Landes (im Vergleich zur Benchmark Deutschland) und dem Rating eines jeweiligen Landes gibt. Die Idee dazu entstammt einem wissenschaftlichen Paper.
Mein Datensatz besteht aus 10 Ländern, bei denen jeden Monat das Rating und die entsprechende Zinsdifferenz erfasst wird.
Mein Vorgehen war wie folgt:
1. Scatterplot erstellen:
X-Achse= numerische transformierte Rating (Zahl 20= Rating "AAA" =sehr sehr gutes Rating; Zahl = Rating "D" = sehr sehr schlechtes Rating)
y-Achse= Zinsdifferenz
--> Lineare Regression (wie im ursprünglichen Paper)
2. Berechnung der Regression:
Regressionsgleichung: Zinsdifferenz= Konstanter Term + Regressionskoeffizient * Rating + Störterm
Die abhängige Variable Zinsdifferenz ist eine metrisch.
Die unabhängige Variable Rating ist in ihrer ursprünglichen Form ( Rating von "AAA" bis "D") bzw. in ihrer numerisch transformierten Form (Zahl "20" bis Zahl "0") eine ordinale Variable.
Berechnung mittels SPSS: Analysieren--> Regression--> Linear--> abhängige Variable Zinsdifferenz und unabhängige Variable Rating--> Berchnen
3. Überprüfung der Ergebnisse und der Modellprämissen:
Ich überprüfe die Modellprämissen:
1. Linearität der Parameter?--> Nach Betrachtung des Scatterplots in Schritt 1--> passt!!
2. Erwartungswert der Residuen =0? --> passt!!
3. Berücksichtigung aller relevanten Variablen? -->Würde ich sagen passt(!!!) auch als Annahme
4. Homoskedastizität der Residuen (siehe Anhang "Homoskedastizität")? Wenn ich mir die Grafik angucke erkenne ich keine klare Homoskedastizität, jedoch verwirrt mich der senkrechte parallele Verlauf der standardisierten geschätzten Werte? Muss ich mir darum Gedanken machen? Liegt die Ursache in der ordinalen unabhängigen Variablen?
5. Autokorrelation der Residuen/Störgrößen. Hierfür führe ich den Durbin-Watson-Test durch. Die Werte meiner verschiedenen Regressionen liegen alle zwischen 0,1 bis 0,4. Dies bedeutet positive Autokorrelation.
6. Störgrößen sind normalverteilt. --> passt nicht zu 100%, jedoch geht es in diese Richtung (siehe Anhang " Normalverteilung")
Soweit der Ablauf meiner Regression, hieran schließen sich meine Fragen an und ich danke erstmal Allen, die bis hierhin gelesen haben und erst recht danke ich Allen, die möglicherweise eine Antwort haben
1. Frage: Ist meine Vorgehen soweit korrekt?
2. Frage: Ist es möglich eine lineare Regression durchzuführen, wobei die unabhängige Variable ordinal ist und die abhängige Variable metrisch ist?
3. Frage: Ist es korrekt, dass es sich bei meiner Analyse um keine Zeitreihenanalyse handelt, obwohl ich die Zinsdifferenz und das Rating jeden Monat erfasse? Liegt der Grund dafür dass es keine Zeitreihenanalyse darin, dass in meiner Regressionsanalyse der Faktor des zeitlichen Verlaufs der abhängigen und unabhängigen Variable keine Rolle spielt und ich stattdessen über die Grundgesamtheit regressiere?
4. Frage: Liegt wirklich keine merkliche Homoskedastizität vor (siehe Anhang)? Welche Ursache hat der senkrechte parallele Verlauf der Residuen? Liegt dass an der ordinalen unabhängigen Variablen (siehe Ausführung oben)? Muss ich mir darum Gedanken machen? Welche Lösungsmöglichkeiten gibt es?
5. Frage: Bei der Berechnung der Autokorrelation erhalte das Ergebnis positive Autokorrelation (siehe oben). Welche Ursache kann das haben? Ist das Problem der Autokorrelation für mich ein überhaupt relevantes, da ich gelesen habe, dass Autokorrelation hauptsächlich bei mein Zeitreihenanalysen auftritt und ich ja keine durchführe (siehe Frage 3). Falls es doch für mich relevant ist, welche Lösungsmöglichkeiten gibt es in meinem Fall?
Vielen Dank an Alle, die eine Antwort auf eine meiner Fragen habe und mir möglicherweise mit einem Tipp/Link weiterhelfen können...