Regressionsanalyse -> Problem bei Auswertung/Variablenwahl

Alle Verfahren der Regressionanalyse.

Regressionsanalyse -> Problem bei Auswertung/Variablenwahl

Beitragvon pilmeni123 » Mi 15. Mär 2017, 18:57

Hallo liebes Forum,

ich schreib grad an meiner Bachelorarbeit, die Zeit drängt ein wenig, und ich komme seit geraumer Zeit nicht weiter. Ich hoffe ihr könnt mir ein wenig weiterhelfen. Hab meine Frage in der Form leider nicht im Forum gefunden.

Ich muss in meiner Arbeit eine Regressionsanalyse durchführen (mache dies mit STATA). Diese soll auf die bestehende Literatur aufbauen, und um eigene Variablen erweitert werden. Die Variablen der Literatur hab ich beschrieben, meine Hypothesen aufstellt und diesbezüglich eigene unabhängige Variablen hinzugefügt (Dummys und stetige Variablen).

Nachdem ich erstmal alle neue Variablen dem in der Literatur verwendeten Modell hinzugefügt und eine Regression durchgeführt habe, kommt keine der Variablen unter dem gewünschten Signifikanzniveau (P-Wert < 0,1). Nach meinem Verständnis kann ich also keine Aussage treffen... ist leider kein schönes Ergebnis einer Bachelorarbeit. Zumal bei bestimmten Variablen eigentlich auf jeden Fall ein Einfluss erwartet wird.


Nun zu meiner Frage: (ich mache zum ersten mal eine Regression, habt bitte erbarmen :D):

1)Inwieweit kann man ein Modell jetzt modifizieren? Also ich kann jetzt bisschen mit den Variablen herumprobieren, bis gewünschte Variablen das Niveau erreicht haben. Aber dies ist ja sicherlich auch nicht Sinn einer wissenschaftlichen Arbeit. Bin mir auch nicht sicher ob ich die Variablen, welche ich als Basis nutze bzw. die Literatur verwendet hat, entfernen darf. (Es gibt ja die Rückwärtsselektion um Variablen zu entfernen)

2)Ist es überhaupt sinnvoll alle "meine" Variablen auf einen Schlag zu überprüfen? Oder wäre es besser schrittweise welche hinzuzufügen und dann mehrere Regressionen durchzuführen?


3 )Meine Idee war "stark" korrelierende Variablen erstmal zu entfernen. Mein Betreuer meinte aber, dass man Variablen nur wegen der Korreliertheit nicht aus einem Regressionsmodell entfernt. Weiß jetzt nicht nach welchen Kriterien ich neue Modelle finde..

4) Zur Interpretation: Wenn ich irgendwann in einem Modell eine Variable bekomme, die signifikanten Einfluss auf die abhängige Variable hat, in allen anderen Modellen jedoch nicht, kann ich dann trotzdem direkt die entsprechende Hypothese bestätigen?


Allgemein würde ich jetzt einfach verschiedene Modelle mit verschiedenen Variablen verwenden, und hoffe komme irgendwann zu einem signifikanten Ergebnis...
Ich hoffe das Problem ist einigermaßen verständlich formuliert....

Vielen Dank schonmal für jeden der sich die Mühe macht :)
Lieben Gruß
pilmeni123
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mi 15. Mär 2017, 18:21
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse -> Problem bei Auswertung/Variablenwa

Beitragvon PonderStibbons » Mi 15. Mär 2017, 21:42

Wie lauten denn Thema und Fragestellung der Arbeit, wie sah das Erhebungsdesign aus,
wie groß ist die Stichprobe
, was wurde gemessen und wie viele Variablen wurden in das
Regressionsmodell einbezogen,wie hoch war R² ?
1)Inwieweit kann man ein Modell jetzt modifizieren?

Warum? Wozu?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Regressionsanalyse -> Problem bei Auswertung/Variablenwa

Beitragvon pilmeni123 » Do 16. Mär 2017, 11:14

Hallo,
es geht um die Auswirkungen von Eigenschaften eines Emittenten auf einen Anleihenspreis (Spread). Habe diese Eigenschaften einem bestehenden Modell aus anleihenspezifischen Variablen hinzugefügt. Die bereinigte Stichprobe umfasst 366 Anleihen. OHNE Jahreseffekte hab ich ca 24 Variablen (10 eigene).
Mit meinen Variablen hat sich R^2 von 0,83 auf 0,85 verbessert.

Lieben Gruß
pilmeni123
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mi 15. Mär 2017, 18:21
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse -> Problem bei Auswertung/Variablenwa

Beitragvon PonderStibbons » Do 16. Mär 2017, 12:00

Mit meinen Variablen hat sich R^2 von 0,83 auf 0,85 verbessert.

Dein gesamter Variablensatz k=10 schafft demnach eine Verbesserung des herkömmlichen Modells um R² 0,02.
Wozu sollte man sich da weitere Überlegungen zu einzelnen Variablen machen?

Dass 14 (?) Variablen des herkömmlichen Modells vorliegen, lässt die Verbesserung des Modells durch weitere
Variablen von vornherein schwierig erscheinen, mit den bisher verwendeten Variablen niedrig korrelierte
neue Variablen gibt es vielleicht nicht. Und wenn man auch noch liest, dass das herkömmliche Modell fast
alle vorhersagbare Varianz bereits vorhersagt (je nachdem, was das für Variablen sind, die da enthalten sind,
könnten durchaus 15% Fehlerrauschen in der Gesamtvarianz stecken), fragt sich, welchem Zweck die Übung
dienen soll, das weiter verbessern zu wollen. Zudem wirkt eine Analyse mit 24 Variablen plus Jahresvariablen
bei gerade mal n=366 recht überladen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Regressionsanalyse -> Problem bei Auswertung/Variablenwa

Beitragvon pilmeni123 » Do 16. Mär 2017, 12:31

Hey Vielen Dank!

Also, wie Aufgabe ist bestehende empirische Ergebnisse um diese Eigenschaften zu ergänzen. Da diese renommierte Arbeiten sind, gehe ich auch von aus, dass deren Modell den Zusammenhang bereits gut wiederspiegelt. Nun soll ich halt die "Sponsoreneigenschaften" hinzufügen, da dieser Einfluss eben noch nicht abschließend untersucht wurde.

Nun komme ich mit meinem neuen Modell nicht zu neuen Erkenntnissen. Meine Idee ist halt Variablen zu entfernen bzw. das Modell zu modifizieren... vielleicht fehlt mir aber noch das allgemeine Verständnis was man nun machen kann.... "keine Aussage" ist kein schönes Ergebnis einer Bachelorarbeit :D

Die Jahreseffekte haben zum Beispiel einen hohen VIF. Könnte ich die einfach so rausnehmen, obwohl sie laut Literatur einen Einfluss haben?

Liebe Grüße
pilmeni123
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mi 15. Mär 2017, 18:21
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse -> Problem bei Auswertung/Variablenwa

Beitragvon PonderStibbons » Do 16. Mär 2017, 14:05

Nun soll ich halt die "Sponsoreneigenschaften" hinzufügen,

Gleich 10 davon?
da dieser Einfluss eben noch nicht abschließend untersucht wurde.

Nochmal, wenn das herkömmliche Modell schon fast alle Varianz aufklärt, wo bleibt
da der Spielraum für zusätzliche Variablen?

Man kann natürlich die Sponsorenvariablen mal für sich bezüglich ihrer Vorhersageleistung
untersuchen.

Nun komme ich mit meinem neuen Modell nicht zu neuen Erkenntnissen. Meine Idee ist halt Variablen zu entfernen bzw. das Modell zu modifizieren...

Warum? Wozu? Du kannst natürlich das bestehende Modell demolieren und ein neues basteln,
das dann womöglich 88% Varianz o.s.ä. aufklärt, vielleicht gibt es einen theoretischen oder
praktischen rund dafür. Allerdings wird das Ergebnis viel zu spezifisch auf Deinen Datensatz
zugeschnitten sein. Ein Regressionmodell mit derart vielen Prädiktoren anhand von gerade
mal 366 Fällen zu optimieren heißt zwangsläufig, Zufälligkeiten im Datensatz auszunutzen
und ein kaum übertragbares Modell zu erhalten.

vielleicht fehlt mir aber noch das allgemeine Verständnis was man nun machen kann.... "keine Aussage" ist kein schönes Ergebnis einer Bachelorarbeit :D

Sagt wer?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
pilmeni123

Re: Regressionsanalyse -> Problem bei Auswertung/Variablenwa

Beitragvon pilmeni123 » Do 16. Mär 2017, 14:34

Hey,

habe halt ein meine Hypothesen erstellt und so kommen die 10 neuen Variablen zustande. Wäre es dann sinnvoller nicht gleich alle 10 sondern jede Variable einzeln hinzuzufügen? Dann würde ich für jede Hypothese eine eigene Regression durchführen?

Ja klar ist es "keine Aussage" auch ein Ergebnis, ich dachte mir nur, dass man dagegen irgendwas machen kann und mein Modell dementsprechend verändere.

Auf jeden Fall vielen Dank für deine Mühe!
pilmeni123
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mi 15. Mär 2017, 18:21
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse -> Problem bei Auswertung/Variablenwa

Beitragvon pilmeni123 » Do 16. Mär 2017, 14:53

Also in der Hoffnung, dass starke Multikolinearität so verhindert/verbessert wird und ich für meine Variablen so singifikantere Ergebnisse bekomme.
Oder ist das auch nicht Sinn einer Regression.... ich hoffe meine Fragen sind nicht allzu "dumm"
pilmeni123
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mi 15. Mär 2017, 18:21
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse -> Problem bei Auswertung/Variablenwa

Beitragvon PonderStibbons » Do 16. Mär 2017, 15:26

habe halt ein meine Hypothesen erstellt und so kommen die 10 neuen Variablen zustande. Wäre es dann sinnvoller nicht gleich alle 10 sondern jede Variable einzeln hinzuzufügen? Dann würde ich für jede Hypothese eine eigene Regression durchführen?

Alle 10 gemeinsam schaffen 2% Varianzzuwachs, da wird eine einzelne weniger schaffen.
Das Grundproblem, zumindest wie es Deiner Darstellung zu entnehmen ist, wird damit
nicht gelöst: anscheinend sollte ein in Hinsicht auf die Vorhersageleistung nicht viel
verbesserbares Modell verbessert werden.

Wenn man in der Darstellung nur die einzelnen Koeffizienten und deren "Signifikanz" in
Betracht zieht, dann ist eben das Ergebnis der Studie, dass keine der 10 Variablen das
Modell verbessert.

Ja klar ist es "keine Aussage" auch ein Ergebnis,

Wenn Du meinst, dass das Ergebnis Deiner Analyse "keine Aussage" sei,
dann kann ich das leider nicht nachvollziehen. Wir reden doch die ganze Zeit von
ziemlich eindeutigen Aussagen, nämlich dass das etablierte Modell nicht
verbessert werden konnte (aus 2 möglichen Gründen - das Modell war von
vornherein fast maximal vorhersagefähig, oder die neuen Prädiktoren sind
nicht viel wert). Vielleicht ist die ganze Studienanlage unpassend, aber das
kann ich nicht beurteien bzw. ist Sache des Betreuers.
ich dachte mir nur, dass man dagegen irgendwas machen kann und mein Modell dementsprechend verändere.

Das ist beliebt und führt häufig zu überangepassten Modellen, das heißt zu
Ergebnissen, die nicht replizierbar und nicht generalisierbar sind.

Mit freundlichen GRüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Regressionsanalyse -> Problem bei Auswertung/Variablenwa

Beitragvon pilmeni123 » Do 16. Mär 2017, 16:07

Auch wenn ich es schon erwähnt habe, ich bin dir echt dankbar, dass du dich mit mir auseinandersetzt! Beschäftige mich zum ersten mal mit Statistik.

Also das Ziel der Arbeit ist Aussagen über den Einfluss verschiedener Sponsoreneigenschaften zu treffen. Also nach dem Motto: "Rückversicherer zahlen einen höheren Preis als andere Emittenten". Mit dem Einfluss anleihenspezifischer Variablen (die dann ein Großteil der Varianz erklären) hat sich die Literatur beschäftigt.
Mit "keine Aussage" meinte ich, dass ich zu keiner Variable (zB Dummy für Rückversicherer) signifikante Aussagen treffen kann, also alle P-Werte "zu hoch" sind. Also es geht mir primär nicht um das beste Modell, dass die Gesamtvarianz erklärt.

Deshalb dachte ich vielleicht jede Variable einzeln reinzunehmen (auf Kosten eines schlechteren Modells), aber so evtl. einen nierigen P-Wert der Variable zu erhalten, um die Hypothese zu bestätigen/abzulehnen. Oder wäre es besser alle Variablen in das Modell zu nehmen (da mehr Varianz erklärt), aber dann keine Aussage über den Einfluss dieser Variablen treffen zu können?

Lieben Gruß
pilmeni123
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mi 15. Mär 2017, 18:21
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Nächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 17 Gäste

cron