Variablentransformation

Alle Verfahren der Regressionanalyse.

Variablentransformation

Beitragvon Faktor153 » Mi 13. Mai 2020, 19:37

Hallo Zusammen,

ich untersuche in meiner Masterarbeit die Auswirkung einzelner UVs (13) u.a. (Unternehmensgröße, Verschuldungsgrad, etc.) auf eine AV. n=120
Jede Variable hat eine eigene Forschungshypothese.
Diesbezüglich habe mein Regressionsmodell mit allen 13 UV spezifiziert. y= alpha + ß1xUV1 +ß2xUV2....

Hier bewegen mich zwei Fragen:
1. Ich habe viele Ausreißer in den UVs. Diese habe ich bereits zum Großteil identifiziert und unter ökonomischen Gesichtspunkten die entsprechenden Beobachtungen eliminiert. Dennoch sind weiterhin wahrscheinlich Ausreißer enthalten. Ist dies extrem dramatisch? Mir ist bewusst, dass Ausreißer die Mittelwerte verzerren bzw. die Regressionsgerade verzerren.
2. Einige meiner UVs sind nicht normalverteilt. Meine Residuen des Modelles sind es aber (Shapiro Wilk Test, Jarque Berra Test)
Warum werden dann oft in Finanzuntersuchungen UV transformiert? Zwar sind einige meiner Daten extrem Schief und verfügen über Dicke Enden.
Zwar könnte hier eine ln transformation helfen. Mir ist aber nicht bewusst, warum ich dies machen sollte, weil ja dann die ökonomische Erklärung schwieriger wird.
Des Weiteren kann ich nicht alle UVs transformieren, da ich auch negative Werte habe.

Ich freue mich auf einen kurzfristigen Austausch
Faktor153
Einmal-Poster
Einmal-Poster
 
Beiträge: 1
Registriert: Mi 13. Mai 2020, 18:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Variablentransformation

Beitragvon PonderStibbons » Mi 13. Mai 2020, 20:13

ich untersuche in meiner Masterarbeit die Auswirkung einzelner UVs (13) u.a. (Unternehmensgröße, Verschuldungsgrad, etc.) auf eine AV. n=120

13 auf 120? Das ist sportlich.
1. Ich habe viele Ausreißer in den UVs.

Das klingt wie ein Widerspruch in sich. Wie ist Ausreißer hier definiert
und wodurch wird das bestimmt?
Diese habe ich bereits zum Großteil identifiziert und unter ökonomischen Gesichtspunkten die entsprechenden Beobachtungen eliminiert.

Du löscht Daten, die nicht ins Bild passen. Das wirkt nicht unbedingt sauber.
Was sind in dem Zusammenhang ökonomische Gesichtspunkte?

Statistisch bist Du in der Gefahr, ein überangepasstes Modell mit 13 Prädiktoren
bei gerade Mal 120 Fällen (120 vor oder nach der ökonomischen Eliminierung?)
und Eliminierung unpassender Fälle zu erzeugen.
Mir ist bewusst, dass Ausreißer die Mittelwerte verzerren bzw. die Regressionsgerade verzerren.

Deine Variablen haben vermutlich mannigfach einen natürlichen Nullpunkt
und womöglich eine sehr, sehr große Bandbreite (Unternehmensgröße?).
Falls ja, dann kann man nicht von Verzerren reden sondern von unsachgemäßer
Datenanalyse und Modellbildung. Sehr schiefe Daten mit "Ausreißern"
kann man aus sachlichen Gründen zum Beispiel erwägen zu logarithmieren.
2. Einige meiner UVs sind nicht normalverteilt.

Das ist allerdings unerheblich.
Meine Residuen des Modelles sind es aber (Shapiro Wilk Test, Jarque Berra Test)

Obacht. Kein Test kann belegen, dass Daten aus einer normalverteilten Grundgesamtheit stammen.
Allenfalls konnte man diese Hypothese nicht widerlegen. Aber bei n= 130 ist die Stichprobe
ohnehin groß genug, um auf Normalverteilung der residuen nicht mehr achten muss.
Warum werden dann oft in Finanzuntersuchungen UV transformiert?

Siehe oben, weil es inhaltlich und theoretisch Sinn ergibt. In welchem Fach ist die Masterarbeit?
Bei Ökonomen z.B. ist es meines Wissens nach bekannt und gepflegt, Variablen wie Einkommen,
Unternehmensgröße etc. pp. zu transformieren.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 12 Gäste

cron