Lineare Regression geeignet?

Alle Verfahren der Regressionanalyse.

Lineare Regression geeignet?

Beitragvon Statisiker- » Mi 21. Dez 2016, 13:00

Hallo zusammen,

meine Aufgabe besteht darin die jährliche Veränderung von betriebswirtschaflichen Kennzahlen mit der jährlichen Veränderung des Aktienkurses eines Unternehmens zu vergleichen und daraus schlüsse zu ziehen, ob bestimmte Kennzahlen signifikant mit dem Aktienkurs einhergehen.

Dazu habe ich die Daten von 45 Unternehmen über einen Zeitraum von 5 jahren. Es werden 10 Kennzahlen getestet.

Meine Idee war:

Lineare Regresson mit y = Veränderung des Aktienkurses und X = Veränderung einer Kennzahl

Das ganze dann 10mal für jede Kennzahl einzeln und das ganze dann mal 5 für alle Jahre ... Also 50 Regressionen.

Eine multiple Regression macht in meinen Augen keinen Sinn, da einige Zahlen zumindest teilweise die gleichen Ergebnisbestandteile enthalten und somit korrelieren sollten.

Jetzt wurde mir gesagt, dass dies ein Fall für eine Panelanalyse sei.

Darüber hinaus habe ich eine Arbeit gefunden, die einfach alle Jahre in eine Regression wirft pro Kennzahl, so dass man statt 45 Werte = 525 Werte hat pro Regression. Ein anderer Statistiker jedoch meinte, dass dies nicht in Ordnung sei und die p-Werte verletzen würde.

Hoffe hier kann man mir jemand das ganze etwas verständlicher erklären
Statisiker-
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Mi 21. Dez 2016, 12:51
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Lineare Regression geeignet?

Beitragvon bele » Mi 21. Dez 2016, 14:29

In Spanien gibt es zwei schöne, aus dem Werbefernsehen bekannte Städtchen namens Villariba und Villabajo. Ist soweit bekannt. Jemand hat schon lange die These, dass die Menschne in Villariba viel Feiern und wenig bauen und dass deshalb die Häuser ein Villariba kleiner sind als in Villabajo. Zufällig durch Münzwurf wird in jeder Stadt eine Baustelle als Stichprobe gewählt. Zufällig erwischen wir eine Baustelle, die nur 2 Stockwerke hoch gebaut wird und eine, die 3 Stockwerke hoch gebaut wird. Natürlich denken wir alle, dass je ein Haus pro Stadt als Stichprobe zu klein ist! (Merken!)

Aber wir wenden einen Trick an: 1 Jahr lang beobachten wir jeden Monat, wie hoch die Häuser sind. Im ersten Monat sind beide 1 Stockwerk hoch, im zweiten sind sie 2 Stockwerke hoch. Danach stagniert die Größe in Villariba für den Rest des Jahres bei 2 Stockwerken, während das in Villabajo für den Rest der Beobachtungen 3 Stockwerke hoch ist. Wir rechnen einen t-Test:

Code: Alles auswählen
riba <- c(1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2)
bajo <- c(1, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3)
t.test(riba, bajo, var.equal=TRUE)


und erhalten folgendes Ergebnis:
Code: Alles auswählen
t = -4.2121, df = 22, p-value = 0.0003594


Wunderbar. Mit p<0,001 können wir höchstsignifikant festhalten, dass Häuser in Villariba nicht so hoch gebaut werden wie in Villabajo. Was bei einmaliger Beobachtung irrelevant war, ist jetzt höchst signifikant, weil wir ein paar Mal öfter hingeguckt haben.


Warum erzähle ich dieses Beispiel? Weil es die Tücken von Zeitreihen darstellt. Eine Voraussetzung meines t-Tests ist, dass die Beobachtungen unabhängige Stichproben, gezogen aus identischer Verteilung, sind. Verletzt man diese Voraussetzung, führt der t-Test zu völlig falschen Schlüssen. Weil Du Jahr für Jahr die gleichen 45 Unternehmen untersuchst, verletzt auch Du die Voraussetzung der unabhängigen Beobachtungen aus identischer Verteilung. Deshalb kann Dich die "ganz einfache lineare Regression" in die völlig falsche Richtung lenken und Du musst Dich mit Spezialverfahren für Zeitreihen, wie die Panelregression, einarbeiten.

Hoffe, das war so allgemein verständlich.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

folgende User möchten sich bei bele bedanken:
Statisiker-

Re: Lineare Regression geeignet?

Beitragvon Statisiker- » Mi 21. Dez 2016, 17:10

Hallo Bernhard,

vielen Dank für die Erklärung. Also werde ich mich mit dem Thema Panelregression beschäftigen. Hatte da schon mal drüber geguckt und gesehen, dass es eine pooled. fixed effect und random effect Methode gibt, wobei die pooled ziemlich ähnlich zu einer multiplen linearen Regression sein soll.

Kannst du da zufällig gute Einführungsliteratur empfehlen?
Statisiker-
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Mi 21. Dez 2016, 12:51
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Lineare Regression geeignet?

Beitragvon bele » Mi 21. Dez 2016, 18:03

Sorry, von mir gibt es keine Literaturempfehlung, weil ich mich da gar nicht auskenne.
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Lineare Regression geeignet?

Beitragvon Statisiker- » Do 22. Dez 2016, 00:30

Alles klar. Dann werde ich die Bücherei mal umwälzen. Habe mir heute 2 Arbeiten besorgt, die Ergebnisse einer Paneldaten Analyse unter ähnlicher Fragestellung angeführt haben.

Dort wurden jedoch direkt alle 10 Kennzahlen über alle Jahre auf einmal getestet. Also in Form einer multiplen Regression (sowohl pooled, fixed effects und random effects)

Ich finde einzelne Regressionen jedoch eigentlich aussagekräftiger. In allen Beispielen, die ich bisher gefunden habe, wurden jedoch immer mindestens 2 erklärende Variablen in die Gleichung aufgenommen. Ist das mit nur einer variable evtl gar nicht in Ordnung?
Statisiker-
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Mi 21. Dez 2016, 12:51
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 13 Gäste

cron