Regressionsanalyse zwei unabhängige Variablen

Alle Verfahren der Regressionanalyse.

Regressionsanalyse zwei unabhängige Variablen

Beitragvon Djef.R » Sa 11. Jun 2011, 09:24

Hallo an alle,
im Rahmen einer Studienarbeit soll ich eine Regressionsanalyse erstellen und diese anschließend beurteilen.
In diesem Kontext stellt sich mir die Frage wie ich die Regressionsanalyse am besten angehe.

Mir steht das Programm SPSS zur Verfügung und ich habe eine unabhängige (Patente) und abhängige Variable (Umsatz).
Das Problem ist dass sich die unabhängige Variable in 2 Klassifikationen unterteilt (Technologiepatente & Prozesspatente).
Normalerweise würde ich zunächst die eine Klassifikation und dann die anderen Klassifikation in die Regressionsanalyse einbauen.
Kann man die Klassifikationen irgendwie verbinden sodass ich die Regressionsanalyse in einem durchführen kann?

Oder gibt es andere Meinungen?

LG
Djef.R
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 11. Jun 2011, 09:22
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse zwei unabhängige Variablen

Beitragvon PonderStibbons » Sa 11. Jun 2011, 13:24

Sicher. Das nennt man multiple Regression.

Gruß

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Regressionsanalyse zwei unabhängige Variablen

Beitragvon Djef.R » Fr 24. Jun 2011, 03:05

Wie schon erwaehnt untersuche ich ob man einen Zusammenhang zwischen Technologie - und Geschaeftsprozesspatenten und dem Unternehmenserfolg (Umsatz, Marktkapitalisierung, Kurs Gewinn-Verhaeltnis) nachweisen kann. Dementsprechend sollen zwei unabhaengige Variablen auf jeweils drei abhaengige Variablen. Diese Untersuchung erfolgt an 4 Unternehmen aus der Mobilfunkbranche. Dementsprechen einige Regressionen die sie untersuchen sind. Jetzt bin ich mir nur nicht ganz sicher welche Regression ich anwenden soll.

Einfache Lineare Regression oder Multiple Lineare Regression?
Bei der Multiplen linearen Regression besteht ja das Problem der Multikollinearität.
Was wuerdet Ihr mir bei dieser Datenreihe empfehlen?

Hier mal ein Beispiel von einem der vier Unternehmen:

Technologiepatente
Jahr Patentanmeldungen
1998 1
1999 1
2000 42
2001 148
2002 198
2003 375
2004 674
2005 599
2006 739
2007 743
2008 739
2009 459
2010 77

Geschaeftsprozesspatente
Jahr Patentanmeldungen
1998 1
1999 0
2000 3
2001 4
2002 3
2003 9
2004 11
2005 4
2006 18
2007 10
2008 21
2009 15
2010 1



Umsatz in Mio.
1998 5941
1999 6134
2000 7983
2001 5363
2002 5742
2003 6207
2004 8279
2005 13931
2006 19315
2007 24578
2008 37491
2009 42905
2010 65225

Marktkapitalisierung in Mio
1998 5238.73
1999 10398.2002
2000 8367.9531
2001 5441.1001
2002 5282.8008
2003 7500.144
2004 14465.7266
2005 44146.918
2006 65472.1211
2007 133463.7969
2008 113604.7031
2009 163370.0938
2010 267052.7188

Kurs-Gewinn-Verhaeltniss
1998 20.5026
1999 25.1696
2000 15.2367
2001 18.7295
2002 44.6061
2003 98.5238
2004 49.72
2005 34.3226
2006 33.9119
2007 39.0509
2008 18.9145
2009 20.0848
2010 19.295


Ausserdem hier mal die Ergebnisse der Multiplen linearen Regression:

Technologie und GPP Patente -> Umsatz

R=.749 Rsquare=.561 adj. Rsuqare=.473 F=6.383 Sig.=.016
Unstandardized Coefficients:
Constant B=24557.800 Std. Error=6138.491 t=4.001 Sig=.003
Tech_Pat B=26.342 Std. Error=22.903 Beta .426 t=1.150 Sig.=.227
GPP_Pat B=968.808 Std. Error=1005.953 Beta .357 t=.963 Sig=.358

Meint ihr die multiple lineare Regression macht Sinn? Oder soll ich lieber jeweils Technolgie Patente auf die drei Erfolgsvariablen per einfacher linearen Regression und dan GPP-Patenten per einfacher linearer Regression untersuchen?

Wuerde mich ueber Tipps zum richtigen Verfahren und ob die Ergebnisse Sinn machen...

In dem Sinne vielen Danke im Voraus.... :)
Djef.R
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 11. Jun 2011, 09:22
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse zwei unabhängige Variablen

Beitragvon daniel » Fr 24. Jun 2011, 12:59

Djef.R hat geschrieben:Diese Untersuchung erfolgt an 4 Unternehmen aus der Mobilfunkbranche. [...]Jetzt bin ich mir nur nicht ganz sicher welche Regression ich anwenden soll.

Klingt als wäre ein fixed-effects Modell eine gute Idee. Allerdings gibt es Gerüchte, dass SPSS das (immer noch) nicht kann -- kann ich mir aber nicht vorstellen.

Bei der Multiplen linearen Regression besteht ja das Problem der Multikollinearität.

Was verstehst Du den unter dem "Problem der Multikollinearität"?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Regressionsanalyse zwei unabhängige Variablen

Beitragvon Djef.R » Sa 25. Jun 2011, 04:32

Danke erst einmal fuer deine Antwort.

Wie genau funktioniert das fixed effect Modell? In diesem Zusammenhang mal die Gegenfrage: meinst du/ihr die multiple Regressionsanalyse ist hier nicht angebracht.

Mit Multikollinearität meine ich dass die unabhängigen Variablen miteinander korreliert sind und so das Ergebniss der Regression verfaelchen koennen.

Danke
Djef.R
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 11. Jun 2011, 09:22
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse zwei unabhängige Variablen

Beitragvon daniel » Sa 25. Jun 2011, 13:36

Djef.R hat geschrieben:In diesem Zusammenhang mal die Gegenfrage: meinst du/ihr die multiple Regressionsanalyse ist hier nicht angebracht.

Wenn ich Dich richtig verstehe, dann hast Du hier Paneldaten. Du hast vier Firmen, die jeweils über 13 Jahre beobachtet werden. Wenn Du eine "einfache" Regression schätzt, dann tust Du so, als seien die 52 (= 4*13) Beobachtungen unabhängig voneinander. Nun ist es recht wahrscheinlich, dass die Beobachtungen über die Jahre innerhalb einer Frima ähnlicher sind, als diejenigen zwischen Firmen. Das muss beim Modellieren beachtet werden. Die Standardfehler der Koeffizienten müssen korrigiert werden und die Firmenzugehörigkeit muss kontrolliert werden. Eine Möglichkeit wäre ein fixed effects Modell. In Deinem Fall ist die Umsetzung leicht. Du kannst einfach Dein(e) Outcome(s) auf die beiden Prädikatoren und einen Firmendummy regressieren (denn Du hast ja nur vier Frimen, i.e. drei Dummies). Die Standardfehler solltest Du "cluster-robust" schätzen.

Wie genau funktioniert das fixed effect Modell?

Im FE Modell benutzt Du zur Schätzung der Koeffizienten nur die Varianz innerhalb der Firmen. Im Prinzip ziehst Du von jeder Beobachtung den Firmenspezifischen Mittelwert ab und schätzt dieses (within-)transformierte Modell dann mittels OLS. Du bekommst die gleichen Punktschätzer, wenn Du für die Frimenzugehörigkeit einen Dummy ins Modell steckst. Bei nur vier Firmen ist das kein Problem.

Mit Multikollinearität meine ich dass die unabhängigen Variablen miteinander korreliert sind und so das Ergebniss der Regression verfaelchen koennen.

Was heißt verfälschen? Wenn die Prädikatoren hoch (und gemeint ist hier _hoch_) miteinander korrelieren, dann werden die Standardfehler hoch, die Koeffizineten also "unsicher". Es gibt aber meist keine Alternative, denn wenn Du Prädikatoren auslässt, die sowohl mit dem Outcome als auch mit den Prädikatoren im Modell korreliert sind, dann bekommst Du verzerrte (und inkonsistente) Koeffizienten.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

folgende User möchten sich bei daniel bedanken:
Djef.R

Re: Regressionsanalyse zwei unabhängige Variablen

Beitragvon Djef.R » So 26. Jun 2011, 11:25

Erst einmal vielen Dank fuer die ausfuehrliche Antwort. Leider bin ich auf dem Gebiet der Regressionsanalyse bzw. Panelanalyse nicht zu Hause. Habe bisher nur die einfach und mutlivariate linare Regressionsanalyse kennengelernt.

Ich habe 3 Firmen (eine ist weggefallen).

Fuer jede Firma -> 2 unabhaengige Variablen: Technologie- und Geschaeftsprozesspatente
3 abhaenige Variablen: Umsatz, Marktkapitalisierung, Kurs-Gewinn-Verhaeltnis

fuer jede Firma bedeutet das 3 Regressionen:
Technologie- und Geschaeftsprozesspatente -> Umsatz
Technologie- und Geschaeftsprozesspatente -> Marktkapitalisierung
Technologie- und Geschaeftsprozesspatente -> Kurs-Gewinn-Verhaeltnis

Fuer 3 Firmen heisst das 9 Regressionen; ueber jeweil 13 Jahre;

Wie aufwendig ist es eine Panelanayse (FE) mit SPSS durchzufuehren?
Djef.R
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 11. Jun 2011, 09:22
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse zwei unabhängige Variablen

Beitragvon daniel » So 26. Jun 2011, 13:01

Djef.R hat geschrieben:Wie aufwendig ist es eine Panelanayse (FE) mit SPSS durchzufuehren?

Ich bin mit SPSS nicht sehr vertraut, aber wie ich bereits sagte, Du schätzt insgesamt drei Regressionen.

Umsatz = T + G + F1 + F2
Marktkapitalisierung = T + G + F1 + F2
Kurs-Gewinn-Verhältnis = T + G + F1 + F2

mit

T Technologie-
G Geschaeftsprozesspatente
F1 Firma 1 (Dummy)
F2 Firma 2 (Dummy)

Wie Du die Standardfehler korrigierst ist mir in SPSS nicht klar. Das könnte aufwänfdig werden, ist aber unbedingt nötig, weil ansonsten alle Tests der Koeffizienten invalide sind.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

folgende User möchten sich bei daniel bedanken:
Djef.R

Re: Regressionsanalyse zwei unabhängige Variablen

Beitragvon Djef.R » So 26. Jun 2011, 16:29

Ich denke mal dass ich es mit der Multivariaten linearen Regression probieren werde. Hoffe die wird aussagekräftig genug.
Sollte ich dabei unbedingt was beachten? Hier mal meine Ergebnisse:

U=Unternehmen T=Technologiepatente G=Geschäftsprozesspatente

U1

T,P -> Umsatz

R=.749 Rsquare=.561 adj. Rsquare=.473 F=6.383 Sig.=.016
Unstandardized Coefficients:
Constant B=24557.800 Std. Error=6138.491 t=4.001 Sig=.003
Tech_Pat B=26.342 Std. Error=22.903 Beta .426 t=1.150 Sig.=.227
GPP_Pat B=968.808 Std. Error=1005.953 Beta .357 t=.963 Sig=.358

T,P -> Marktkapitalisierung

R=.269 Rsquare=.072 adj. Rsquare=-.113 F=.390 Sig.=.678
Unstandardized Coefficients:
Constant B=114906.633 Std. Error=29868.090 t=3.847 Sig=.003
Tech_Pat B=7.461 Std. Error=111.438 Beta .036 t=.067 Sig.=.948
GPP_Pat B=-2708.128 Std. Error=4894.671 Beta -.298 t=-.0533 Sig=.592

T,P -> Kurs-Gewinn-Verhältnis

R=.698 Rsquare=.475 adj. Rsquare=.370 F=4.522 Sig.=.040
Unstandardized Coefficients:
Constant B=48.815 Std. Error=7.926 t=6.159 Sig=.000
Tech_Pat B=-0.59 Std. Error=0.030 Beta -.812 t=-2.003 Sig.=.073
GPP_Pat B=.500 Std. Error=1.299 Beta .156 t=.385 Sig=.708

Wie kann ich die Ergebnisse am besten interpretieren? Welche Werte sollte ich in meine Analyse mit einfliessen lassen?
Würde auf jedenfall sagen dass man das Bestimmtheitsmaß Rsquare und das korrigierte Bestimmtheitsmaß mit in die Interpretation einbeziehe sollte. Für die Betrachtung der Signifikanz ist da der F Wert oder der Sig Wert interessant? dachte eigentlich dass der F-Test die Signifikanz liefert?! Was ist mit der T-Statistik?

Danke Danke
Djef.R
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 11. Jun 2011, 09:22
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste

cron