Multikollinearität in Paneldaten

Fragen, die sich auf kein spezielles Verfahren beziehen.

Multikollinearität in Paneldaten

Beitragvon TimMeier » Do 25. Feb 2021, 08:01

Hallo zusammen,

ich habe Paneldaten und ein Modell, dass aus einer abhängigen Variablen, zwei unabhängigen Variablen, drei Moderatoren und diversen Kontrollvariablen besteht. Die unabhängigen Variablen sollen jeweils einzeln auf die abhängige Variable per Regression getestet werden. Die Moderatoren will ich stufenweise hinzuschalten. Bevor ich diese Analysen nun mache, lasse ich mir die Korrelationsmatrix ausgeben, um meine Variablen auf Multikollinearität zu testen. Hier kommen wir zu meinen Fragen:

(1) Muss ich neben den unabhängigen Variablen und den Moderatoren auch die Kontrollvariablen bei dem Test auf Multikollinearität berücksichtigen? Hierzu finde ich leider im Internet immer unterschiedliche Aussagen. Die für mich sinnvollste Aussage, die ich gelesen hatte, ist bisher, dass Kontrollvariablen zum einen eine Relevanz für die Multikolinearität haben, wenn sie mit den unabhängigen Variablen oder den Moderatoren korrelieren und keine Relevanz für die Multikollinearität haben, wenn Kontrollvariablen untereinander korreliert sind. Stimmt das?

(2) Ich habe zusätzlich Hilfsregressionen mit den unabhängigen Variablen und den Moderatoren gerechnet. Diesen fünf Hilfsregressionen hatten VIFs und R2s, die nicht auf Multikollinearität schließen lassen. Die Korrelationen innerhalb der Korrelationsmatrix haben jedoch teilweise dem widersprochen und Multikollinearität ausgewiesen. An welches Ergebnis sollte man sich in so einem Fall orientieren? Darf ich überhaupt bei Paneldaten mittels linearer (nicht Panel-basierter) Hilfsregressionen und der Korrelationsmatrix auf Multikollinearität testen?

Vorab bereits vielen Dank für die Hilfe und Unterstützung.
TimMeier
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Do 18. Feb 2021, 15:51
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Multikollinearität in Paneldaten

Beitragvon strukturmarionette » Do 25. Feb 2021, 09:05

Hi,

ich habe Paneldaten

- wieviele und welche und woher denn?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Multikollinearität in Paneldaten

Beitragvon TimMeier » Do 25. Feb 2021, 11:32

Ich arbeite mit einem Datensatz aus ca. 3.000 Unternehmenstransaktionen über 20 Jahre. Ich habe mir die Daten eigenständig zusammengesucht.
TimMeier
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Do 18. Feb 2021, 15:51
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Multikollinearität in Paneldaten

Beitragvon TimMeier » Mo 1. Mär 2021, 08:50

Ich konnte die Fragen leider bisher noch nicht klären und würde mich über jede Hilfe freuen. =)
TimMeier
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Do 18. Feb 2021, 15:51
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Multikollinearität in Paneldaten

Beitragvon bele » Mo 1. Mär 2021, 10:43

Hallo Tim,

JMTC:

TimMeier hat geschrieben:Bevor ich diese Analysen nun mache, lasse ich mir die Korrelationsmatrix ausgeben, um meine Variablen auf Multikollinearität zu testen.

Die Korrelationsmatrix kann nur solche Fälle zeigen, in denen zwei Variablen direkt miteinander korrelieren. Wenn drei oder vier Vorhersageariablen in einem linearen Zusammenhang stehen muss die bivariate Analyse nichts auffällges zeigen. Deshalb hätte ich dem VIF mehr Gewicht zugesprochen.

Die für mich sinnvollste Aussage, die ich gelesen hatte, ist bisher, dass Kontrollvariablen zum einen eine Relevanz für die Multikolinearität haben, wenn sie mit den unabhängigen Variablen oder den Moderatoren korrelieren und keine Relevanz für die Multikollinearität haben, wenn Kontrollvariablen untereinander korreliert sind.

Multikollinearität führt zu extrem großen Standardfehlern und damit dazu, dass wichtige Variablen nicht signifikant werden. Wenn Du Kontrollvariablen definierst als solche, deren Standardfehler und p-Wert Dich nicht interessiert, dann erscheint das in dieser Form sinnvoll.

Ich habe zusätzlich Hilfsregressionen mit den unabhängigen Variablen und den Moderatoren gerechnet. Diesen fünf Hilfsregressionen hatten VIFs und R2s, die nicht auf Multikollinearität schließen lassen. Die Korrelationen innerhalb der Korrelationsmatrix haben jedoch teilweise dem widersprochen und Multikollinearität ausgewiesen.


Das ist ungewöhnlich. Hast Du für die Beurteilung der Korrleationsgrafik irgendwelche "universellen" Grenzwerte angenommen oder Stichprobenumfang etc. berücksichtigt?

JMTC,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5917
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts

Re: Multikollinearität in Paneldaten

Beitragvon strukturmarionette » Mo 1. Mär 2021, 17:01

Hi,

- demnach N =20 mit 30000 Variablen irgendwie selber zusammengesucht?
- und was sind die zwei UVs und was ist die deine AV?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Multikollinearität in Paneldaten

Beitragvon TimMeier » Di 2. Mär 2021, 16:09

Vielen Dank Bernhard, es ist so offensichtlich gewesen und dennoch habe ich es nicht gesehen. Du hast natürlich recht mit der Verwendung der Korrelationsmatrix im multivariaten Zusammenhang. Entsprechend klärt sich auch, wieso die Matrix und die VIFs etwas anderes aussagen.
Besten Dank!
TimMeier
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Do 18. Feb 2021, 15:51
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: Google [Bot] und 18 Gäste

cron