Anfängerfragen

Alle Verfahren der Regressionanalyse.

Anfängerfragen

Beitragvon _Mandy_ » Sa 8. Apr 2017, 23:56

Huhu,

ich hoffe mir kann Jemand weiterhelfen. Ich muss mich in einer Hausarbeit mit SPSS Regressionen beschäftigen und bin absoluter Beginner. Ich untersuche mögliche Prädiktoren auf die Anzahl der aktiven Atomkraftwerke in den EU 28 Ländern
Meine AV ist also die Anzahl der Atomkraftwerke (metrisch). Als UV habe ich das BIP (metrisch). und das Umweltbewusstsein (nominal). Als Kontrollvariable das Kohlevorkommen (metrisch) und Postkommunismus (nominal).
Ich soll eine bivariate und eine multivariate Analyse durchführen.

Nun möchte ich einfach sicher gehen, dass ich beim weiteren Vorgehen auch richtig bin. Ich würde
- Die Normalverteilung aller Variablen (UV, AV und Kontrollvariable) überprüfen (anhand von Chi-Quadrat bzw. kolmogorov smirnov, das hat SPSS mir automatisch bei der Hypothesentestübersicht angezeigt)
- Für die bivariate Analyse, würde ich da bivariate Korrelationen oder partielle Korrelationen berechnen? Ist der Unterschied lediglich darin, dass bei der partiellen die Kontrollvariablen rausgerechnet werden? Wäre dies in meinem Zusammenhang sinnvoller? Oder kann ich auch die bivariaten Korrelationen berechnen und die Kontrollvariablen, die nicht signifikant sind, dann einfach aus dem Modell rausschmeißen und sie bei der multivariaten Analyse nicht mit einbeziehen?
- Bei der multivarianten Analyse würde ich dann eine lineare Regression durchführen, in Block 1 meine beiden Kontrollvariablen und in Block 2 dann meine beiden UVs?
- Nun habe ich ja ein sehr kleines N (n=28) Muss ich in diesem Fall dann das korrigierte r Quadrat in meine Interpretation einbeziehen?
- Muss ich sonst noch etwas überprüfen bevor ich die Regressionen durchführe?

Vielen lieben Dank schon mal für eure Hilfe. Ich hoffe das sind nicht allzu dumme Fragen aber nach zwei Tagen Internet Recherche bin ich auch nicht weiter und hoffe nun auf Hilfe von hier.

LG
Mandy
_Mandy_
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 8. Apr 2017, 23:42
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Anfängerfragen

Beitragvon strukturmarionette » So 9. Apr 2017, 02:15

Hi,

Nun möchte ich einfach sicher gehen, dass ich beim weiteren Vorgehen auch richtig bin. Ich würde
- Die Normalverteilung aller Variablen (UV, AV und Kontrollvariable) überprüfen

- Was oder wer empfiehlt sowas?
- Wie kann sowas überhaupt gehen bei nominalskalierten Variablen?

aber nach zwei Tagen Internet Recherche bin ich auch nicht weiter

- wo dort?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Anfängerfragen

Beitragvon _Mandy_ » So 9. Apr 2017, 09:35

Die Normalverteilung hab ich bei spss mit der hypothesenübersicht untersucht.
Das ist doch die Voraussetzung für eine Regression oder?
_Mandy_
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 8. Apr 2017, 23:42
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Anfängerfragen

Beitragvon PonderStibbons » So 9. Apr 2017, 10:17

Wer erzählt denn sowas? Und dann auch noch bezogen auf die "unabhängigen" Variablen? Und wie bereits gefragt, wie sollte das überhaupt möglich sein bei kategorialen Variablen?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Anfängerfragen

Beitragvon _Mandy_ » So 9. Apr 2017, 12:19

Okay danke für eure Hilfe. Dann kann ich die Prüfung auf Normalverteilung weg lassen.
Wie sieht es sonst mit meinem Vorgehen aus?
_Mandy_
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 8. Apr 2017, 23:42
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Anfängerfragen

Beitragvon PonderStibbons » So 9. Apr 2017, 12:34

Überprüfen musst Du wegen der kleinen Fallzahl die Vorhersagefehler (Residuen) Deines Modells,
diese sind es, die aus einer normalverteilten Grundgesamthit stammen sollten. Besser mit einem
P-P-Plot oder Q-Q-Plot als mit einem Test - sind die Abwechungen nur klein, kan man oft auch eine
Nicht-Normalverteilung in Kauf nehmen.

Die Variablenbeschreibung ist leider unzureichend, sind "Umwelbewusstsein" und "Postkommunismus"
zwei ja/nein-Variablen? n=28 ist für 4 Prädiktoren eigentlich zu wenig, aber wenn es nur eine
Fingerübung sein soll, geht das wohl.

Bivariate Analysen sind bivariate Analysen, da hat Auspartialisieren nichts verloren.

Ob Du blockweise vorgehen solltest, hängt von den Gewohnheiten bzw. Erwartungen Deiner
Aufgabensteller ab.

- Muss ich sonst noch etwas überprüfen bevor ich die Regressionen durchführe?

Such mal im Netz nach "linear regression assumptions" oder "Voraussetzungen lineare
Regression".

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Anfängerfragen

Beitragvon _Mandy_ » So 9. Apr 2017, 12:46

PonderStibbons hat geschrieben:Überprüfen musst Du wegen der kleinen Fallzahl die Vorhersagefehler (Residuen) Deines Modells,
diese sind es, die aus einer normalverteilten Grundgesamthit stammen sollten. Besser mit einem
P-P-Plot oder Q-Q-Plot als mit einem Test - sind die Abwechungen nur klein, kan man oft auch eine
Nicht-Normalverteilung in Kauf nehmen.

Die Variablenbeschreibung ist leider unzureichend, sind "Umwelbewusstsein" und "Postkommunismus"
zwei ja/nein-Variablen? n=28 ist für 4 Prädiktoren eigentlich zu wenig, aber wenn es nur eine
Fingerübung sein soll, geht das wohl.

Bivariate Analysen sind bivariate Analysen, da hat Auspartialisieren nichts verloren.

Ob Du blockweise vorgehen solltest, hängt von den Gewohnheiten bzw. Erwartungen Deiner
Aufgabensteller ab.

- Muss ich sonst noch etwas überprüfen bevor ich die Regressionen durchführe?

Such mal im Netz nach "linear regression assumptions" oder "Voraussetzungen lineare
Regression".

Mit freundlichen Grüßen

PonderStibbons



Super! Vielen lieben Dank! Das hilft mir um einiges weiter!

Postkommunismus ist 1/0 Umwelbewusstsein kategorial.

Also würde ich die Kontrollvariablen in der bivariaten Regression einfach wie die anderen UVs einbeziehen?

Ich kenne nur die blockweise vorgehensweise, in der dann die Drittvariablen kontrolliert werden. Was wäre die Alternative?
_Mandy_
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 8. Apr 2017, 23:42
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Anfängerfragen

Beitragvon PonderStibbons » So 9. Apr 2017, 13:07

Umwelbewusstsein kategorial.

Das ist nach wie vor unzureichend beschrieben, die Anzahl der Kategorien ist nicht genannt.
Bei k Kategorien sind kategoriale Variablen in k-1 dummy-Variablen umzuwandeln.
Das heißt, Du hast insgesamt mindestens 5 Variablen in der Regression, was wie
gesagt für n=28 zu viel wäre.
Also würde ich die Kontrollvariablen in der bivariaten Regression einfach wie die anderen UVs einbeziehen?

Wovon das abhängt, habe ich bereits geschrieben. Aus Sicht der Regressionsnalyse
gibt es keine Kontrollvaroablen, der Algorithmus weiß ja nicht, was der Anwender
sich so denkt.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Anfängerfragen

Beitragvon _Mandy_ » Mi 12. Apr 2017, 10:06

Vielen Dank für die Hilfe. Umweltbewusstsein waren 4 Ausprägungen, ich habe da wie du gesagt hast eine Dummy-Variable erstellt.

Nun noch eine Frage: Für die multiple Regression, was gibt es da noch für eine Möglichkeit ohne zwei Blöcke? Alle UVs + Kontrollvariablen gleichwertig in die Regression einbauen? Oder wie würdet ihr das machen?
Ist es sinnvoll die Kontrollvariablen, da sie in der bivariaten Analyse nicht signifikant sind gar nicht in die multiple Regression einzubauen? So habe ich nur 2 UVs
Schau ich bei der Interpretation dann das korrigierte r Quadrat an doer was intepretiere ich bei einem kleinen N am besten?


PonderStibbons hat geschrieben:
Umwelbewusstsein kategorial.

Das ist nach wie vor unzureichend beschrieben, die Anzahl der Kategorien ist nicht genannt.
Bei k Kategorien sind kategoriale Variablen in k-1 dummy-Variablen umzuwandeln.
Das heißt, Du hast insgesamt mindestens 5 Variablen in der Regression, was wie
gesagt für n=28 zu viel wäre.
Also würde ich die Kontrollvariablen in der bivariaten Regression einfach wie die anderen UVs einbeziehen?

Wovon das abhängt, habe ich bereits geschrieben. Aus Sicht der Regressionsnalyse
gibt es keine Kontrollvaroablen, der Algorithmus weiß ja nicht, was der Anwender
sich so denkt.

Mit freundlichen Grüßen

PonderStibbons
_Mandy_
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 8. Apr 2017, 23:42
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Anfängerfragen

Beitragvon PonderStibbons » Mi 12. Apr 2017, 10:54

Umweltbewusstsein waren 4 Ausprägungen, ich habe da wie du gesagt hast eine Dummy-Variable erstellt.

Ist das ein Versehen?
Ich schrieb: Bei k Kategorien sind kategoriale Variablen in k-1 dummy-Variablen umzuwandeln., demnach sind bei 4 Ausprägungen 3 dummy-Variablen zu erzeugen.
Nun noch eine Frage: Für die multiple Regression, was gibt es da noch für eine Möglichkeit ohne zwei Blöcke? Alle UVs + Kontrollvariablen gleichwertig in die Regression einbauen?

Ja, alles in einem Rutsch, was auch sonst.
Oder wie würdet ihr das machen?

Wie wir das machen, ist eher Wumpe, es ist Dein Betreuer/Gutachter, der das goutieren muss.
Ist es sinnvoll die Kontrollvariablen, da sie in der bivariaten Analyse nicht signifikant sind gar nicht in die multiple Regression einzubauen? So habe ich nur 2 UVs

Wird gerne gemacht, ist aber nur eine Verschleierungstechnik. Das
multiple Regressionsmodell "weiß" ja dann nicht, dass schon vorher
fleißig getestet und ausgewählt wurde. Demnach sind die Standardfehler
und p-Werte der Regression nicht korrekt. Zu viele Prädiktoren bleiben
zu viele Prädiktoren, ob mit pre-Tests oder gleich mit Einbezug aller
Variablen in die Regression.

Schau ich bei der Interpretation dann das korrigierte r Quadrat an doer was intepretiere ich bei einem kleinen N am besten?

Halt alles.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 10 Gäste

cron