Zentrierung und andere

Alle Verfahren der Regressionanalyse.

Re: Zentrierung und andere

Beitragvon erichlebt » Do 6. Sep 2012, 19:33

Noch mal danke an alle.

Holgonaut hat geschrieben:Fehlen wichtige - und mit anderen Prädiktoren korrelierende Prädiktoren,
kannst du die Regressionkoeffizienten schlecht interpretieren, weil sie verzerrt sind, egal wie groß die Stichprobe ist.


Heißt das, dass ich auch Variablen die z.B. mit dem Einkommen korreliert sind einbeziehen müsste/sollte, auch wenn sie mit dem BMI nicht direkt in Verbindung zu bringen sind? Wie würde man so etwas prinzipiell (in SPSS) machen?



Ich schau jetzt mal wie weit ich mit dem was ich bisher habe komme.

Werde aber sicher noch (öfter) Fragen haben und hoffe dann weiter auf Eure kompetente Unterstützung.

Bis dann

Erich
erichlebt
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 5. Sep 2012, 21:28
Danke gegeben: 8
Danke bekommen: 0 mal in 0 Post

Re: Zentrierung und andere

Beitragvon Holgonaut » Do 6. Sep 2012, 22:08

Hi,

nein, musst du nicht. Es ist dann ein Problem, wenn diese weitere Variable mit dem bmi korreliert UND mit Einkommen. Dann muss sie rein. Eine (bessere) Alternative
ist die EInbeziehung von Instrumentalvariablen.

Gruß
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

folgende User möchten sich bei Holgonaut bedanken:
erichlebt

Re: Zentrierung und andere

Beitragvon PonderStibbons » Do 6. Sep 2012, 22:09

Könnte es sein, dass die Aussage auf (sozialwissenschaftliche) Untersuchungen deren Grundgesamtheit die Bevölkerung eines Landes ist (wie z.B. im Allbus) abzielt? Für solche Daten sollte, bei ausreichender Stichprobengröße, die Annahme gelten, oder?

Nö. Es ist einfach nur unsinnig. So ein bißchen wie stille post. Irgendwann wurde wohl
aus der Aussage des zentralen Grenzwertsatzes über die Verteilung von Mittelwerten
eine angebliche Aussage über die Verteilung von Variablen.
Dass diese untereinander korrelieren habe ich doch erwähnt, oder meinst Du mit Wechselwirkungen was anderes?

Wechselwirkungen sind Wechselwirkungen, keine Korrelationen.
Wenn man Wechselwirkungseffekte aus theoretischen Überlegungen
heraus annimmt, kann man sie in einer Regression mit aufnehmen
(eine Wechselwirkung aus 2 Variablen wird dann repräsentiert durch
eine weitere Variable, die aus dem Produkt der beiden ersten
gebildet wird).

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11365
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
erichlebt

Re: Zentrierung und andere

Beitragvon erichlebt » Fr 14. Sep 2012, 19:13

Hi,

prinzipielle Frage: Ab wann sollte/muss man Fälle gewichten?

Beispiel: In den Daten (aus 2008) sind die Rentner überrepräsentiert und das Durchschnittsalter (Median und Mittelwert) liegt bei 50 Jahren anstatt der damals ca. 43. Sollte ich bei solchen Abweichungen ne Gewichtung vornehmen und wenn ja, wie kann ich das in SPSS machen? Wie man mit einem Wert gewichtet ist mir klar, aber wenn ich sowohl Alter als auch Rentner gewichten muss fehlt mir die Idee.

Danke

Erich
erichlebt
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 5. Sep 2012, 21:28
Danke gegeben: 8
Danke bekommen: 0 mal in 0 Post

Re: Zentrierung und andere

Beitragvon daniel » Sa 15. Sep 2012, 09:22

Warum sind die Rentner überrepresentiert? Zufall? Systematisches oversampling? Gewichtung ist ein sehr komplexes Thema, durch das ich zugegeben selbst noch immer nicht ganz durchsteige, aber, wenn Du keien detailierten Informationen zum sampling der Daten hast, halte ich es für ausgeschlossen sich selbst irgendwelche Gewichte zusammenzubasteln. Wenn im Datensatz Gewichte zur verfügung stehen, dann ist i.d.R. dokumentiert wann, wie und wozu welches gewicht verwendet werden soll.

Andere haben vielleicht mehr zu sagen.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Zentrierung und andere

Beitragvon erichlebt » Mo 17. Sep 2012, 23:53

Hi Leute,

hab jetzt nach bestem Wissen rekodiert und ne simple lineare Regression gestartet, Ergebnis siehe Anhang.
Habe alle UV Dummy-kodiert, Referenzgruppe ist jeweils die höchste Ausprägung, also hohes Bildungsniveau / hoher Berufsstatus / Einkommen >= 150% des Nettoäquivalenzeinkommens.

Ich werde das Gefühl nicht los, dass ich was falsch gemacht habe, die Ergebnisse sehen für mich nicht so toll aus, fast alle Variablen sind nicht signifikant. Wieso kann z.B. niedriges Bildungsniveau signifikant sein, mittleres aber nicht? Liegt das dann nur am geringen Unterschied zwischen mittlerem und hohem Bildungsgrad?

Berufsstatus ist gar nicht signifikant, kann das sein?

Dass R² bei der Analyse recht klein ausfällt ist zu erwarten (ist auch in anderen Studien zum BMI die ne lineare Reg. machen so). Liegt denke ich an den vielen vielen Einflussfaktoren auf den BMI (Sport, Alter usw.)

Bin wieder dankbar für jede Hilfe. Wenn Ihr noch zusätzliche Angaben braucht geb ich gerne weitere Infos.

Danke im Voraus

Erich
Dateianhänge
2012-09-17_233914.jpg
2012-09-17_233914.jpg (131.64 KiB) 2504-mal betrachtet
erichlebt
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 5. Sep 2012, 21:28
Danke gegeben: 8
Danke bekommen: 0 mal in 0 Post

Re: Zentrierung und andere

Beitragvon PonderStibbons » Di 18. Sep 2012, 09:05

Liegt das dann nur am geringen Unterschied zwischen mittlerem und hohem Bildungsgrad?

Anscheinend sticht die Gruppe niedriger Bildungsgrad gegenüber den beiden
anderen heraus.
Berufsstatus ist gar nicht signifikant, kann das sein?

Wenn man Bildungsrad UND Einkommen UND Berufsstatus in ein und dieselbe
Analyse einschließt, kann das doch nicht alles "signifikant" werden. Das ist
normalerweise ziemlich redundant.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11365
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Zentrierung und andere

Beitragvon daniel » Di 18. Sep 2012, 09:26

Berufsstatus ist gar nicht signifikant, kann das sein?


Das kann man streng genommen aus dieser Tabelle nicht ablesen. Um diese Aussage treffen zu können, bedarf es eines F-Tests für alle Parameter der einzelenen Dummies, die Berfufsstatus abbilden. Ansonsten hat Pnder natürlich recht, diese Variablen überschneiden sich stark. Wie sehen die VIFs aus?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Zentrierung und andere

Beitragvon erichlebt » Di 18. Sep 2012, 15:53

Hi,

hoffe, dass das die VIF-Werte sind die Du meinst. Wenn ich mich recht erinnere werden die doch aus den Toleranzen gebildet, oder? Und die sehen doch eigentlich gut aus, also halt nicht nahe bei Null.

Ach ja, den Berufsstatus habe ich analog zu anderen Kennzahlen durch Zusammenfassung von Berufsgruppen selbst gebildet. Also niedrig = un- und angelernte Arbeiter, hoch = Beamte im höheren Dienst, Führungskräfte usw.
Dateianhänge
2012-09-18_154925.jpg
2012-09-18_154925.jpg (95.06 KiB) 2497-mal betrachtet
erichlebt
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 5. Sep 2012, 21:28
Danke gegeben: 8
Danke bekommen: 0 mal in 0 Post

Re: Zentrierung und andere

Beitragvon erichlebt » Mi 19. Sep 2012, 18:49

Hi Leute,

noch eine Frage zur obigen Regression: Uns wurde gesagt, man kann UVs auf Interaktionseffekte prüfen, indem man die Variablen multipliziert und die daraus entstehende neue Variable mit in die Regression aufnimmt.

Wie würde man das nun für polytome Dummy-Variablen wie oben machen? Welche muss ich dann mit welcher multiplizieren, nur die bei denen Interaktion vermutet wird oder jede mit jeder?
erichlebt
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 5. Sep 2012, 21:28
Danke gegeben: 8
Danke bekommen: 0 mal in 0 Post

Vorherige

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 11 Gäste

cron