Lineare Regression anwendbar bei diesen Streudiagrammen?

Alle Verfahren der Regressionanalyse.

Lineare Regression anwendbar bei diesen Streudiagrammen?

Beitragvon Lucialando » Do 7. Feb 2013, 13:13

Hi,
mein Anliegen geht ja schon aus der Überschrift hervor.
Insgesamt habe ich 4 potenzielle X-Variablen und ein metrsich skaliertes Y.

X2-X4 weisen ähnliche Streudiagramme auf (die Fragen sind jeweils mit 1-5 kodiert und ordinalskaliert)--> BILD 1
X1 ist zwar metrisch aber sehr merkwürdig linkslastig gestreut, einen linearen Zusammenhang kann ich zumindest nicht erkennen --> BILD 2

Kann ich hier nun eine lineare Regression durchführen??
Laut meinem Betreuer könnte ich X2-X4 auch als metrisch ansehen, ich selbst tendiere jedoch zur Dummy Kodierung. Könnte ich diese bereits auch mit den Streudiagrammen begründen?

Lg,
Lucia
Dateianhänge
Bildschirmfoto 2013-02-07 um 12.03.51.png
BILD 1
Bildschirmfoto 2013-02-07 um 12.03.51.png (38.94 KiB) 2366-mal betrachtet
Bildschirmfoto 2013-02-07 um 12.02.58.png
BILD 2
Bildschirmfoto 2013-02-07 um 12.02.58.png (50.31 KiB) 2366-mal betrachtet
Lucialando
Beobachter
Beobachter
 
Beiträge: 18
Registriert: So 30. Dez 2012, 00:45
Wohnort: NRW
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Lineare Regression anwendbar bei diesen Streudiagrammen?

Beitragvon aziz » Do 7. Feb 2013, 17:09

Hi Lucialando,

Lucialando hat geschrieben:Laut meinem Betreuer könnte ich X2-X4 auch als metrisch ansehen, ich selbst tendiere jedoch zur Dummy Kodierung. Könnte ich diese bereits auch mit den Streudiagrammen begründen?

falls die Abstände zwischen den Kategorien klar definiert sind und den Kategorien eine Rangfolge unterliegt, so könnte dies so getan werden. Im allgemeinen halte ich es aber für angebracht, kategoriale erklärende Merkmale als Dummyvariable zu kodieren.

Bei Bild 1 könntest du pro Kategorie Boxplots zeichnen und dich dann an den Medianen orientieren, um auf Linearität zu schließen.

Bei Bild 2 solltest du mal probieren, den Logarithmus auf die Daten der metrischen erklärenden Variable anzuwenden. Vermutlich ist dann mehr zu erkennen. Deutet die Grafik auf Linearität hin, so solltest du die logarithmierte Variable in dein Modell aufnehmen.

Grüße
Aziz
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

Re: Lineare Regression anwendbar bei diesen Streudiagrammen?

Beitragvon Lucialando » Fr 8. Feb 2013, 01:13

hey,
dank dir für die antwort.
hatte auch noch ne 2. frage gepostet eben zu den dummy variablen. vielleicht magst du da auch noch mal nachgucken?
regressionanalyse-f11/binar-kodiert-dummy-t2459.html

meinst du bei den boxplots, dass ich gucken könnte welche linie sich ergibt wenn ich die mediane verbinde?
ansonsten denke ich aber eh, dass eine 0 1 kodierung in meinem fall zielführender ist, dann müsste ich bei der ursprungsvariablen ja auch nicht mehr die linearität nachweisen, oder? kann/sollte man eine dummy variable dann auch noch irgendwie überprüfen und geht das überhaupt?

das mit log ist übrigens ne sehr gute idee, hatte mir mein arbeitskollege auch schon vorgeschlagen, da wusste ich aber noch nicht wozu es gut sein könnte ;-)
ist es denn dann bloß nicht schwieriger das ergebnis zu interpretieren?

lg, lucia
Lucialando
Beobachter
Beobachter
 
Beiträge: 18
Registriert: So 30. Dez 2012, 00:45
Wohnort: NRW
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Lineare Regression anwendbar bei diesen Streudiagrammen?

Beitragvon Lucialando » Fr 8. Feb 2013, 01:30

hey,
... so hab noch eben die logarithmierung versucht (es handelt sich bei diesem X übrigens um die Anzahl von Beschäftigten, du meintest doch die UA?)
war mein vorgehen richtig: transformieren - variable berechnen - fuktionsgruppe: arithmetisch - ln ?
hierbei ist nämlich nun folgendes rumgekommen, sieht schon besser, aber reicht das?
Dateianhänge
Bildschirmfoto 2013-02-08 um 00.24.16.png
Bildschirmfoto 2013-02-08 um 00.24.16.png (89.88 KiB) 2346-mal betrachtet
Lucialando
Beobachter
Beobachter
 
Beiträge: 18
Registriert: So 30. Dez 2012, 00:45
Wohnort: NRW
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Lineare Regression anwendbar bei diesen Streudiagrammen?

Beitragvon aziz » Fr 8. Feb 2013, 12:57

Lucialando hat geschrieben:
meinst du bei den boxplots, dass ich gucken könnte welche linie sich ergibt wenn ich die mediane verbinde?

Jein. Stell dir die Mediane als Punkte vor und leg eine Regressionsgerade durch. Du musst die Punkte nicht verbinden. Mit der Methode könntest du streng genommen nie auf Linearität schließen.

Lucialando hat geschrieben:ansonsten denke ich aber eh, dass eine 0 1 kodierung in meinem fall zielführender ist, dann müsste ich bei der ursprungsvariablen ja auch nicht mehr die linearität nachweisen, oder? kann/sollte man eine dummy variable dann auch noch irgendwie überprüfen und geht das überhaupt?

Deine ursprünliche Kategorielle Variable hat 5 Kategorien? Dann könntest du 4 Dummyvariablen der vorm 0 (Referenzkategorie) und 1 (Eine der übrigen Kategorien) bilden. Es macht aber keinen Sinn ein binäre Variable auf Linearität zu Prüfen!

Lucialando hat geschrieben:das mit log ist übrigens ne sehr gute idee, hatte mir mein arbeitskollege auch schon vorgeschlagen, da wusste ich aber noch nicht wozu es gut sein könnte ;-)
ist es denn dann bloß nicht schwieriger das ergebnis zu interpretieren?

Du musst deine Interpretation auf die logarithmierte unabhängige Variable beziehen. Das ist aber kein Problem, da sich durch die log-Transformation nur die Skala der Daten (jetzt log-Skala) ändert. Die Struktur der Daten bleibt hierbei erhalten.
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

Re: Lineare Regression anwendbar bei diesen Streudiagrammen?

Beitragvon aziz » Fr 8. Feb 2013, 12:59

Lucialando hat geschrieben:hey,
... so hab noch eben die logarithmierung versucht (es handelt sich bei diesem X übrigens um die Anzahl von Beschäftigten, du meintest doch die UA?)
war mein vorgehen richtig: transformieren - variable berechnen - fuktionsgruppe: arithmetisch - ln ?
hierbei ist nämlich nun folgendes rumgekommen, sieht schon besser, aber reicht das?

Du könnest zusätzlich die empirische Korrelation berechnen. Das Vorgehen bezüglich der Transformation hört sich richtig an. Arbeitest du mit SPSS?
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

Re: Lineare Regression anwendbar bei diesen Streudiagrammen?

Beitragvon Lucialando » Fr 8. Feb 2013, 14:08

Bildschirmfoto 2013-02-08 um 12.58.54.png
Kodierung Dummys für 1 der 3 UV (die beiden anderen UV werden analog behandelt)
Bildschirmfoto 2013-02-08 um 12.58.54.png (16.31 KiB) 2335-mal betrachtet
hey,
hab grad im backhaus nachgelesen, dass die linearität gar keine voraussetzung für die anwendbarkeit einer linearen regression ist.
dann nehm ich jetzt einfach die variable "anzahl der beschäftigten" im original ohne log. wenn ich die oberen datensätze abschneide, ergibt sich ein etwas weniger gebündeltes bild, daher liegt es primär an der ungünstigen skalierung durch die hohen werte...

mein problem sind nun eher die dummys für meine 3 anderen UV. (übrigens ja ich arbeite mit SPSS)
sie können jeweils die Ausprägungen 1-5 haben:
1 = weiß nicht
2 = nein
3 = in planung
4 = wird umgesetzt
5 = ja, ist umgesetzt

1 & 2 packe ich auf jeden fall zusammen
hab sie jetzt daher wie auf dem bild kodiert, aber hab ich dann jetzt nicht einen dummy zuviel drin?
Lucialando
Beobachter
Beobachter
 
Beiträge: 18
Registriert: So 30. Dez 2012, 00:45
Wohnort: NRW
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Lineare Regression anwendbar bei diesen Streudiagrammen?

Beitragvon PonderStibbons » Fr 8. Feb 2013, 14:18

hab grad im backhaus nachgelesen, dass die linearität gar keine voraussetzung für die anwendbarkeit einer linearen regression ist.

Da wäre die genaue Formulierung interessant. Ein lineares Modell für nichtlineare
Beziehungen aufzustellen, ist ein Fehler und führt zu falschen Ergebnissen. Vielleicht
meinte er, dass man auf nichtlineare Beziehungen geeignet reagieren kannn (z.B.
Transformation oder Aufnahme quadratischer Terme in die Vorhersage, und dergleichen).

Ob eine nichtlineare Beziehung vorliegt, zeigt der observed versus predicted values Plot
oder der residuals versus predicted values Plot.
1 & 2 packe ich auf jeden fall zusammen

Dadurch hast Du eine Variable mit 4 Kategorien, welche durch 3 dummy-Variablen repräsentiert
werden kann.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Lineare Regression anwendbar bei diesen Streudiagrammen?

Beitragvon aziz » Fr 8. Feb 2013, 15:21

PonderStibbons hat geschrieben:
hab grad im backhaus nachgelesen, dass die linearität gar keine voraussetzung für die anwendbarkeit einer linearen regression ist.

Da wäre die genaue Formulierung interessant. Ein lineares Modell für nichtlineare
Beziehungen aufzustellen, ist ein Fehler und führt zu falschen Ergebnissen. Vielleicht
meinte er, dass man auf nichtlineare Beziehungen geeignet reagieren kannn (z.B.
Transformation oder Aufnahme quadratischer Terme in die Vorhersage, und dergleichen).

Hab auch noch mal in den Backhaus geschaut. PonderStibbons hat recht. Linearität in den Paramtern ist eine Voraussetzung. Die Nicht-Linearität kann durch geeignete Transformationen "umgangen" werden.
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

Re: Lineare Regression anwendbar bei diesen Streudiagrammen?

Beitragvon Lucialando » Fr 8. Feb 2013, 16:03

hmmm,
ich meinte S. 15:
"Die Regressionsanalyse ist prinzipiell anwendbar, wenn sowohl die abhängige als auch die unabhängigen Variablen metrisches Skalenniveau besitzen. Dies ist der klassische Fall, wobei die Beziehungen zwischen unabhängigen und abhängigen Variablen auch nicht linear sein können" Danach wird auf die Dummy-Kodierung eingegangen...
Wie dem auch sei, mir wurde vorhin nun von einer doktorandin, die sehr viel statistik verwendet gesagt, ich könnte meine X Variable dennoch auf jeden fall reinnehmen und zwar in der ursprünglichen form. Sie hat auch die Streudiagramme angeguckt...
bin jetzt verunsichert :?
Lucialando
Beobachter
Beobachter
 
Beiträge: 18
Registriert: So 30. Dez 2012, 00:45
Wohnort: NRW
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Nächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 12 Gäste