Annahmen der linearen Regression wenn unab. Variable binär

Alle Verfahren der Regressionanalyse.

Annahmen der linearen Regression wenn unab. Variable binär

Beitragvon Klausi123 » Di 24. Sep 2019, 19:17

Hallo,

ich stelle mir eine (vermutlich) ziemlich blöde Frage: Mein lineares Regressionsmodel besteht aus einer abhängigen (kontinuierlichen) und 3 unabhängigen Variablen, wobei alle unabhängigen Variablen Dummyvariablen sind, die nur den Wert 1 und 0 annehmen können. Ich stelle mir nun die Frage, welche der Annahmen einer linearen Regression ich in diesem Fall prüfen muss. Für eure Hilfe wäre ich sehr dankbar.
Klausi123
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Di 24. Sep 2019, 19:07
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Annahmen der linearen Regression wenn unab. Variable bin

Beitragvon strukturmarionette » Di 24. Sep 2019, 20:15

Hi,

- alle

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Annahmen der linearen Regression wenn unab. Variable bin

Beitragvon Klausi123 » Mi 25. Sep 2019, 10:53

Vielen Dank für deine Antwort. Zur Überprüfung habe ich mir in R die entsprechenden Grafiken anzeigen lassen und versuche sie zu interpretieren. Ich habe zunächst einmal die Regression inkl. möglicher Ausreißer durchgeführt und im Anschluss die Ausreißer entfernt: https://imgur.com/a/qYZPEjc


Mir fällt die Interpretation der Grafiken noch ein wenig schwer. Eine waagerechte, rote Linie spricht laut meinen Recherchen dafür, dass die Annahmen der linearen Regression erfüllt sind. Das scheint in meinem Fall also so zu sein. Könnt ihr das so bestätigen? :?
Klausi123
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Di 24. Sep 2019, 19:07
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Annahmen der linearen Regression wenn unab. Variable bin

Beitragvon bele » Mi 25. Sep 2019, 13:00

Hallo Klausi123,

das sind mit und ohne jeweils sehr gut aussehende diagnostische Plots gegen die man nicht viel haben kann. Ja, die nach dem Entfernen von "Ausreißern" sehen nochmal schöner aus, aber sie sehen erschreckend anders aus. Das weckt den Verdacht, dass Du da viele Ausreißer entfernt und damit tief in den Datensatz eingegriffen hast. So erhebliche Eingriffe in die Daten müssen eine entsprechende Rechtfertigung haben, die nicht allein aus der Residuenanalyse gerechtfertigt sind. Das war zwar nicht Deine Frage, aber da musst Du aufpassen. Die diagnostischen Plots sind in Ordnung.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: Annahmen der linearen Regression wenn unab. Variable bin

Beitragvon Klausi123 » Mi 25. Sep 2019, 13:37

bele hat geschrieben:Hallo Klausi123,

das sind mit und ohne jeweils sehr gut aussehende diagnostische Plots gegen die man nicht viel haben kann. Ja, die nach dem Entfernen von "Ausreißern" sehen nochmal schöner aus, aber sie sehen erschreckend anders aus. Das weckt den Verdacht, dass Du da viele Ausreißer entfernt und damit tief in den Datensatz eingegriffen hast. So erhebliche Eingriffe in die Daten müssen eine entsprechende Rechtfertigung haben, die nicht allein aus der Residuenanalyse gerechtfertigt sind. Das war zwar nicht Deine Frage, aber da musst Du aufpassen. Die diagnostischen Plots sind in Ordnung.

LG,
Bernhard


Hallo Bernhard,

vielen Dank für deine Antwort. Ich bin mir aktuell noch sehr unsicher wie ich mit den Ausreißern umgehen soll. Es handelt sich dabei nicht um Messfehler oder falsche Eingaben, sondern um tatsächliche Beobachtungen. Ich habe die Ausreißer testweise entfernt um deren Einfluss zu erfahren. Tatsächlich wird die Regressionsanalyse von diesen Ausreißern stark beeinträchtigt, sodass das Ergebnis mitunter davon abhängt ob ich diese Beobachtungen in meinem Sample belasse oder sie entferne. Die Ausreißer machen 10% der Anzahl an Gesamtbeobachtungen aus. Ohne den genauen Sachverhalt zu kennen ist es vermutlich schwer die folgende Frage zu beantworten: Wie würdest du vorgehen um zu entscheiden, ob die Ausreißer für die Regressionsanalyse in dem Sample belassen oder entfernt werden? Vermutlich wird es dafür keine allgemeingültige Entscheidungsregel geben aber vielleicht hast du ja eine Idee
Klausi123
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Di 24. Sep 2019, 19:07
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Annahmen der linearen Regression wenn unab. Variable bin

Beitragvon bele » Mi 25. Sep 2019, 13:45

Hallo Klausi123,

Du hast Recht, das ist nur im Einzelfall unter Kenntnis des Sachverhalts, der Datengewinnung und vor allem der Ziele der Untersuchung zu beantworten. Ich habe Schwierigkeiten, mir eine Situation auszudenken, in der mich eine Regression für nur 90% der wirklich-echten Daten interessieren würde, zumal ja mit 100% der Daten die Residuenanalyse auch nicht ganz schlecht ist. Aber ganz bestimmt gibt es auch solche Situationen. Vielleicht könnte man ein anderes Regressionsmodell erstellen, das den Daten gerechter wird?
Du musst entscheiden, ob Du uns erzählen willst, was Du da machst und warum Du glaubst, dass es gerechtfertigt sei, so viele Messdaten einfach zu verwerfen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: Annahmen der linearen Regression wenn unab. Variable bin

Beitragvon Klausi123 » Mi 25. Sep 2019, 14:59

Nochmals vielen Dank für deine Hilfe. Eine Frage noch bzgl. der Annahmen: Sind mit der Überprüfung der Plots alle Annahmen der linearen Regression geprüft (und für erfüllt empfunden) oder muss ich diesbezüglich noch etwas anderes beachten?
Klausi123
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Di 24. Sep 2019, 19:07
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Annahmen der linearen Regression wenn unab. Variable bin

Beitragvon bele » Mi 25. Sep 2019, 17:15

Gute Frage. Ich hoffe für Dich, dass strukturmarionette sich nochmal meldet oder PonderStibbons sich meldet, die da ganz sicher die besseren Grundlagenkenntnisse haben als ich. Ich könnte mir aber vorstellen dass die von Dir lesen wollen, in welchem Statistikbuch Du welche die Annahmen nachgelesen hast, welche davon Du als erfüllt ansiehst und bei welchen Du eventuell noch Probleme hast.

Ich würde mich wahrscheinlich mit einer guten Resdiuenanalyse auch so mit den Ergebnissen an die Öffentlichkeit wagen, aber es ist halt auch immer eine Frage des Kontexts, welche Gründlichkeit im Einzelfall gefordert ist. Eine Bachelorarbeit in Therapiewissenschaften wird da vielleicht anders gewertet als eine Masterarbeit als Mathematiker. Die Betriebswirte hier in der Klinik sehen, dass wir im vorletzten Quartal 8 Operationen einen Typs gemacht haben und im letzten nur 7 und fragen nach den Gründen für den Rückgang. Will sagen: Die Steuern ein großes Unternehmen und kommen gut mit damit aus, dass Excel eine Gerade durch zwei Punkte legen kann.

YMMV,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: Annahmen der linearen Regression wenn unab. Variable bin

Beitragvon Freddy19911 » Fr 27. Sep 2019, 13:52

Okay, verstehe. Vielen Dank für deine Antworten. Du hast mir wirklich sehr weitergeholfen.
Freddy19911
Mitglied
Mitglied
 
Beiträge: 25
Registriert: Mi 20. Jun 2018, 19:44
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste