Logistische Regression oder doch lieber chi-Quadrat?

Alle Verfahren der Regressionanalyse.

Logistische Regression oder doch lieber chi-Quadrat?

Beitragvon Elena25 » Fr 24. Aug 2018, 11:08

Liebe Community,

ich habe eine abhängige binäre Variable (Vorhandensein von Depression: ja/nein), deren Zusammenhang ich gerne mit verschiedenen unabhängigen
metrischen Variablen untersuchen würde (Body Mass Index, Gewicht, Eiweißkonzentration im Blut, Zinkkonzentration im Blut etc...).
Jetzt bin ich nach langem Einlesen auf zwei unterschiedliche Wege gekommen:

1.) Anwenden eines Chi-Quadrat Tests, indem ich die binäre Variable Depression in Zusammenhang mit den vorher binär umgewandelten Variablen der Laborwerte
(Eiweisskonzentration über/unter Grenzwert) bringe.

2) Anwenden einer logistischen Regression mit abhängiger Variable Depression und unabhängigen (metrisch belassenen) Variablen Eiweiss, Body Mass Index etc..
wobei ich da unsicher bin, ob ich aufgrund der HOHEN Korrelation dieser unabhängigen Variablen miteinander (wenn man untergewichtig ist hat man in der Regel auch geringere Nährstoffspiegel z.B) überhaupt so eine Regression anwenden darf etc...

habt ihre da vielleicht einen Ratschlag, Ansatz, Alternative....? was würdet ihr als das aufschlussreichste Verfahren erachten?

Vielen Dank für eure Hilfe !!

Liebe Grüße

Elena
Elena25
Beobachter
Beobachter
 
Beiträge: 14
Registriert: So 10. Sep 2017, 12:30
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression oder doch lieber chi-Quadrat?

Beitragvon bele » Fr 24. Aug 2018, 11:47

Binär umwandeln = schlecht
metrische unabhängige Variable -> logistische Regression.
Hohe Korrelation der Prädiktoren = nur im mulivariaten Rechnen interessant, und dann ohnehin alternativlos. Eine Bayes-Regression wäre vielleicht interessant, bei der man dann sieht, wie die Koeffizienten miteinander korrellieren - aber erstmal rechnen und schauen, ob es wirklich ein Problem ist.

HTH,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Logistische Regression oder doch lieber chi-Quadrat?

Beitragvon Elena25 » Fr 24. Aug 2018, 13:41

Vielen Dank für die Antwort, kannst du mir vielleicht erklären wieso das binäre Umwandeln so schlecht ist? Ich hatte gehofft durch einfache Kreuztabellen mit chi2-Test die Regression umgehen zu können.
mich interessiert die Fragestellung: Hatten Patienten mit niedrigem BodyMassIndex (unter dem Schwellenwert) häufiger Depression als die mit hohem BMI?

Welche Frage würde denn eine Regressionsanalyse behandeln?

und was meinst du genau mit "interessant", in dem Sinne, dass es mich nicht stören sollte, dass sie hoch miteinander korrelieren?
Man liest ja überall wie instabil das Regressionsverfahren wird, wenn "Multikollinearität" besteht.
wie würdest du dann vorgehen? Sprich, wie würdest du die einzelnen unabhängigen Variablen in das Modell einschliessen? es gibt ja die Optionen Einschluss, Vorwärts,
Rückwärts etc.....

Vielen Dank !!

Elena
Elena25
Beobachter
Beobachter
 
Beiträge: 14
Registriert: So 10. Sep 2017, 12:30
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression oder doch lieber chi-Quadrat?

Beitragvon bele » Fr 24. Aug 2018, 14:13

Elena25 hat geschrieben:Vielen Dank für die Antwort, kannst du mir vielleicht erklären wieso das binäre Umwandeln so schlecht ist?


Klar, weil Du eine künstliche Trennung einführst. Nehmen wir drei BMI-Werte: 29,9, 30,1 und 45. Wenn Du den Cut bei 30 machst, dann sind die beiden ganz nah beeinander liegenden Werte in verschiedenen Gruppen, werden unterschiedlich behandelt. Die weit voneinander weg liegenden 30,1 und 45 werden aber völlig identisch behandelt, so als ob es gar keinen Unterschied zwischen ihnen gäbe. Das erste ist absurd, das zweite verliert Information. In der logistischen Regression ist 30,1 halt ein bisschen mehr ald 29,9 und 45 ist viel mehr als die beiden anderen. So, wie es der gesunde Menschenverstand vorgibt.

Ich hatte gehofft durch einfache Kreuztabellen mit chi2-Test die Regression umgehen zu können.


Regressionen sind nichts schlechtes, das man irgendwie umgehen muss.

mich interessiert die Fragestellung: Hatten Patienten mit niedrigem BodyMassIndex (unter dem Schwellenwert) häufiger Depression als die mit hohem BMI?


Die Regressionalternative hieße:
Geht ein höherer BMI mit einer erhöhten Wahrscheinlichkeit einer Depression einher und um wieviel steigen die logodds einer Depression pro zusätzlichem BMI-Punkt


und was meinst du genau mit "interessant", in dem Sinne, dass es mich nicht stören sollte, dass sie hoch miteinander korrelieren?


Mit dem Chi-Quadrat kannst Du Zusammenhänge zwischen je einem Prädiktor und der Depression untersuchen, nicht aber die Zusammenhänge von mehreren Prädiktoren gleichzeitig mit der Depression. Nur die Regressionsanalyse erlaubt letzteres. Nur bei letzterem ist die Mulikollinearität ein Thema. Das Problem taucht also bei der Regressionsanalyse erst auf, wenn Chi-Quadrat ohnehin schon am Ende ist.

Man liest ja überall wie instabil das Regressionsverfahren wird, wenn "Multikollinearität" besteht.

Im multivariaten Fall, den Du mit Chi-Quadrat überhaupt nicht abdecken kannst.


es gibt ja die Optionen Einschluss, Vorwärts, Rückwärts etc.....


Mit ein bisschen Glück kann man das alles weglassen und das menschliche Gehirn anstelle stupider Computeralgorithmen dafür nehmen. Entscheide aufgrund medizinisch-psychologischem Wissen, was interessant sein kann, und nimm das alles mit in die Regression auf. Je größer Deine Fallzahl, umso großzügiger kannst Du einschließen, je kleiner, umso gründlicher musst Du Dir das überlegen. Automatischer Einschluss führt, egal ob vorwärts, rückwärts oder durch die Brust ins Auge zu einer Überanpassung an Deine Stichprobe. Es gibt verschiedene Meinungen dazu, hier im Forum wird es schwer werden, eine Stimme dafür zu finden.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Logistische Regression oder doch lieber chi-Quadrat?

Beitragvon Elena25 » Sa 25. Aug 2018, 09:43

Toll! Das war alles absolut verständlich und einleuchtend erklärt!! Große Hilfe! Ich danke Dir herzlichst!!!!

Liebe Grüße

Elena
Elena25
Beobachter
Beobachter
 
Beiträge: 14
Registriert: So 10. Sep 2017, 12:30
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste