Elena25 hat geschrieben:Vielen Dank für die Antwort, kannst du mir vielleicht erklären wieso das binäre Umwandeln so schlecht ist?
Klar, weil Du eine künstliche Trennung einführst. Nehmen wir drei BMI-Werte: 29,9, 30,1 und 45. Wenn Du den Cut bei 30 machst, dann sind die beiden ganz nah beeinander liegenden Werte in verschiedenen Gruppen, werden unterschiedlich behandelt. Die weit voneinander weg liegenden 30,1 und 45 werden aber völlig identisch behandelt, so als ob es gar keinen Unterschied zwischen ihnen gäbe. Das erste ist absurd, das zweite verliert Information. In der logistischen Regression ist 30,1 halt ein bisschen mehr ald 29,9 und 45 ist viel mehr als die beiden anderen. So, wie es der gesunde Menschenverstand vorgibt.
Ich hatte gehofft durch einfache Kreuztabellen mit chi2-Test die Regression umgehen zu können.
Regressionen sind nichts schlechtes, das man irgendwie umgehen muss.
mich interessiert die Fragestellung: Hatten Patienten mit niedrigem BodyMassIndex (unter dem Schwellenwert) häufiger Depression als die mit hohem BMI?
Die Regressionalternative hieße:
Geht ein höherer BMI mit einer erhöhten Wahrscheinlichkeit einer Depression einher und um wieviel steigen die logodds einer Depression pro zusätzlichem BMI-Punkt
und was meinst du genau mit "interessant", in dem Sinne, dass es mich nicht stören sollte, dass sie hoch miteinander korrelieren?
Mit dem Chi-Quadrat kannst Du Zusammenhänge zwischen je einem Prädiktor und der Depression untersuchen, nicht aber die Zusammenhänge von mehreren Prädiktoren gleichzeitig mit der Depression. Nur die Regressionsanalyse erlaubt letzteres. Nur bei letzterem ist die Mulikollinearität ein Thema. Das Problem taucht also bei der Regressionsanalyse erst auf, wenn Chi-Quadrat ohnehin schon am Ende ist.
Man liest ja überall wie instabil das Regressionsverfahren wird, wenn "Multikollinearität" besteht.
Im multivariaten Fall, den Du mit Chi-Quadrat überhaupt nicht abdecken kannst.
es gibt ja die Optionen Einschluss, Vorwärts, Rückwärts etc.....
Mit ein bisschen Glück kann man das alles weglassen und das menschliche Gehirn anstelle stupider Computeralgorithmen dafür nehmen. Entscheide aufgrund medizinisch-psychologischem Wissen, was interessant sein kann, und nimm das alles mit in die Regression auf. Je größer Deine Fallzahl, umso großzügiger kannst Du einschließen, je kleiner, umso gründlicher musst Du Dir das überlegen. Automatischer Einschluss führt, egal ob vorwärts, rückwärts oder durch die Brust ins Auge zu einer Überanpassung an Deine Stichprobe. Es gibt verschiedene Meinungen dazu, hier im Forum wird es schwer werden, eine Stimme dafür zu finden.
LG,
Bernhard