Logistische Regressionsanalyse- Interpretation OddsRatio

Alle Verfahren der Regressionanalyse.

Logistische Regressionsanalyse- Interpretation OddsRatio

Beitragvon Jokomat » Mi 15. Mai 2013, 16:22

Hallo!
Ich arbeite gerade an meiner MA und hänge jetzt in der Interpretation der logistischen Regression fest und leider ist in meinem Umfeld keiner statistisch auch nur irgendwie bewandert.
Ich habe ein Studie über Tumoren mit einer Größe von N =39, wobei meine Stichprobe in 2 Gruppen eingeteilt ist, nämlich einmal Gruppe 1 (n= 24) mit keiner Metastasierung im Verlauf, und Gruppe 2 Metastasierung im Verlauf (n=15).
Hierbei habe ich 3 metrische Variablen x,y,z gemessen und jeweils mittels student’s t-test für unabhängige Variablen festgestellt, dass sich die Gruppen 1 und 2 sich in diesen Variablen signifikant unterscheiden und die einzelnen Variablen x,y,z jeweils größer sind in der Gruppe mit metastasierten Tumoren (also Gruppe 2).

Jetzt möchte ich wissen, ob ich anhand der drei Variablen x,y,z das Outcome Metastasierung tritt ein bzw. tritt nicht ein vorhersagen kann. Hierbei interessiert mich, ob eben alle Variablen zusammen, einzeln oder die Kombination 2er das Outcome vorhersagen können bzw. mit welcher Wahrscheinlichkeit sie das richtige outcome vorhersagen können.
Meine Idee ist, das je größer die Variablen x,y,z sind, desto wahrscheinlicher tritt eine Metastasierung der Tumore ein.

Da ich ja ein binäres outcome habe (metastase ja/nein) nehme ich die logistische Regressionsanalyse.

Wenn ich alle 3 Variablen x,y,z gleichzeitig in das Modell mit einschließe, wird in 76,9% der Fälle das richtige Outcome vorhergesagt, im Vergleich zu 61,5% wenn keiner der Variablen im Modell (Basicmodel) mit aufgenommen wird. Im Omnibustest sind für alle Variblen p< 0,05, d.h. sie liefern einen signifikanten Zuwachs zur Modellanpassung.
Nagelkerkes R-Quadrat ist 0,302, d.h. Die Fehlerreduktion durch einfügen der Prädiktoren in das Modell beträgt 30,2 %.


Jetzt zeigt mir SPSS diese Tabelle an:

Variablen in der Gleichung
RegressionskoeffizientB Standardfehler Wald df
Schritt 1a x ,246 ,184 1,783 1
y 2,477 2,847 ,757 1
z 1,549 1,767 ,769 1
Konstante -10,294 5,594 3,387 1

Variablen in der Gleichung
Sig. Exp(B)
Schritt 1a x ,182 1,279
y ,384 11,906
z ,381 4,707
Konstante ,066 ,000

Da der Wald- Test bei allen Prädiktoren > 0,05 ist, habe ich daraus geschlossen, dass sich kein signifikanter Einfluss der Prädiktoren auf das Outcome nachweisen lässt. Wie ich Exp(B) bzw. die OddsRatio zu interpretieren habe, weiß ich ehrlich gesagt nicht richtig.


Wenn ich nur die Variable x in das Modell mit einschließe oder auch die Variable x*y, dann ist im Wald-Test p< 0,05, d.h. kann die Variable x bzw. die Kombination von x*y das Outcome vorhersagen?
Variablen in der Gleichung
RegressionskoeffizientB Standardfehler Wald df
Schritt 1a y by x ,271 ,114 5,675 1
Konstante -2,100 ,767 7,502 1

Variablen in der Gleichung
Sig. Exp(B)
Schritt 1a y by x ,017 1,311
Konstante ,006 ,122


Also, worauf es eigentlich hinaus läuft, ist, dass ich nicht verstehe und ausdrücken kann, was man OddsRatio bei metrischen unabhängigen Variablen und eben die binäre abhängige Variable mir sagt und ob ich überhaupt den Rest zuvor richtig interpretiert habe.

Eigentliches großes Ziel dieser Studie soll sein, den Vorschlag zu bringen, meine Variablen x,y,z in der Zukunft bei den von mir untersuchten TUmorenart zu erheben, da sie dazu beitragen, eine Metastasierung zu erkennen.
Natürlich weiß ich, dass ich mit meiner kleinen Stichprobe nur sehr vorsichtig behaupten kann, dass sie das Outcome vorhersagen bzw. die Vorhersage des Outcomes verbessern.
Jokomat
Einmal-Poster
Einmal-Poster
 
Beiträge: 1
Registriert: Mi 15. Mai 2013, 16:11
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regressionsanalyse- Interpretation OddsRatio

Beitragvon daniel » Mi 15. Mai 2013, 17:18

Deine "Tabelle" kann ich in dieser Formatierung sehr schlecht (gar nicht) lesen.

Nagelkerkes R-Quadrat ist 0,302, d.h. Die Fehlerreduktion durch einfügen der Prädiktoren in das Modell beträgt 30,2 %.
[...]
Da der Wald- Test bei allen Prädiktoren > 0,05 ist, habe ich daraus geschlossen, dass sich kein signifikanter Einfluss der Prädiktoren auf das Outcome nachweisen lässt.


Wie hoch sind denn die Prädikatoren untereinander korreliert? Die relativ gute Modellpassung bei hohen Standardfehlern deutet in Richtung Multikolli-Probleme. Inhaltlich kann ich dazzu nichts sagen, weil ich (a) nicht vom Fach bin, und (b) selbst wenn ich es wäre, die Benennung der Faktoren als x, y, z nichtssagend ist.

Wenn ich nur die Variable x in das Modell mit einschließe oder auch die Variable x*y


Vorsicht. Was soll mit dem Produkterm getestet werden? Wenn Du eine Wechselwirkung der beiden Prädikatoren testen willst, musst Du zwingend auch die Einzelbestandteile der Interaktion (muliplikativen Verknüpfung), also x und y aufnehmen.

Wie ich Exp(B) bzw. die OddsRatio zu interpretieren habe, weiß ich ehrlich gesagt nicht richtig.


Relativ einfach. Das ist der multiplikative Effekt auf die Chancen Metastasen zu entwickeln, wenn der Prädikator um eine Einheit steigt.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 11 Gäste

cron