Regressionsmodelle vergleichen - stärkste unab. Var. finden

Alle Verfahren der Regressionanalyse.

Regressionsmodelle vergleichen - stärkste unab. Var. finden

Beitragvon just2008 » Mo 15. Aug 2011, 13:55

Hallo Statistikexperten,

wenn ich eine unabängige Variable ermitteln will, die besonders stark im Zusammenhang mit der abhängigen steht, ist es dann legitim, 1., mehrere Regressionsmodelle (mit jeweils unterschiedlichen UVs) zu erstellen und diese Modelle (mit nur noch 1 oder eben wenigen UV) dann zu vergleichen?

Kann ich weiterhin 2., die in den obigen Regressionen ermittelten UVs benutzen um nochmals eine Regression zur Identifikation der stärksten UV in Bezug auf die AV zu machen? Oder ergibt sich dann ein Problem mit der Testhäufigkeit?

Lieben Dank für Eure Antwort(en)
just2008
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 27. Jul 2011, 12:32
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Regressionsmodelle vergleichen - stärkste unab. Var. fin

Beitragvon PonderStibbons » Mo 15. Aug 2011, 14:01

wenn ich eine unabängige Variable ermitteln will, die besonders stark im Zusammenhang mit der abhängigen steht,

Dann betrachtest Du die bivariaten Korrelationen zwischen den unabhängigen Variablen und der AV.

Oder was genau möchtest Du erreichen? Angesichts der Vielzahl von Optionen ist eine präzise Formulierung der Fragestellung bzw. des Ziels unabdingbar.

Gruß

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Regressionsmodelle vergleichen - stärkste unab. Var. fin

Beitragvon just2008 » Mo 15. Aug 2011, 16:21

okay: Ich werte eine Interventionsstudie aus (je 59 Patienten pro Gruppe), bei der ein signifikanter Effekt auf das Outcome-Merkmal Komplikationshäufigkeit (jetzt meine AV) aufgetreten ist. Nun möchte ich wissen welche Variablen diesen Effekt am ehesten/meisten/stärksten beschreiben. Mein Betreuer meinte bereits, ich solle mit einem multivariaten Regressionsansatz mögliche Variablen untersuchen. Als unabhängige Variablen kommen sowohl feste Eigenschaften (Alter der Patienten, Krankheitsschwere, Anzahl Medikamente) als auch die Intervention betreffende Merkmale in Frage (mittlere Anzahl zugeführter Kalorien, mittlere Menge an Eiweiss, mittlere Menge Eiweiss zu den Hauptmahlzeiten, mittlere Anzahl Kalorien zu den Zwischenmahlzeiten etc.). Letzlich möchte ich wissen, ob man sagen kann: "...die Intervention x hat laut dem Model abc den Haupteinfluss. Sie beschreibt zu ...% die Variabilität der AV.
Bisher habe ich verschiedene binäre log. Regressionen (backward elim.) durchgeführt und die erhaltene UV, dann auch in einem weiteren Modell getestet, bis ich nur noch UVs mit signifikantem EInfluss hatte.

Sind mehr Details zur Beschreibung nötig?
just2008
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 27. Jul 2011, 12:32
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Regressionsmodelle vergleichen - stärkste unab. Var. fin

Beitragvon PonderStibbons » Mo 15. Aug 2011, 19:15

Ich werte eine Interventionsstudie aus (je 59 Patienten pro Gruppe),

Randomisiert, nicht randomisiert?
Outcome-Merkmal Komplikationshäufigkeit

AV ist nicht Komplikationshäufigkeit, sondern Komplikation ja/nein, nehme ich an.
Nun möchte ich wissen welche Variablen diesen Effekt am ehesten/meisten/stärksten beschreiben. Mein Betreuer meinte bereits, ich solle mit einem multivariaten Regressionsansatz mögliche Variablen untersuchen.

Da seid Ihr Euch nicht einig.

Deine Zielstellung ist, mit dem outcome korrelierte Merkmale zu identifizieren.

Eine multiple (nicht multivariate) Regression dagegen baut ein Modell, das den outcome auf Basis mehrerer Variablen vorhergesagt werden soll und bei dem in aller Regel die Einflussstärke der einzelnen Variablen sich durch simultane Berücksichtigung weiterer Variable mehr oder minder stark verändert.

Beide Zielstellungen scheinen aber wiederum nicht viel mit dem zu tun zu haben, worum es Dir tatsächlich geht. Zumindest
als auch die Intervention betreffende Merkmale in Frage (mittlere Anzahl zugeführter Kalorien, mittlere Menge an Eiweiss, mittlere Menge Eiweiss zu den Hauptmahlzeiten, mittlere Anzahl Kalorien zu den Zwischenmahlzeiten etc.)

scheint eine Frage danach zu sein, welche Interventionsmerkmale die Wirkung der Intervention vermitteln (mediieren). Das zu untersuchen erforderte mehr, als eine schlichte multiple Regression. Ferner,
"...die Intervention x hat laut dem Model abc den Haupteinfluss. Sie beschreibt zu ...% die Variabilität der AV.

Wie willst Du Intervention und Bestandteile der Intervention denn trennen? Das ist doch konfundiert? Dagegen Kovariaten wie Alter etc. kann man ja berücksichtigen, aber da ist auch die Frage, wieso es bei einer Interventionsstudie juckt, ob die Intervention jetzt mehr % beschreibt als diese Patientenmerkmale.

Da nicht angegeben ist, wie die Gruppenzuweisung erfolgte, ist das alles shr schwer einzuschätzen, die weiteren Ausführungen sind, wie angedeutet, noch etwas sehr widersprüchlich. Mir wird das Ziel nicht klar.

Um auf die Ausgangsfrage zurück zu kommen: Du kannst nicht denselben kleinen Datensatz mehrfach durchforsten und danach das Regressionsmodell optimieren, weil man erwarten muss, dass das in "overfitting" und nicht generalisierbaren Ergebnisse (Koeffizienten, R²) resultieren kann. Daher auch so unendlich viele Ergebnisse aus der Literatur, die für die Tonne, da nicht übertragbar sind. Sowas geht nur, wenn man einen Teildatensatz für Überprpüfungszwecke (Kreuzvalidierung) zur Verfügung hat. Das geht hier eher nicht, wegen der kleinen Stichprobe bei gleichzeitig vielen Prädiktoren (Faustregel: mindestens 10 Ereignisse (hier: Kompliktionen vermutlich) pro Prädiktor) . Besser ein der Fragestellung angepasstes, auf theoretischen Überlegungen basierendes Modell erstellen und dieses eben dann testen.

Gruß

P.


Bisher habe ich verschiedene binäre log. Regressionen (backward elim.) durchgeführt und die erhaltene UV, dann auch in einem weiteren Modell getestet, bis ich nur noch UVs mit signifikantem EInfluss hatte.

Sind mehr Details zur Beschreibung nötig?[/quote]
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
just2008

Re: Regressionsmodelle vergleichen - stärkste unab. Var. fin

Beitragvon just2008 » Mo 15. Aug 2011, 20:27

Ja, genau, randomisiert und Komplikation ja/nein. Alle o.g. Bedenken verstehe ich. Im Prinzip haben mich meine Verwirrungen hier ins Forum gebracht ...
Ich hab's demnach auch schlecht ausgedrückt - die Frage nach dem die Wirkung vermittelndem Interventionsmerkmal ist die richtige.

Uff, besten Dank erstmal. Ich überdenk' die Sache.
just2008
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 27. Jul 2011, 12:32
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste