Ich werte eine Interventionsstudie aus (je 59 Patienten pro Gruppe),
Randomisiert, nicht randomisiert?
Outcome-Merkmal Komplikationshäufigkeit
AV ist nicht Komplikationshäufigkeit, sondern Komplikation ja/nein, nehme ich an.
Nun möchte ich wissen welche Variablen diesen Effekt am ehesten/meisten/stärksten beschreiben. Mein Betreuer meinte bereits, ich solle mit einem multivariaten Regressionsansatz mögliche Variablen untersuchen.
Da seid Ihr Euch nicht einig.
Deine Zielstellung ist, mit dem outcome korrelierte Merkmale zu identifizieren.
Eine multiple (nicht multivariate) Regression dagegen baut ein Modell, das den outcome auf Basis mehrerer Variablen vorhergesagt werden soll und bei dem in aller Regel die Einflussstärke der einzelnen Variablen sich durch simultane Berücksichtigung weiterer Variable mehr oder minder stark verändert.
Beide Zielstellungen scheinen aber wiederum nicht viel mit dem zu tun zu haben, worum es Dir tatsächlich geht. Zumindest
als auch die Intervention betreffende Merkmale in Frage (mittlere Anzahl zugeführter Kalorien, mittlere Menge an Eiweiss, mittlere Menge Eiweiss zu den Hauptmahlzeiten, mittlere Anzahl Kalorien zu den Zwischenmahlzeiten etc.)
scheint eine Frage danach zu sein, welche Interventionsmerkmale die Wirkung der Intervention vermitteln (mediieren). Das zu untersuchen erforderte mehr, als eine schlichte multiple Regression. Ferner,
"...die Intervention x hat laut dem Model abc den Haupteinfluss. Sie beschreibt zu ...% die Variabilität der AV.
Wie willst Du Intervention und Bestandteile der Intervention denn trennen? Das ist doch konfundiert? Dagegen Kovariaten wie Alter etc. kann man ja berücksichtigen, aber da ist auch die Frage, wieso es bei einer Interventionsstudie juckt, ob die Intervention jetzt mehr % beschreibt als diese Patientenmerkmale.
Da nicht angegeben ist, wie die Gruppenzuweisung erfolgte, ist das alles shr schwer einzuschätzen, die weiteren Ausführungen sind, wie angedeutet, noch etwas sehr widersprüchlich. Mir wird das Ziel nicht klar.
Um auf die Ausgangsfrage zurück zu kommen: Du kannst nicht denselben kleinen Datensatz mehrfach durchforsten und danach das Regressionsmodell optimieren, weil man erwarten muss, dass das in "overfitting" und nicht generalisierbaren Ergebnisse (Koeffizienten, R²) resultieren kann. Daher auch so unendlich viele Ergebnisse aus der Literatur, die für die Tonne, da nicht übertragbar sind. Sowas geht nur, wenn man einen Teildatensatz für Überprpüfungszwecke (Kreuzvalidierung) zur Verfügung hat. Das geht hier eher nicht, wegen der kleinen Stichprobe bei gleichzeitig vielen Prädiktoren (Faustregel: mindestens 10 Ereignisse (hier: Kompliktionen vermutlich) pro Prädiktor) . Besser ein der Fragestellung angepasstes, auf theoretischen Überlegungen basierendes Modell erstellen und dieses eben dann testen.
Gruß
P.
Bisher habe ich verschiedene binäre log. Regressionen (backward elim.) durchgeführt und die erhaltene UV, dann auch in einem weiteren Modell getestet, bis ich nur noch UVs mit signifikantem EInfluss hatte.
Sind mehr Details zur Beschreibung nötig?[/quote]