PonderStibbons hat geschrieben:1. Ok. Es würde demnach Sinn machen, eine logistische Regression zu rechnen und direkt alle 34 UV's per Einschlussmethode rein zu nehmen?
M.E. weder eine logistische, noch 34 Prädiktoren. Aber man kann es ja mal versuchen, haben andere anscheinend auch schon. Außerdem ist das doch eine müßige Frage; die Vorgabe war ja
mein Betreuer möchte nun, dass ich durch ein Regression zu einer Gewichtung der einzelnen Items kommen kann.Also verstehe ich das richtig, dass ich nur ein Regressionsmodell mit allen Items rechnen muss und dann schaue, welche der Items darin signifikant sind und diese dann so interpretieren, dass diese Items das Risiko an sigifikantem Distress (bzw. Belastungswert üer dem Cut-off Wert) zu leiden, um die Wahrscheinlichkeit XX (Odds Ratio) erhöhen?
In Anwesenheit der übrigen Items. Wenn Items hoch überlappen, dann hat man ein Interpretationsproblem. Aber wie gesagt, die Vorgabe steht ja bereits.
Wie kann ich in einer logistischen Regression denn Kontrollvariablen wie beispielsweise das Alter reinnehmen?
Das sind Prädiktoren. Oder was soll die Frage bedeuten?
Nun ja, ich sehe dass es nicht der optimale Weg ist. Leider fehlt mir die Zeit so wie die statistischen Kenntnisse, um jetzt gross noch was Anderes zu machen. Daher möchte ich mich gerne an die Vorgehensweise des Artikel halten, in dem ebenfalls eine logistische Regression gerechnet wurde, damit ich wenigstens begründen kann, warum ich dieses Vorgehen gewählt habe bzw. eine Quelle habe um mein Vorgehen zu "zitieren" Dazu stehen mir folgende Angaben zur Verfügung:
"Lastly, we constructed multiple logistic regression models of all thermometer items to determine how much variance in distress was predicted by all the items on the instrument. We then report items that are significantly associated with being in the at-risk group. For allanalyses, statistical significance was assessed as a type 1 error rate less 5 %. Both Cox and Snell R-Square and Nagelkerke R-Square are reported for the logistic regression analysis."
"A logistic regression model was created to predict risk status (i.e., score of 0–3 denoting low risk or 4–10 denoting at risk on the overall distress rating). This model contained all of the problem list items as well as age and marital status as control variables. The results of the logistic Regression indicated that those who were at risk for high distress were more likely to endorse the following problems: financial (odd ratio (OR) 2.50, 95 % confidence interval (CI) 1.45–4.32, p=.001), nervousness (OR 1.76, 95 % CI 1.03–3.01, p=.03), worry (OR 5.57, 95 % CI 3.38– 9.19, p<.001), getting around (OR 3.54, 95 % CI 1.68– 7.47, p=.001), and sleep (OR 1.90, 95 % CI 1.1 –3.05, p=.01). In addition, the model accounted for 32.8 % (Cox and Snell) to 49.8 % (Nagelkerke) of the variance in distress status (Table 3)."
Dazu habe ich noch folgende Fragen:
1. Warum ist im ersten Abschnitt die Rede von "Regression models", also mehreren Modellen? Rechne ich nicht nur ein logistisches Modell mit allen Prädiktoren (die ich per Einschluss reinnehme)?
2. "model contained all of the problem list items as well as age and marital status as control variables" - kann ich das Alter als 35igsten Prädiktor reinnehmen und dann gilt es als Kontrollvariable? Oder wie interpretiere ich die einzelnen Odds Ratio der Items? Sind diese abhängig von den anderen Items?
Danke und liebe Grüsse