Multiple Regression mit 34 Dummy-Variablen

Alle Verfahren der Regressionanalyse.

Multiple Regression mit 34 Dummy-Variablen

Beitragvon R_an » Fr 13. Jul 2018, 13:04

Liebe alle

Im Rahmen meiner Masterarbeit befasse ich mich mit folgende Fragebogen: http://www.uniklinik-duesseldorf.de/fil ... ter.de.pdf

Eine meiner Fragestellungen befasst sich mit dem Zusammenhang zwischen den 34 Items und dem Belastungsthermometer-Wert bzw. wäre eine Gewichtung der einzelnen Items das Ziel = welche Items wirken sich wie fest auf die Belastung aus? Jedoch kann ich ja schlecht eine multiple Regression mit 34 Dummy-Variablen rechnen. Daher meine Fragen:

1.Wäre es möglich, die Anzahl am Items (=UV) durch eine vorgängige Korrelationsanalyse mit der AV zu reduzieren? Also könnte ich so vorgehen, dass ich die 34 Items mit dem Belastungswert korreliere (also Dummy-Variablen mit einer metrischen Variable) und dann nur die Items in die Regression aufnehme, die eine mittlere-starke Korrelation aufweisen?
2. Oder würdet ihr zuerst über die Items der 5 Problembereiche seperat Regressionsanalysen rechnen und danach eine Gesamtregression rechnen, die alle signifikanten Items enthält?
3. Wie würdet ihr vorgehen? Habt ihr Ideen?

Ich bin euch dankbar für jeden noch so kleinen Tipp oder Trick,
würde mich sehr über Antworten freuen :)
Anna
R_an
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Do 22. Feb 2018, 09:52
Danke gegeben: 11
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regression mit 34 Dummy-Variablen

Beitragvon PonderStibbons » Fr 13. Jul 2018, 13:17

Eine meiner Fragestellungen befasst sich mit dem Zusammenhang zwischen den 34 Items und dem Belastungsthermometer-Wert bzw. wäre eine Gewichtung der einzelnen Items das Ziel = welche Items wirken sich wie fest auf die Belastung aus?

Aus welchem Grund? Bzw. welchen Sinn und Zweck soll das haben, wozu soll das dienen?
Jedoch kann ich ja schlecht eine multiple Regression mit 34 Dummy-Variablen rechnen.

Wie groß ist die Stichprobe?
1.Wäre es möglich, die Anzahl am Items (=UV) durch eine vorgängige Korrelationsanalyse mit der AV zu reduzieren? Also könnte ich so vorgehen, dass ich die 34 Items mit dem Belastungswert korreliere (also Dummy-Variablen mit einer metrischen Variable) und dann nur die Items in die Regression aufnehme, die eine mittlere-starke Korrelation aufweisen?

Führt zu einem überangepassten Modell, nicht generalisierbaren Ergebnissen.
2. Oder würdet ihr zuerst über die Items der 5 Problembereiche seperat Regressionsanalysen rechnen und danach eine Gesamtregression rechnen, die alle signifikanten Items enthält?

Nein. Aber wie gesagt, Sinn und Zweck der Übung sind unklar.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
R_an

Re: Multiple Regression mit 34 Dummy-Variablen

Beitragvon R_an » Fr 13. Jul 2018, 13:53

Vielen Dank für deine rasche Antwort und Hilfe :)

Aus welchem Grund? Bzw. welchen Sinn und Zweck soll das haben, wozu soll das dienen?

Der Fragebogen impliziert durch seinen Aufbau/sein Antwortformat, das sich alle 34 Items/Probleme gleich stark auf die Belastung einer Person auswirken, da jeweils ja nur eine Ja/Nein- Antwort zur Verfügung steht (=habe das Problem vs. habe es nicht), nicht jedoch wie stark einen welches Problem belastet. Mein Betreuer möchte nun, dass ich durch ein Regression zu einer Gewichtung der einzelnen Items kommen kann. Verstehst du was ich meine? :)

[Wie groß ist die Stichprobe?

Meine Stichprobe besteht aus 494 Probanden bzw. ausgefüllten Fragebögen.

Anna
R_an
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Do 22. Feb 2018, 09:52
Danke gegeben: 11
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regression mit 34 Dummy-Variablen

Beitragvon PonderStibbons » Fr 13. Jul 2018, 14:08

Der Fragebogen impliziert durch seinen Aufbau/sein Antwortformat, das sich alle 34 Items/Probleme gleich stark auf die Belastung einer Person auswirken, da jeweils ja nur eine Ja/Nein- Antwort zur Verfügung steht (=habe das Problem vs. habe es nicht), nicht jedoch wie stark einen welches Problem belastet. Mein Betreuer möchte nun, dass ich durch ein Regression zu einer Gewichtung der einzelnen Items kommen kann. Verstehst du was ich meine?

Ich verstehe, was Du meinst, nur erkenne ich den Sinn noch nicht. Wozu diese "Gewichtung"? Was kann man damit praktisch anfangen? Vermutlich nichts. Oder geht es darum, eine Art Kurzversion durch Ausschluss von Items zu konstruieren? Oder geht es nicht um eine praktische/methodische, sondern um eine substanzwissenschaftliche Problemlösung ("Erforschung von Faktoren, welche das Leiden von Patientengruppe X determinieren")?

So oder so, man stelle sich einmal das abschließende Regressionsmodell vor, mit jeder Menge Gewichte, mal groß mal klein, manche gegen 0, viele nicht "statistisch signifikant", andere sehr wohl. Was schlösse man daraus?

Meine Stichprobe besteht aus 494 Probanden bzw. ausgefüllten Fragebögen.

Na wenigstens eine brauchbare Fallzahl. Welche Patientendaten liegen denn sonst noch vor?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
R_an

Re: Multiple Regression mit 34 Dummy-Variablen

Beitragvon R_an » Fr 13. Jul 2018, 15:48

Ich verstehe, was Du meinst, nur erkenne ich den Sinn noch nicht. Wozu diese "Gewichtung"? Was kann man damit praktisch anfangen? Vermutlich nichts. Oder geht es darum, eine Art Kurzversion durch Ausschluss von Items zu konstruieren? Oder geht es nicht um eine praktische/methodische, sondern um eine substanzwissenschaftliche Problemlösung ("Erforschung von Faktoren, welche das Leiden von Patientengruppe X determinieren")?


Das Letztere trifft es gut. Praktisch würde es ja schon hilfreich sein, wenn man wüsste, diese, diese und diese Probleme des Fragebogen stehen oft mit einer hohen Belastung im Zusammenhang. Der Fragebogen soll dazu dienen, Patienten zu identifizieren die an einer hohe Belastung leiden (definiert als Belastung die über der normalen Belastung im Rahmen einer Krebserkrankung liegt) um diese dann an Fachpersonen weiter zu verweisen. Daher wäre es schon spannend zu untersuchen, welche Probleme sogenannten Distress(Belastung) auslösen :)

So oder so, man stelle sich einmal das abschließende Regressionsmodell vor, mit jeder Menge Gewichte, mal groß mal klein, manche gegen 0, viele nicht "statistisch signifikant", andere sehr wohl. Was schlösse man daraus?


Schlussendlich würde ich gerne Aussagen darüber machen können, welche Items ein hohes Distress Erleben auslösen. Der Fragebogen ist in die 5 Problembereiche praktische Probleme, familiäre Probleme, emotionale Probleme, religiöse/spirituelle Belangen und körperliche Probleme gegliedert, die wiederrum einzelne Items beinhalten. Ich stelle mir es so vor, dass ich durch die Gewichte der Items dann in etwa sehen würde, welche Items stärker zu einer hohen Belastung beitragen als andere. Ich stelle es mir jedoch schwierig vor, 34 Gewichte zu interpretieren. Leider weiss ich nicht, wie ich die Anzahl Items in der Problemliste im Vorhinein reduzieren könnte, um nicht so viele Prädiktoren ins Regressionsmodell aufnehmen zu müssen, wenn das mit der Korrelationsanalyse nicht geht.

Na wenigstens eine brauchbare Fallzahl. Welche Patientendaten liegen denn sonst noch vor?

Wenig - nur Alter und Geschlecht der Patienten.

Liebe Grüsse
Anna
R_an
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Do 22. Feb 2018, 09:52
Danke gegeben: 11
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regression mit 34 Dummy-Variablen

Beitragvon PonderStibbons » Fr 13. Jul 2018, 16:24

Das Letztere trifft es gut. Praktisch würde es ja schon hilfreich sein, wenn man wüsste, diese, diese und diese Probleme des Fragebogen stehen oft mit einer hohen Belastung im Zusammenhang.

Tatsächlich? Einiges ist auch Folge der Belastung.
Der Fragebogen soll dazu dienen, Patienten zu identifizieren die an einer hohe Belastung leiden (definiert als Belastung die über der normalen Belastung im Rahmen einer Krebserkrankung liegt) um diese dann an Fachpersonen weiter zu verweisen.

Dazu braucht man nur das Fieberthermometer.
Daher wäre es schon spannend zu untersuchen, welche Probleme sogenannten Distress(Belastung) auslösen

Bzw. Bestandteil davon sind bzw. dessen Folgen. Man fragt "haben Sie Sorgen, Ängste, Depressionen erlebt" und das wäre dann Auslöser von Belastungsempfindungen? Das klingt alles nicht sehr durchdacht. Und es stellt sich nach wie vor als ein unklarer Mix aus ein bißchen Testentwicklung und ein bißchen theoretischer Arbeit dar.

Alas, letzlich gehoppt wie gesprungen
- Du kannst eine multiple Regression mit 34 Prädiktoren rechnen, dazu reicht die Probandenzahl aus.
-Du kannst einmal schauen, ob Du mit "regularisierter" Regression (Stichwort u.a. LASSO) was anfangen kannst.
-Du kannst auch 34 einzelne Korrelations-Analysen machen, was der skizzierten Fragestellung vielleicht eher entspräche als irgendwelche Gewichtungen interkorrelierter Items.
-Du kannst auch mit einem Teil der Stichprobe gering mit "Leiden" korrelierende Items aussortieren und mit dem Rest der Items eine Regression rechnen, das Resultat dann an der übrigen Stichprobe kreuzvalidieren, um zu checken, ob die Ergebnisse stabil sind.
Schlussendlich würde ich gerne Aussagen darüber machen können, welche Items ein hohes Distress Erleben auslösen.

Siehe oben, das ist eher ein Kuddelmuddel von Bestandteilen, Antezedenzen, Ursachen, Auslösern, Begleiterscheinungen und Konsequenzen von Leiden. Dazu kommen noch Probleme mit der Beurteilung in Subgruppen. Wer nicht religiös oder wer ohne Kinder ist, dem bedeuten die entsprechenden Items nichts, für denjeinigen mit vorher festem Glauben oder mit Kindern sind Glaubensverlust oder Probleme mit Kindern eventuell schwergewichtig.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
R_an

Re: Multiple Regression mit 34 Dummy-Variablen

Beitragvon R_an » So 15. Jul 2018, 11:16

Alas, letzlich gehoppt wie gesprungen
- Du kannst eine multiple Regression mit 34 Prädiktoren rechnen, dazu reicht die Probandenzahl aus.
-Du kannst einmal schauen, ob Du mit "regularisierter" Regression (Stichwort u.a. LASSO) was anfangen kannst.
-Du kannst auch 34 einzelne Korrelations-Analysen machen, was der skizzierten Fragestellung vielleicht eher entspräche als irgendwelche Gewichtungen interkorrelierter Items.
-Du kannst auch mit einem Teil der Stichprobe gering mit "Leiden" korrelierende Items aussortieren und mit dem Rest der Items eine Regression rechnen, das Resultat dann an der übrigen Stichprobe kreuzvalidieren, um zu checken, ob die Ergebnisse stabil sind.


Ich habe mir nochmals Gedanken darüber gemacht und bin zum Entschluss gekommen, dass ich wohl besser eine binär logistische Regression rechne, mit dem Belastungswert als AV (Werte 0-4 = normale Belastung, 5-10 = schwere Belastung) und den 34 Items als dichotome UV's.

Lg Anna
R_an
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Do 22. Feb 2018, 09:52
Danke gegeben: 11
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regression mit 34 Dummy-Variablen

Beitragvon PonderStibbons » So 15. Jul 2018, 12:00

Die Dichotomisierung als solche und die Grenzwertsetzung sind doch völlig arbiträr, was soll das bringen? Wer 5 Punkte hat, der ist ganz anders gestrickt als jemand mit 4 Punkten (Differenz 1), aber genau derselbe Typ wie jemand mit 10 Punkten (Differenz 5)?
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
R_an

Re: Multiple Regression mit 34 Dummy-Variablen

Beitragvon R_an » Mi 18. Jul 2018, 09:18

Die Dichotomisierung als solche und die Grenzwertsetzung sind doch völlig arbiträr, was soll das bringen? Wer 5 Punkte hat, der ist ganz anders gestrickt als jemand mit 4 Punkten (Differenz 1), aber genau derselbe Typ wie jemand mit 10 Punkten (Differenz 5)?


Nun ja, diese Dichotomisierung beruht auf dem international empfohlenen Cut-off Wert von 4, ab dem eine Person an signifikantem Distress leidet bzw. aufgrund ihrer Belastung eine Weiterverweisung an eine Fachstelle "nötig hätte". Jedoch frage ich mich, welche Einschlussmethode ich am besten wählen sollte - falls du mir hierzu noch weitere Tipps hast, bin ich dir natürlich dankbar :)
R_an
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Do 22. Feb 2018, 09:52
Danke gegeben: 11
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regression mit 34 Dummy-Variablen

Beitragvon PonderStibbons » Mi 18. Jul 2018, 09:56

Anscheinend kann man sich international nicht so recht einigen, publizierte Cutoffs sind 3, 4 und 5. Zudem entspricht die Dichotomisierung nicht der eingangs skizzierten Fragestellung Zusammenhang zwischen den 34 Items und dem Belastungsthermometer-Wert .

Was die Methodik angeht, könnte man sich eventuell von den Referenzstudien leiten lassen
https://www.ncbi.nlm.nih.gov/pubmed/25315367
https://www.ncbi.nlm.nih.gov/pubmed/27260016

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
R_an

Nächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: Google [Bot] und 3 Gäste

cron