Vergleich mehrerer kategorialer Prädiktoren

Alle Verfahren der Regressionanalyse.

Vergleich mehrerer kategorialer Prädiktoren

Beitragvon fiddi » Di 24. Nov 2020, 17:29

Hallo Zusammen,

ich möchte mit Hilfe der multiplen Regression untersuchen ob sich 5 verschiedene Prädiktoren in der Vorhersage eines Outcomes (metrisch) unterscheiden. Nun sind die 5 Prädiktoren aber alle kategorial (Häufigkeitsausprägung 1 bis 5), funktioniert es mit der Regression mehrere kategoriale Prädiktoren in ihrer Wirkung auf das Outcome zu vergleichen, bzw deren einflussreichste Ausprägung? Oder kann man nur die Wirkung der Häufigkeiten innerhalb eines Prädiktors vergleichen?
fiddi
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Mi 18. Nov 2020, 11:53
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Vergleich mehrerer kategorialer Prädiktoren

Beitragvon PonderStibbons » Di 24. Nov 2020, 19:00

Un was geht es da ganz konkret? Was messen die Prädiktoren,
welches ist die abhängige Variable, wie groß ist die Stichprobe?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Vergleich mehrerer kategorialer Prädiktoren

Beitragvon fiddi » Mi 25. Nov 2020, 12:52

Die abhängige Variable sind Stresssymptome und die Prädiktoren sind verschiedene Umgebungen (Park, See, etc) zu denen jeweils die Häufigkeit des Aufenthalts anzugeben ist (1 = täglich..5 = nie). Die Frage ist ob eine der Umgebungen mit weniger Stresssymptomen verbunden ist und wenn ja welche.
fiddi
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Mi 18. Nov 2020, 11:53
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Vergleich mehrerer kategorialer Prädiktoren

Beitragvon PonderStibbons » Mi 25. Nov 2020, 13:16

Wie groß ist bitte die Stichprobe?

Wie wurde die Variable "Stressymptome" konkret erfasst und gemessen?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Vergleich mehrerer kategorialer Prädiktoren

Beitragvon bele » Mi 25. Nov 2020, 13:18

fiddi hat geschrieben:...) zu denen jeweils die Häufigkeit des Aufenthalts anzugeben ist (1 = täglich..5 = nie).


Dann darf man versuchen, dass es sich um ein Messwiederholungsdesign handelt, weil gleiche Personen die verschiedenen Umgebungen beurteilen? Oder beurteilt jede Person nur eine Umgebung, sodass die Umgebungsbeurteilungen unabhängige Stichproben sind?

Du merkst an meiner Rückfrage, dass Du vergessen hast, essentielle Rahmenbedingungen zu schildern. Deshalb solltest Du PonderStibbons Rückfrage ernst nehmen, ausführlich Frage und Datenerhebung schildern und keinesfalls seine gezielte Frage nach der Stichprobengröße übersehen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Vergleich mehrerer kategorialer Prädiktoren

Beitragvon fiddi » Mi 25. Nov 2020, 16:20

Die Stichrobengröße soll mindestends 350 Personen umfassen.

Stresssymptome werden mit dem PSQ-20 (https://www.psycharchives.org/handle/20.500.12034/364) erhoben.

Es handelt sich um ein Querschnittdesign und alle Personen werden zur Nutzungshäufigkeit von allen Umgebungen (5 Umgebungen) befragt, aber nur einmal zu ihren Stresssymptomen.
Es gibt circa 10 Kontrollvariablen

Ich würde gerne herausfinden welche der Umgebungen den günstigsten Einfluss auf die Stresssymptome hat... .
Und ich bin mir nicht sicher welche Methode die beste für die Fragestellung ist, da, wie du schon sagst Bernhard, eine Person nicht nur Angaben zur Nutzungshäufigkeit einer Umgebung macht, sondern zu allen Umgebungen. Deswegen weiß ich nicht wie der einzelne Einfluss einer jeden Umgebung auf die Stresssymptome zu erheben ist. Ist das Problem vielleicht einfach über eine ANOVA mit Messwiederholung zu lösen? :oops:
Ich hoffe die Erklärung war verständlich.
Vielen Dank und LG
fiddi
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Mi 18. Nov 2020, 11:53
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Vergleich mehrerer kategorialer Prädiktoren

Beitragvon bele » Mi 25. Nov 2020, 16:31

Die Erklärung war verständlich aber es geht tatsächlich in eine ganz andere Richtung als ich bisher angenommen hatte. Ich mach mal einen Schnellschuss, weil ich jetzt erstmal vom Computer weg bin. Wie wäre es mit einer linearen Regression, bei der für jede einzelne Person die Stresssymptome als Summe aus den dummycodierten Aufenthaltsorten-Zeiten dieser Person vorhergesagt werden?
5 Umgebungen à 4 Dummyvariablen macht 20 Prädiktoren (plus Intercept und vielleicht in paar Kontrollvariablen) - das kann mit n = 350 gut funktionieren. Problem ist: Du erhälst damit eine Gewichtung für "täglich im Park" und für "einmal pro Woche im Park" aber Du willst ja eigentlich eine Gewichtung für "Park" haben, wenn ich Dich richtig verstehe?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Vergleich mehrerer kategorialer Prädiktoren

Beitragvon fiddi » Mi 25. Nov 2020, 19:51

Danke Bernhard :)

Für jede Umgebung eine Gewichtung zu haben wäre schon super, dann wüsste man schon einmal ob eine Umgebung überhaupt einen Zusammenhang zu Stresssymptomen hat und ab welcher Häufigkeit im Vergleich zu "nie" es einen Unterschied gäbe.

Aber genau, eigentlich müsste es eine Gewichtung für "Park" sein, um dann die Umgebungen vergleichen zu können...

Eine Referenzkategorie und alle anderen Umgebungen und Häufigkeiten als Dummyvariablen (also 5x5-1 Dummyvariablen) würde glaube ich auch keinen Sinn machen, weil dann hätte man ja immer nur den Vergleich zu einer Referenz, beispielsweise "nie Park".

Hmm....
fiddi
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Mi 18. Nov 2020, 11:53
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Vergleich mehrerer kategorialer Prädiktoren

Beitragvon PonderStibbons » Mi 25. Nov 2020, 22:10

Für mein Verständnis ergäbe ein Modell mit je 4 dummy-Variablen
für jede Umgebung und jeweils Referenzkategorie "gar nicht" durchaus
Sinn. Probiere es doch einmal.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Vergleich mehrerer kategorialer Prädiktoren

Beitragvon bele » Do 26. Nov 2020, 09:21

Hallo,

ich bin's nochmal mit einem anderen, zugegeben halbgaren Vorschlag.

Wie findet Ihr folgendes Modell? Jeder Ort hat einen Ortsstresswert (der über Regression zu bestimmen ist). Weiters hat jede der 5 Häufigkeitsausprägungen einen Anteilswert der beispielsweise in Prozent ausgedrückt werden kann. Der Stresswert ist die Summe der nach Häufigkeit gewichteten Stresswerte, also



Die Idee ist, dass die A-Werte für alle Orte gleich sind. Man unterstellt damit, dass "1x/Woche" jedem Ort den gleichen Anteil an Stressreduktion am Gesamt zubilligt. Dafür erhält man im Gegenzug für jeden Ort genau einen Grundwert und diese ließen sich untereinander vergleichen. Das war ja das Ziel.

Wahrscheinlich müsste man, um das Ganze bestimmbar zu machen, noch ein paar Zusatzregeln einführen wie z. B. und/oder vielleicht eine regularisierende Regressionsform wählen. Was mich dazu führt, dass ich auch noch nicht so genau weiß, wie ich so ein Modell schätzen würde. Vielleicht müsste man das halt in Stan übersetzen und per Markov-Chain-Monte-Carlo schätzen. Man müsste auch noch sehen, ob ein Mensch der täglich an ganz vielen Orten ist und ein Mensch, der den ganzen Tag an einem Ort ist dabei beide in das gleiche Modell passen oder ob man da das Modell dahingehend nochmal überarbeiten muss. Ich denke da jetzt aber nicht weiter drüber nach, solange ich keine Rückmeldung von Euch habe und solange unklar ist, ob wir von einer Hausarbeit oder einer peer reviewed zu publizierenden Arbeit sprechen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Nächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: Google [Bot] und 3 Gäste

cron