Zusammenführung mehrerer Variablen für GLM

Alle Verfahren der Regressionanalyse.

Zusammenführung mehrerer Variablen für GLM

Beitragvon Maximo » Sa 6. Mär 2021, 13:34

Hallo zusammen,

Ich führe gerade eine Regressionsanalyse durch und bin auf eine kleine methodische Frage gestoßen.

Sowohl meine AV als auch meine UV sind durch mehrere Testergebnisse definiert. Ich habe 2 Werte die die UV beschreiben, die jedoch miteinander korrelieren weshalb eine multiple Regression nicht mehr in Frage kommt (richtig?). Daher würde ich einfach zwei GLM für die beiden jeweils machen.

Allerdings ist meine AV sogar durch 4 unabhängige Werte beschrieben. Ich würde gern alle 4 zusammenfassen zu einer Variable, die Skalen unterscheiden sich aber doch sehr, mit 0-4 bei der kleinsten und 0-54 bei der größten. Sollte ich davor dann z-standardisieren oder ist das irrelevant? Außerdem frage ich mich ob es methodisch in Ordnung ist wenn ich danach für jeden der 4 Einzelwerte der AV nochmal eine GLM durchführe um zu sehen inwiefern bei den einzelnen Werte Effekte erzielt werden.
Kann man das machen? Also quasi am Ende insgesamt ca. 10 Regressionen zur Beantwortung einer Hypothese?

Vielen lieben Dank schonmal im Voraus!
Liebe Grüße, Maxime
Maximo
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 8. Jan 2021, 14:40
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Zusammenführung mehrerer Variablen für GLM

Beitragvon strukturmarionette » Sa 6. Mär 2021, 14:00

Hi,

zunächst:
- was kürzt du ab mit GLM?
- wie lautet denn deine eine Arbeitshypothese konkret?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Zusammenführung mehrerer Variablen für GLM

Beitragvon Maximo » Sa 6. Mär 2021, 14:28

Hi! :)
Danke erstmal für die Antwort,

Zu 1: Sorry, ich meine eine eine lineare Regression!

Zu 2: Die Hypothese lautet: Eine hohe Bewertung der therapeutischen Allianz führt zu einem günstigen Haftverlauf.

Die therapeutische Allianz wurde hierbei mit 2 Tests erhoben die beide dieses Konzept messen aber andere Dimensionen innerhalb der Allianz berücksichtigen.
Der Haftverlauf wird bestimmt durch 2 Tests die eine Rückfallwahrscheinlichkeit (ausgegeben als Wert, nicht Prozentwert) schätzen, sowie die Anzahl therapeutischen Rückschlagen und der Anzahl an Disziplinarmaßnahmen.
Maximo
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 8. Jan 2021, 14:40
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Zusammenführung mehrerer Variablen für GLM

Beitragvon bele » Sa 6. Mär 2021, 19:38

Hallo Maximo,

Maximo hat geschrieben:. Ich habe 2 Werte die die UV beschreiben, die jedoch miteinander korrelieren

Bist Du sicher, dass Du zwei Werte in einer UV hast? Oder hast Du nicht vielmehr zwei UV? Das klingt nach Wortklauberei, macht aber den Unterschied, ob Deine Frage verständlich ist, oder nicht.

weshalb eine multiple Regression nicht mehr in Frage kommt (richtig?).

Das kommt sehr auf den Zweck der Regression an. Wenn es um Vorhersagen zukünftiger Werte geht, sollte das kein Problem sein. Wenn Dich das erreichbare interessiert, sollte das kein Problem sein. Wenn es Dir um um die zwei Signifikanztest für die beiden UV geht, hängt es davon ab, wie stark die Korrelation ist und wie groß die Stichprobe ist. Wenn es Dir darum geht, ob Du beide UV zur Vorhersage brauchst oder nur eine davon, könnte eine LASSO-Regression die beste Antwort sein.

Meine Empfehlung: nutzung-des-forums-f44/das-musste-mal-gepostet-werden-t6682.html

Daher würde ich einfach zwei GLM für die beiden jeweils machen

Ohne Einblick in die Fragestellung kann man dazu und dagegen nicht raten. Es gibt eine Reihe möglicher Antworten auf diese Frage.

Kann man das machen? Also quasi am Ende insgesamt ca. 10 Regressionen zur Beantwortung einer Hypothese?

Es ist durchaus möglich, zur Evaluation eines Zusammenhangs mehrere verschiedene Modelle zu rechnen, aber Du musst dann halt auch einen Plan haben, wie Du die verschiedenen Regressionen dann sinnvoll zu einer Antwort zusammenfügen willst, und das scheint mir derzeit eher ein zusammengefwürfeltes Kuddelmuddel zu sein -- wohlgemerkt, immer ohne zu wissen, welches Ziel eigentlich verfolgt werden soll, sodass ich vielleicht besser nichts sagen würde.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Zusammenführung mehrerer Variablen für GLM

Beitragvon Maximo » So 7. Mär 2021, 14:58

Hallo Bernhard,

Puh also ich muss sagen, dass ich mich gefühlt in dem ganzen immer mehr verliere und deshalb auch alles ein wenig "kuddelmuddelig" erscheint.

Ich würde vielleicht nochmal versuchen zu beschreiben wo ich hänge: Ich untersuche bei 90 Patienten einer Entziehungsanstalt, also Straftäter mit einem Hintergrund von Rauschmittelkonsum woran sich im Rahmen der Therapie die dort stattfindet möglicherweise festmachen lässt, dass die Therapie hilft und die Patienten einen Rehabilitationsprozess gehen um sich darauf aufbauend dann zukünftig auf diese Punkte in der Therapie noch stärker fokussieren zu können und therapeutische Erfolge zu erzielen.

Der zentrale Faktor welchen ich untersuche ist die therapeutische Allianz, die ist quasi synonym zu verstehen mit einer guten Beziehung zwischen Patient und Therapeut.
Die habe ich mit 2 validierten Tests gemessen die einem zum Schluss einen Score ausgeben, wie gut die Beziehung wahrgenommen wird. Das heißt beide messen im Grund dasselbe Konstrukt aber der eine Test erfragt vor allem Dinge die gut laufen und der andere erfragt vor allem Sachen die evtl schlecht laufen. Aus diesem Grund war es interessant beide durchzuführen und nicht nur einen. Beide Testergebnisse sind intervallskaliert und haben eine Range von 0-60 und 0-84

Als nächstes ist allerdings die Herausforderung, woran ich festmache ob wir therapeutische Erfolge feiern (Was ja das Ziel ist und in meiner Hypothese die AV darstellt, Hypothese steht auch nochmal unten). Da es nicht einen Wert gibt der mir diese Erfolge ausspuckt, war die Absicht, Faktoren die für gute oder auch schlechte Verläufe sprechen, zusammenzuführen zu einer Variable "Haftverlauf" quasi. Hierfür stehen mir wiederum 2 Fragebögen mit einem Score zur Verfügung die eine Rückfallwahrscheinlichkeit schätzen, außerdem habe ich die Anzahl an Disziplinarmaßnahmen als Konsequenz für Fehlverhalten im Verlauf der Unterbringung als Hinweis. Da stellt sich mir die Frage, die in der Originalpost stand, die Fragebogenergebnisse sind Verhältnisskaliert mit einer Range von 0-48 und 0-40, während die Disziplinarmaßnahmen nur von 0-5 gehen. Kann ich also diese Werte einfach so zusammenfassen? Oder macht da eine z-standardisierung sinn?

Meine Arbeitshypothese lautet: Eine hohe Bewertung der therapeutischen Allianz führt zu einem günstigen Haftverlauf.

Bist Du sicher, dass Du zwei Werte in einer UV hast? Oder hast Du nicht vielmehr zwei UV? Das klingt nach Wortklauberei, macht aber den Unterschied, ob Deine Frage verständlich ist, oder nicht.

Ehrlich gesagt bin ich mir gar nicht mehr sicher welches von beiden jetzt zutrifft. Es wäre aber tatsächlich interessant beide Tests auch einzeln in ihrer prädiktiven Kraft betrachten zu können.

Die Frage von gestern ob ich auch jeden der Faktoren für den Haftverlauf einzeln nochmal in einer Regression prüfen könnte ist quatsch, das kam gestern aus einem Wirrwarr an Gedanken heraus. Trotz allem bin ich mir gerade unsicher welche Methode die richtige wäre. Von einer Normalverteilung der Daten ist nicht auszugehen fällt mir gerade noch ein.

Möglicherweise konnte ich ja jetzt sortierter darstellen wo ich hänge und die Vorraussetzungen beschreiben?

Liebe Grüße, Maxime
Maximo
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 8. Jan 2021, 14:40
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Zusammenführung mehrerer Variablen für GLM

Beitragvon bele » So 7. Mär 2021, 18:59

Hallo Maximo,

Maximo hat geschrieben:Ich würde vielleicht nochmal versuchen zu beschreiben wo ich hänge: Ich untersuche bei 90 Patienten einer Entziehungsanstalt, also Straftäter mit einem Hintergrund von Rauschmittelkonsum woran sich im Rahmen der Therapie die dort stattfindet möglicherweise festmachen lässt, dass die Therapie hilft und die Patienten einen Rehabilitationsprozess gehen um sich darauf aufbauend dann zukünftig auf diese Punkte in der Therapie noch stärker fokussieren zu können und therapeutische Erfolge zu erzielen.


Ok, das ist die Beschreibung des Umfelds, wobei die weiter unten beschriebene Hypothese ja nicht hilft "diese Punkte der Therapie" zu differenzieren sondern nur sagt, dass gute Allianz zu gutem Outcome führt. Jetzt wäre es noch gut, etwas über den Anlass der Untersuchung zu wissen. Ist das eine Bachelor- oder Masterarbeit die mit den üblichen Mitteln eines Medizin-/Psychologiestudiums angegangen werden soll um zu zeigen, dass Du was gelernt hast, oder bist Du Sozialarbeiter in so einer Einrichtung und es geht nur um das Ergebnis, egal ob mit konventionellen oderunkonventionellen Mitteln?

Der zentrale Faktor welchen ich untersuche ist die therapeutische Allianz, die ist quasi synonym zu verstehen mit einer guten Beziehung zwischen Patient und Therapeut.


Das ist ein wenig unscharf. Geht es hier in dieser Frage in diesem Threade nur um die therapeutische Allianz oder geht es um ein komplexeres Modell?

Die habe ich mit 2 validierten Tests gemessen


Ok, das sind die zwei UV die Du hast und die wahrscheinlich hoch (negativ) miteinander korellieren. Dann geht es aber primär erstmal nicht darum, welcher der beiden Bögen wieviel Information beiträgt, sondern ob beide Bögen gemeinsam in der Lage sind, etwas vorherzusagen. Multikollinearität könnte dazu führen, dass beide Fragebögen jeder für sich nicht signifikant werden, aber man könnte doch messen, ob das Modell mit diesen beiden Prädiktoren zusammen eine gute Vorhersage des Erfolgs ermöglichen. Beispielsweise der Signifikanztest des gesamten Modells und das sollten sich an der Multikollinearität nicht stören.


Als nächstes ist allerdings die Herausforderung, woran ich festmache ob wir therapeutische Erfolge feiern ... Kann ich also diese Werte einfach so zusammenfassen? Oder macht da eine z-standardisierung sinn?


Zunächst mal müsste man hinterfragen, ob diese drei wirklich ein gemeinsames Konstrukt "Therapieverfolg" konsituieren. Das wäre eher eine Frage für eine Hauptkomponenten- oder Faktorenanalyse. Wenn die drei gemeinsam auf einem Faktor laden dann könnte man den Faktorwert als Abhängige Variable in der Analyse nutzen. Wenn nicht, macht das Zusammenfassen keinen Sinn.

Bist Du sicher, dass Du zwei Werte in einer UV hast? Oder hast Du nicht vielmehr zwei UV? Das klingt nach Wortklauberei, macht aber den Unterschied, ob Deine Frage verständlich ist, oder nicht.

Ehrlich gesagt bin ich mir gar nicht mehr sicher welches von beiden jetzt zutrifft.


Zwei Fragebogenwerte gleich zwei UV.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 8 Gäste

cron