Masterthesis - multiple Regressionsanalyse

Alle Verfahren der Regressionanalyse.

Masterthesis - multiple Regressionsanalyse

Beitragvon SteidInaa » Do 30. Jun 2022, 12:07

Liebe Alle

Um meine Fragestellung beantworten zu können muss ich eine multiple Regressionsanalyse rechnen. Leider erfüllt mein Datensatz die Voraussetzung dafür nicht. Habt ihr eine Idee was ich anstellen einer Regressionsanalyse nun rechnen kann? (AV ist intervallskalliert und meine UV's sind auch alle intervallskalliert.)
Über eure Hilfe bin ich euch sehr dankbar!

Liebe Grüsse
Ina
SteidInaa
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 30. Jun 2022, 11:59
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Re: Masterthesis - multiple Regressionsanalyse

Beitragvon PonderStibbons » Do 30. Jun 2022, 13:06

Leider erfüllt mein Datensatz die Voraussetzung dafür nicht.

Das glaube ich erstmal gar nicht. Wer hat Dir das gesagt?
Habt ihr eine Idee was ich anstellen einer Regressionsanalyse nun rechnen kann? (

Dazu müsste man zumindest Thema, Fragestellung, grob das Erhebungsdesign, die Stichprobengröße (!) sowie die Variablen und deren Messverfahren kennen.

Mit freundlichen Grüßen

PonerStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
SteidInaa

Re: Masterthesis - multiple Regressionsanalyse

Beitragvon bele » Do 30. Jun 2022, 14:21

Hallo Ina,

zunächst einmal zur Nomenklatur

SteidInaa hat geschrieben:Leider erfüllt mein Datensatz die Voraussetzung dafür nicht. Habt ihr eine Idee was ich anstellen einer Regressionsanalyse nun rechnen kann?

Wovon Du derzeit glaubst, dass Du es nicht anwenden darfst, ist eine lineare Regression. All die anderen Verfahren, die hier als Antworten infrage kommen, heißen auch alle Regressionsanalyse, auch wenn sie nichts mit der linearen Regression zu tun haben sollten.

Oft haben die Leute falsche Vorstellungen davon, wann man eine lineare Regressionsanalyse einsetzen sollte und wann tatsächlich nicht. Deshalb hat PonderStibbons sicher Recht, wenn er das erstmal hinterfragen will. Wenn Du dann tatsächlich vom linearen Regressionsmodell weg musst kommt es sehr darauf an, was Du an Vorwissen über den Zusammenhang Deiner Prädiktoren hast und was das Ziel der Analyse ist. Bei manchen Regressionen geht es darum, möglichst gute Vorhersagen für neue Daten zu treffen, bei anderen geht es darum, den Einfluss bestimmter Prädiktoren zu beweisen und bei wieder anderen darum, verschiedene mögliche Zusammenhangstheorien zu vergleichen. Dafür könnte man dann auch verschiedene Regressionmethoden wählen.

Es macht also Sinn, Art und Hintergrund der Daten sowie die Fragestellung als auch das Warum hinter der Fragestellung nachvollziehbar darzustellen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

folgende User möchten sich bei bele bedanken:
SteidInaa

Re: Masterthesis - multiple Regressionsanalyse

Beitragvon SteidInaa » Do 30. Jun 2022, 15:04

PonderStibbson und Bernhard

Erstmal Danke für eure Antwort!! Ich bin komplett überfordert mit dieser Thematik und enorm dankbar für jeden einzelnen Tipp!

Nun folgender Fall liegt vor:
Voraussetzungen die bestehen müssen um meines Wissens eine Regressionsanalyse rechnen zu dürfen, sind:
- Die Variablen sind intervallskaliert
- Linearer Zusammenhang zwischen den UV’s und der AV
- Keine Multikollinearität d.h. die unabhängigen Variablen korrelieren nicht zu stark miteinander
- Normalverteilung des Fehlerwertes, Homoskedastizität des Fehlerwertes und keine Autokorrelation
- Bedingter Erwartungswert

Leider besteht bei meinen daten 1. kein linearer Zusammenhang und 2. besteht eine Multikollinearität der Daten.

Ich möchte mit meiner Fragestellung herausfinden, welche UV meine AV am besten hervorsagt.
Ich untersuche Copingstrategien und deren Einfluss auf die Veränderung des BDI-II (Depressioswert) Nun habe ich vier verschiedene Copingstrategien (UV) und möchte nun herausfinden welcher der UV's eine Krankheitsverbesserung am besten hervorsagt.

Die Copingstrategien sowie der Depressionswert wurden quantitativ erhoben. Wobei die Fragebögen jeweils bei Eintritt sowie bei Austritt in den stationären Aufenthalt von 30 Patienten ausgefüllt wurde.
Ich habe somit die Eintrittswerte sowie Austrittswerte der vier verschiedenen Copingstrategien und der BDI-II Werte.

Helfen diese Informationen?

Danke euch und liebe Grüsse
Inaa
SteidInaa
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 30. Jun 2022, 11:59
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Re: Masterthesis - multiple Regressionsanalyse

Beitragvon PonderStibbons » Do 30. Jun 2022, 15:18

Leider besteht bei meinen daten 1. kein linearer Zusammenhang

Was meinst Du damit konkret, woran machst Du es fest?
und 2. besteht eine Multikollinearität der Daten.

Das kann zwar lästig sein, ist aber kein grundsätzlicher Hinderungsgrund.
Zumal man dem auch häufig abhelfen kann.
Ich untersuche Copingstrategien und deren Einfluss auf die Veränderung des BDI-II (Depressioswert) Nun habe ich vier verschiedene Copingstrategien (UV) und möchte nun herausfinden welcher der UV's eine Krankheitsverbesserung am besten hervorsagt.

Falls die Copingstrategien so stark überlappen, dass deswegen Multikollineartät vorliegen hat,
dann spricht das doch schonmal für sich. Wie soll man die Wirksamkeit vernünftig vergleichen,
wenn die Strategien nicht auseinanderzuhalten sind? Sofern der Wirksamkeitsvergleich überhaupt
eine sinnvolle Frage in diesem Kontext sein sollte.
Dazu kommt, dass n=30 als viel zu wenig erscheint, um eine solch anspruchsvolle Frage mit dem
Vergleich von 4 Prädiktoren befriedigend bearbeiten zu können. Welche Idee steckt denn bei der
multiplen lineare Regression dahinter - die ergibt doch erstmal nur, wie gut die 4 Prädiktoren
gemeinsam etwas vorhersagen, und eventuell ob ein Prädiktor unter Berücksichtigung der
übrigen einen nachweisbaren Effet hat.

Mit freundichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Masterthesis - multiple Regressionsanalyse

Beitragvon bele » Do 30. Jun 2022, 15:49

Hallo Ina,

ich hänge mich an PonderStibbons nochmal dran, obwohl alles vom ihm geschriebene mich auch interessiert wiederhole ich seine Fragen/Anmerkungen nicht.

Ich nehme mal an, dass Du nicht nur die Ausprägungen der vier Copingstrategien, sondern auch noch weitere Prädiktoren, vielleicht Alter, Geschlecht, etc. vorgesehen hattest. Wenn ja, dann wäre es wichtig zu wissen, wieviele es werden.

Dreizig ist eine kleine Zahl. Liegt das daran, dass das Krankheitsbild so selten / die Studienpopulation so klein ist, oder handelt es sich um eine Qualifikationsarbeit, die eher dazu da ist zu zeigen, was Du im Studium gelernt hast denn als Wissensgewinn veröffentlicht zu werden? Wenn ich jetzt vorschlage, einen randomForest zu rechnen und ein Variableninformationsmaß anzuschauen -- ist das interessant, weil es mit Linearität nichts zu tun hat oder ist es uninteressant, weil Dein Professor das vielleicht nicht kennt und dann auch nicht benoten will?

Zuletzt schiele ich ein wenig auf eine Bayes-Regression: Wenn man nur kleine Stichproben hat, bei denen es mit der Signifikanz nicht unbedingt gut aussieht aber dafür gute Vorab-Vorstellungen, mit welchen Ergebnissen man rechnen muss, weil jemand anderens schon mal was ähnliches gerechnet hat, dann kann man gut den kleinen Erkenntnisgewinn aus der kleinen Stichprobe damit quantifizieren. Ich würde aber nicht als Studienabschluss eine Bayes-Statistik rechnen, wenn ein Studiengang sich entschieden hat, das gar nicht zu lehren.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: Masterthesis - multiple Regressionsanalyse

Beitragvon SteidInaa » Do 30. Jun 2022, 16:21

Hoi Zusammen

1. linearer Zusammenhang
Ich habe Streudiagramme erstellt zwischen den verschiedenen UV's und der AV. und es zeigte sich leider überhaupt kein linearer Zusammenhang.

Mein Ziel ist es zu erheben, wie viel Varianz die einzelnen UV's in der AV aufklären können. Müsste man dafür nicht eine Regression rechnen? Gibt es eine andere Möglichkeit?

2. Multikollinearität:
Hierzu muss ich meine vorherige Aussage zurücknehmen. Eine Multikollinearität besteht nicht, die unabhängigen Variablen korrelieren somit nicht miteinander.
Die Voraussetzung keiner Autokorrelation konnte jedoch nicht erreicht werden.

Stichprobengrösse:
Ja das N ist leider sehr tief ausgefallen. Es liegt am zeitlichen Faktor und sicherlich auch am Setting. Das Ziel ist nicht, die Ergebnisse zu publizieren.

Weitere Prädiktoren:
Alter, Geschlecht, stationäre Aufenthaltsdauer in Tagen, vier Copingstrategien

Von der Bayes-Regression oder randomForest haben ich noch nie etwas gehört...ich berechne meine Daten mit der Statistiksoftware SPSS. Kann nicht sagen, ob man diese Rechnungen über spss überhaupt rechnen kann.

Danke und LG
Ina
SteidInaa
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 30. Jun 2022, 11:59
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Re: Masterthesis - multiple Regressionsanalyse

Beitragvon bele » Do 30. Jun 2022, 16:36

Hallo!
SteidInaa hat geschrieben: Das Ziel ist nicht, die Ergebnisse zu publizieren. [...]
Von der Bayes-Regression oder randomForest haben ich noch nie etwas gehört..

Ok, wenn keine anderen Werkzeuge als ein Hammer zur Verfügung stehen, dann muss das Problem als Nagel angegangen werden. Alles andere als lineare Regression scheint zu weit weg zu sein. Soviel Pragmatismus wird sein müssen.

Ich habe Streudiagramme erstellt zwischen den verschiedenen UV's und der AV. und es zeigte sich leider überhaupt kein linearer Zusammenhang.

Du solltest lieber das Regressionmodell rechnen und dann die Variablen gegen die Residuen auftragen und schauen, ob da noch ein Trend übrig bleibt. Sonst betrachtest Du jede UV unabhängig von den anderen UV und das ist ja nicht der sinn eines multiplen Modells.
Dennoch die Frage: Hast Du irgendeinen anderen Zusammenhang sehen können, oder ist da einfach nur Sternenhimmel? Sternenhimmel ist ein linearer Zusammenhang mit einer Varianzaufklärung nahe Null.


Mein Ziel ist es zu erheben, wie viel Varianz die einzelnen UV's in der AV aufklären können. Müsste man dafür nicht eine Regression rechnen? Gibt es eine andere Möglichkeit?

Da muss die Rückfrage erlaubt sein, ob es um die Varianzaufklärung jeder einzelnen UV für sich genommen oder jeder UV nachdem die anderen UV schon berücksichtigt sind, geht?

Bist Du mit dem Begriff der Kovarianzanalyse /AN(C)OVA vertraut? Das ist ganz ähnlich wie lineare Regression, fokussiert aber, wie der Name schon sagt, mehr auf die Varianzaufklärung. Bestimmt kann man in SPSS zu einer Regression auch eine AN(C)OVA-Tabelle ausgeben.

Weitere Prädiktoren:
Alter, Geschlecht, stationäre Aufenthaltsdauer in Tagen, vier Copingstrategien


Wow, sechs Prädiktoren (ggf. plus ein Intercept) anhand von 30 Beobachtungen zu bestimmen ist viel verlangt. Das wird zu sehr großen Standardfehlern führen, die wiederum dazu führen, dass Deine p-Werte über 0,05 sein werden. Du kannst also die Varianzaufklärung in der Stichprobe bestimmen, wirst aber damit rechnen müssen, dass sie nicht signifikant werden.


HTH,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

folgende User möchten sich bei bele bedanken:
SteidInaa

Re: Masterthesis - multiple Regressionsanalyse

Beitragvon PonderStibbons » Do 30. Jun 2022, 17:24

Ich habe Streudiagramme erstellt zwischen den verschiedenen UV's und der AV. und es zeigte sich leider überhaupt kein linearer Zusammenhang.

Ich nehme an, es ist einfach eine Punktwolke ohne ersichtlichen Zusammenhang? Nicht ein U-förmiger
oder J-förmiger oder umgekehrt U-förmiger?
Mein Ziel ist es zu erheben, wie viel Varianz die einzelnen UV's in der AV aufklären können.

Das ist aber doch kein wissenschaftliches Ziel?! Und wenn Du Varianzaufklärungen ermitteln möchtest,
wären mehrere einfache Regressionen naheliegend. Wozu die multiple? Im Moment wären das 7 Prädiktoren
für n=30, das ist vielleicht ein bisschen zu viel für zu wenig.
Die Voraussetzung keiner Autokorrelation konnte jedoch nicht erreicht werden.

Du hast keine Zeitreihendaten, da ist das kein Thema.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
SteidInaa

Re: Masterthesis - multiple Regressionsanalyse

Beitragvon SteidInaa » Fr 1. Jul 2022, 10:48

Hoi Zusammen

Das Streudiagramm zeigt mir einen Sternehimmel/Punktwolke. Darf in diesem Fall trotzdem von einem linearen Zusammenhang ausgegangen werden?

Wenn ich rechnen möchte wie viel Varianz die einzelnen UV's unabhängig voneinander in der AV erklären, würde es somit eurer Meinung nach Sinn machen, eine lineare Regression zu rechnen? (Diese darf man jedoch auch nur rechnen, wenn UV und AV einen linearen Zusammenhang aufweisen.) Kann ich Begründen, weshalb ich die lineare Regressionen trotz Verletzung der Voraussetzung rechne? https://www.methodenberatung.uzh.ch/de/ ... onsanalyse

Ja mit der ANCOVA bin ich vertraut. Gute Option! Danke für den Hinweis! In diesem Fall hätte ich aber viele Fälle die ich berechnen müsste, da jede UV als Kovariate wirken müsste - richtig?

Danke und LG
Ina
SteidInaa
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 30. Jun 2022, 11:59
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Nächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast