multiple Regression?

Alle Verfahren der Regressionanalyse.

multiple Regression?

Beitragvon luftblasenkulli » Do 3. Dez 2020, 13:00

Hallo ihr Lieben:)

ich sitze gerade an meiner Masterarbeit und weiß nicht wie ich eine meiner Hypothesen berechnen kann. Ich habe jetzt eine sinnlose, aber einfach zu verstehende Hypothese erstellt, die genau meinem Problem entspricht - vielleicht kann mir ja jemand hier weiterhelfen :)

Hypothese (wie gesagt Inhalt bitte nicht beachten :D ): "Höhere Depressionswerte führen bei Frauen zu mehr Kreativität"

UV = Depression --> metrisch erhoben
AV = Kreativität --> metrisch erhoben
Geschlecht (Dummy-Kodierung mit 1/0)

Mein Ansatz wäre gewesen eine Regression zu berechnen. Mir ist bewusst, dass ich das Geschlecht wenn es Dummy-kodiert wurde auch einfach in die Regression aufnehmen könnte. Meiner Meinung nach macht das aber für die Fragestellung wenig Sinn.

Die einzige Erklärung um wirklich zu wissen ob höhere Depressionswerte nur bei Frauen zu mehr Kreativität führen aber bei Männern nicht kann ich doch nur hinbekommen wenn ich die Berechnung nur mit den Frauen und dann getrennt mit den Männern mache oder? und dann halt die Signifikanzen der beiden Regressionen anschaue?

Ich weiß dass das so statistisch wahrscheinlich nicht richtig ist, aber ich komm einfach nicht darauf wie man das in einem Verfahren berechnen kann :?

Freue mich über jeden Tipp!
Liebe Grüße und Danke im Vorhinein
luftblasenkulli
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Do 3. Dez 2020, 12:52
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Re: multiple Regression?

Beitragvon PonderStibbons » Do 3. Dez 2020, 13:34

Ich habe jetzt eine sinnlose, aber einfach zu verstehende Hypothese erstellt, die genau meinem Problem entspricht

Schildere besser Dein tatsächliches Problem. Also-ob-Probleme führen mitunter zu
Missverständnissen.

Bitte schildere die Studie ausführlich und zusammenhängend: wie lauten Thema und
Fragestellungen, wie sieht das Studiendesign aus (was wurde bei wem wann erhoben),
welche Variablen wurden erhoben und konkret mit welchen Messinstrumenten, wie
groß ist die Stichprobe?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: multiple Regression?

Beitragvon bele » Do 3. Dez 2020, 14:04

Hallo Luftblasenkulli,

[quote="luftblasenkulli "Hypothese (wie gesagt Inhalt bitte nicht beachten :D ): "Höhere Depressionswerte führen bei Frauen zu mehr Kreativität"

UV = Depression --> metrisch erhoben
AV = Kreativität --> metrisch erhoben
Geschlecht (Dummy-Kodierung mit 1/0) [/quote]

Wenn das tatsächlich eine genaue Entsprechung Deines eigentlichen Problems ist, dann reicht es völlig aus, nur eine Korrelation mit den Frauen zu rechnen und den Teil der Daten mit Männern wegfallen zu lassen.
Ich möchte aber auch gerne nochmal auf meinen Punkt 8. in diesem Link verweisen: nutzung-des-forums-f44/das-musste-mal-gepostet-werden-t6682.html#p31013

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1398 mal in 1384 Posts

folgende User möchten sich bei bele bedanken:
luftblasenkulli

Re: multiple Regression?

Beitragvon luftblasenkulli » Sa 5. Dez 2020, 15:07

PonderStibbons hat geschrieben:
Bitte schildere die Studie ausführlich und zusammenhängend: wie lauten Thema und
Fragestellungen, wie sieht das Studiendesign aus (was wurde bei wem wann erhoben),
welche Variablen wurden erhoben und konkret mit welchen Messinstrumenten, wie
groß ist die Stichprobe?


Ich versuch es mal etwas genauer zu erklären (glaub ganz genau sollte ich das Design einer unveröffentlichen Studie nicht ins Internet stellen, aber es stimmt natürlich dass das mit vereinfachten Modellen immer so ein Sache ist... :P )

Wir erheben mit einem EKG Daten, wodurch wir eine metrische Variable erhalten. Im Anschluss gibt es eine Exklusions/Inklusionsmanipulation wo jeweils die Hälfte der Probanden inkludiert und die andere exkludiert wird (nominale Variable). Danach wird den Teilnehmern ein recht komplexer Aggressionstest vorgegeben, bei denen einfach ein bestimmter Skalenwert berechnet wird, der metrisch ist.

Die Annahme ist, dass ein geringerer Wert in der EKG-Variable in der Exklusionsgruppe dazu führt, dass sie mehr Aggression zeigen werden.
Umgekehrt wird ein geringerer Wert in der EKG Variable in der Inklusionsgruppe dazu führen, dass sie weniger Aggression zeigen.

Und dann gibt es noch den Haupteffekt, dass Personen der Exklusionsgruppe generell mehr Aggression zeigen als Personen der Inklusionsgruppe.


Wir haben:
AV: metrisch Aggression
UV: nominal Exklusion/Inklusion
UV: metrische EKG Daten


Mein jetziger Stand wäre hierbei mit dem GLM eine univariate ANCOVA zu rechnen --> d.h. die metrische UV als Kovariate aufzunehmen. Ich weiß nur nicht ob das stimmen kann, weil hier die Homogenität der Regressions-slopes ja schon in der Hypothese nicht angenommen wird (wir denken ja dass es eine "Interaktion" zwischen den zwei UVs gibt.

Den Datensatz einfach in 2 Gruppen zu teilen und zuerst nur die Exklusions- und dann die Inklusionsgruppe anzuschauen und somit eine Regression zu machen kann ja statistisch nicht richtig sein... oder darf man das? dann wäre es natürlich sehr einfach und klar dass es eine Regression wäre...

Bin über jeden Gedankenanstoß dankbar :D
Zuletzt geändert von luftblasenkulli am Sa 5. Dez 2020, 17:10, insgesamt 3-mal geändert.
luftblasenkulli
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Do 3. Dez 2020, 12:52
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Re: multiple Regression?

Beitragvon luftblasenkulli » Sa 5. Dez 2020, 15:08

Stichprobengröße hab ich noch vergessen --> n=100 Personen
luftblasenkulli
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Do 3. Dez 2020, 12:52
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Re: multiple Regression?

Beitragvon bele » Sa 5. Dez 2020, 17:47

Hi!

Ich denke lieber in der Regressions- als inder AnCoVa-Welt, auch wenn sich beides mathematisch irgendwie gleicht


luftblasenkulli hat geschrieben:Und dann gibt es noch den Haupteffekt, dass Personen der Exklusionsgruppe generell mehr Aggression zeigen als Personen der Inklusionsgruppe.


Fangen wir damit an und codieren die Zugehörigkeit zur Exlusionsgruppe als Dummyvariable. Dann wird hier Aggression linear aus einem Intercept (Aggression in der Inklusionsgruppe) und der Dummyvariablen (Koeffizient beschreibt, wieviel aggressiver die Exklusions- als die Inklusionsgruppe ist) vorhergesagt.

Die Annahme ist, dass ein geringerer Wert in der EKG-Variable in der Exklusionsgruppe dazu führt, dass sie mehr Aggression zeigen werden.
Umgekehrt wird ein geringerer Wert in der EKG Variable in der Inklusionsgruppe dazu führen, dass sie weniger Aggression zeigen.


Also brauchen wir für die Inklusionsgruppe einen zusätzlichen Term, damit Aggression jetzt aus Intercept, der Dummyvariablen und der EKG-Variablen vorhergesagt wird. Für die Exklusionsgruppe brauchen wir einen Interaktionsterm Exklusionsdummy-mal-EKG . Damit erhält die Exklusionsgruppe eine andere Steigerung für die Inklusionsgruppe, wobei der Unterschied der Koeffizient dieses Interaktionsterms ist und damit wird Dir für diesen Interaktionsterm auch gleich ein p-Wert ausgegeben. Der zeigt dann an, ob beide Gruppen eine signifikant andere Steigung für die EKG-Variable haben.

In R Syntax würde man die Regressionformel beschreiben als

Code: Alles auswählen
aggression ~ exclgroup + ecg + exclgroup:ecg + 1


Meistens ist es leichter, viele Dinge in eine Regressionsgleichung mit Interaktionsterm zu stecken als in zwei verschiedene Regressionen. Mit sollte es auch kein Problem sein, die nötigen Koeffizienten zu bestimmen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1398 mal in 1384 Posts

folgende User möchten sich bei bele bedanken:
luftblasenkulli

Re: multiple Regression?

Beitragvon luftblasenkulli » So 6. Dez 2020, 11:14

Lieber Bernhard,
vielen Dank für die schnelle und ausführliche Antwort.

Ich muss zugeben, ich habe mich in meinem Studium noch nie wirklich mit Dummy-Variablen befassen müssen, habe mich aber mal eingelesen und dabei sind noch ein paar Fragen aufgekommen:

Wenn ich das richtig verstanden habe wäre die "einfache" Regressionsgleichung (also ohne Interaktion der metrischen und kategorialen UV), wenn Inklusion meine Referenz ist, d.h. mit 0 kodiert wird, Y=b0 +b1xEKG + b2xExklusion.
Wenn ich jetzt aber eine Interaktion der UVs möchte, muss ich noch einen Interaktionsterm dazuhängen der dann b3xEKGxExklusion wäre?? oder fehlt mir da dann was für die Inklusion? Ich nehme an dass dieser Term dann eine Moderation darstellt oder?

Ich hätte aber abgesehen davon noch aus Interesse 2 Fragen:

1. Könnte ich in diesem Fall auch eine ANCOVA berechnen? (Stichwort Homogenität der Regressionsslopes - wo ich ja schon in der Hypothese annehme dass sich die metrische UV über die Gruppen unterschiedlich auf die AV auswirkt?) Oder darf Kovariate in einer ANCOVA nie Teil der Fragestellung sein - das heißt darf sie uns nicht interessieren und der Effekt nur rausgerechnet werden?? meine Professorin ist nämlich ein bisschen ein ANOVA-Fan und wenn es so zu berechnen ginge, würde sie das sicher bevorzugen.

2. Wäre es statistisch gesehen erlaubt hier einfach 2 Regressionen für die 2 Gruppen zu berechnen? d.h. einfach zu schauen wie sich die metrische UV bei den Exkludierten und bei den Inkludierten auf die AV auswirkt? oder fehlt mir bei dem Output dann eine Information über die Interaktion, die ich sonst mit dem hinzugefügten Interaktionsterm (oder vielleicht auch mit der ANCOVA??) bekommen würde?

Vielen lieben Dank für die Hilfe!!!
luftblasenkulli
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Do 3. Dez 2020, 12:52
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Re: multiple Regression?

Beitragvon PonderStibbons » So 6. Dez 2020, 13:24

Wenn Du annimmst, dass der intervallskalierte Prädiktor in den Gruppen unterschiedlich wirkt, repräsentierst Du das über die Wechselwirkung Kovariate*Gruppe. Getrennte Analysen wären ein leider verbreiteter Kardinalfehler.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
luftblasenkulli

Re: multiple Regression?

Beitragvon luftblasenkulli » So 6. Dez 2020, 13:30

Eine ANCOVA wäre somit auch möglich zu rechnen lese ich aus Ihrer Antwort heraus?

und die Regressionsanalyse wäre wenn ich den Interaktionsterm dazufüge eine moderierte Regression oder?

Diese zwei Analysen scheinen hier also mehr oder weniger die gleichen Ergebnisse zu bringen wenn ich das richtig sehe?
luftblasenkulli
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Do 3. Dez 2020, 12:52
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Re: multiple Regression?

Beitragvon bele » So 6. Dez 2020, 13:34

Hallo Luftblasekuli,

luftblasenkulli hat geschrieben:Wenn ich das richtig verstanden habe wäre die "einfache" Regressionsgleichung (also ohne Interaktion der metrischen und kategorialen UV), wenn Inklusion meine Referenz ist, d.h. mit 0 kodiert wird, Y=b0 +b1xEKG + b2xExklusion.
Wenn ich jetzt aber eine Interaktion der UVs möchte, muss ich noch einen Interaktionsterm dazuhängen der dann b3xEKGxExklusion wäre?? oder fehlt mir da dann was für die Inklusion?


Stell Dir einfach vor, Exklusion gleich Null. Dann wird aus Deiner Regressionsgleichung
Also gilt für die Inklusionsgruppe: Der Intercept ist und die slope ist . Jetzt stellen wir uns Exklusion = 1 vor. Dann wird aus der Regressionsgleichung . Ein wenig umgestellt:
Für die Exklusionsgruppe ist der Intercept also , die slope . Du hast also für beide Gruppen Intercept und slope und es fehlt nichts.


Könnte ich in diesem Fall auch eine ANCOVA berechnen?

Ich wüsste nicht, was dagegen spräche. Ist aber nicht meine Art von Baustelle. Ebenso wie der Moderationsbegriff. Gut, dass wir PonderStibbons mit im Boot haben.

Wäre es statistisch gesehen erlaubt hier einfach 2 Regressionen für die 2 Gruppen zu berechnen?

Es kommt keine Statistikpolizei, die das verbietet. Du wirst aber wahrscheinlich im nächsten Schritt danach fragen, ob sich die Gruppen signifikant voneinander unterscheiden und dann ist es von großem Vorteil, auf je einen Signifikanztest für und zurückgreifen zu können.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1398 mal in 1384 Posts

folgende User möchten sich bei bele bedanken:
luftblasenkulli

Nächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: Google [Bot] und 4 Gäste

cron