Moderierte Regressionsanalyse, Voraussetzungen verletzt

Alle Verfahren der Regressionanalyse.

Moderierte Regressionsanalyse, Voraussetzungen verletzt

Beitragvon Laura3 » Mo 30. Aug 2021, 20:56

Hallo liebes Statistik Forum,

ich habe ein Problem bei meiner Bachelorarbeit und bekomme leider sonst niemanden zu sprechen. Generell geht es darum, dass bei meinen Regressionen sämtliche Voraussetzungen verletzt sind und ich nun nicht weiß wie ich weitermachen soll bzw. was ich interpretieren kann. Im Folgenden mehr zu meinem Forschungsprojekt:

Ich untersuche den Einfluss von Optimismus und Unsicherheit auf Vorhersagen der Coronapandemie. Ich habe die N = 263 Teilnehmer per Mediansplit in Optimisten (N = 88) und Pessimisten (N = 175) aufgeteilt. Sie sollten Vorhersagen über 3 Zeitpunkte (Mai, Juli, Dezember) bezüglich der Coronapandemie treffen. Diese Vorhersagen betrafen manchmal persönlichere Events (z.B. eigene Infektion) oder allgemeinere "Events" (z.B. Impfquote). Zusätzlich wurde Unsicherheit und Sicherheit bzw. Confidence in die jeweilige Vorhersage erfasst.
Jetzt hatte ich folgende Hypothesen:
H1: Optimistische Teilnehmer zeigen bei hoher Unsicherheit optimistischere Vorhersagen als bei niedrigerer Unsicherheit. Pessimistische Teilnehmer zeigen bei hoher Unsicherheit pessimistischere Vorhersagen als bei niedrigerer Unsicherheit.
(Gemessen durch Korrelationen von Unsicherheit und Vorhersagen getrennt für Optimisten und Pessimisten)
H2: Der Effekt in H1 ist für Vorhersagen zum Zeitpunkt 1 (Mai) größer als für die anderen Zeitpunkte (Juli, Dezember).
(Hierfür habe ich Regressionen gerechnet mit AV Vorhersagen, UV Unsicherheit und Moderator Zeitpunkt. Der Zeitpunkt wurde dafür dummykodiert (T1 = 1, T2 = 0, T3 = 0))
H3: Vorhersagen für persönliche Events sind optimistischer und werden mit mehr Sicherheit bzw. Confidence getroffen.
(Hierfür habe ich Regressionen gerechnet mit AV Vorhersagen, UV Optimismus und Moderator Art des Events ebenfalls dummykodiert (persönliche Events = 1, allgemeine Events = 0) sowie Regressionen mit AV Vorhersagen, UV Confidence und Moderator Art des Events)
H4: Der Effekt in H1 ist größer für persönliche Events.
(Hierfür habe ich Regressionen gerechnet mit AV Vorhersagen, UV Unsicherheit und Moderator Art des Events (dummykodiert))


Tut mir leid für die vielen Details, aber ich hoffe so einen guten Überblick für meine Frage geben zu können. Bei einigen von mir berechneten Regressionen sind leider die Voraussetzungen der Normalverteilung der Residuen, der Linearität, der Homoskedastizität, der Unabhängigkeit der Residuen und der Multikollinearität verletzt. Die Unabhängigkeit der Residuen ist bei allen verletzt (vermutlich da ich drei Vorhersagezeitpunkte habe?). Meine Recherche sagt mir, dass ich statt einer moderierten Regression eine Mehrebenenanalyse hätte rechnen müssen, diese ist allerdings nicht Bestandteil meines Bachelorstudiums und ich glaube kaum dass ich mir das noch selbst beibringen kann.
Hat jemand eine Idee was ich noch interpretieren kann oder ändern könnte? Oder beende ich die Arbeit mit "Die Ergebnisse der Regressionen sind nicht interpretierbar"...?

Vielen Dank für jegliche Hilfe!
Laura3
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 14. Jul 2021, 12:05
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Moderierte Regressionsanalyse, Voraussetzungen verletzt

Beitragvon PonderStibbons » Mo 30. Aug 2021, 21:47

Ich untersuche den Einfluss von Optimismus und Unsicherheit auf Vorhersagen der Coronapandemie. Ich habe die N = 263 Teilnehmer per Mediansplit in Optimisten (N = 88) und Pessimisten (N = 175) aufgeteilt.

Dichotomisierungen, noch dazu durch Mediansplits sind absolut verboten. Sie führen unter anderem zur Vernichtung statistischer Imnformationen
und zu widersinnigen Einteilungen (wieso ist jemand exakt auf dem Median der Stichprobe ein "Optimist" und zusammen mit dem extremsten
Optimisten in einer Kategorie, zugleich aber ist sein Nachbar direkt unterm Median ein "Pessimist" und in einer ganz anderen Gruppe?)
Und wieso ein Mediansplit zu 88:175 führt, wäre auch noch zu fragen. Es spricht doch normalerweise überhaupt nichts dagegen,
einfach die Ausgangsvariable zu verwednen, statt arbiträr zu splitten.
http://www.psychology.sunysb.edu/attach ... mizing.pdf

Sie sollten Vorhersagen über 3 Zeitpunkte (Mai, Juli, Dezember) bezüglich der Coronapandemie treffen.

3 Zeitpunkte oder mehrere Events immer in dieselbe Regression zu packen, geht natürlich nicht. Mehrere Beobachtungen
stammen jeweils von derselben Person, sind also abhängig und können nicht als unabhängige Beobachtungen verarbeitet
werden.

Wenn Du abhängige Korrelationen vergleichen willst (also Korrelationen, die von Daten immer derselben Stichprobe stammen),
dafür gibt es Formeln und online-Rechner, z.B. http://www.quantitativeskills.com/sisa/ ... cs/Rno.htm

Mit freundlichen Grüßen

PonderStibbons

P.S. Normalverteilung der Residuen ist nur bei kleinen Stichproben erforderlich (n < 30), bei größeren Stichproben
ist die Analyse robust auch bei nichtnormalverteilten Modellfehlern.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Moderierte Regressionsanalyse, Voraussetzungen verletzt

Beitragvon strukturmarionette » Mo 30. Aug 2021, 21:48

Hi,

- wieviele Kriteriumsvariablen ( AV(s) ) hast du erfasst?
- wie lauten die?
- wie wurden die konkret erfasst /gemessen?
- bei wem?
- welche Skalenniveau legst du dabei jeweils zugrunde

Der Zeitpunkt wurde dafür dummykodiert (T1 = 1, T2 = 0, T3 = 0))

- Dummycodierung ist etwas anderes

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Moderierte Regressionsanalyse, Voraussetzungen verletzt

Beitragvon bele » Mo 30. Aug 2021, 22:28

Hi!

PonderStibbons hat geschrieben:Und wieso ein Mediansplit zu 88:175 führt, wäre auch noch zu fragen.


Kann man fragen. Die Antwort wird wahrscheinlich sein, dass 88 eindeutig in der unteren, 88 in der oberen Hälfte waren und 175 - 88 = 87 genau den Wert des Medians hatten. Diese mittleren 87 Personen entweder den Optimisten oder den Pessimisten zuzuordnen ist völlig beliebig. Wenn ein knappes Drittel der Teilnehmer zufällig den Pessimisten oder den Optimisten zugeordnet werden kann, dann kann das nicht trennscharf das Verhältnis von Unsicherheit und Vorhersagepessimismus vorhersagen. Das leuchtet bestimmt auch ein, wenn man in der statistischen Ausbildung noch nicht sehr weit fortgeschritten ist. Erwägen könnte man, die 88 im unteren Drittel mit den 88 im oberen Drittel zu vergleichen. Das nimmt zwar Fallzahl weg, aber Du könntest bei der Zweiteilung bleiben, die Dir einfacher zu rechnen scheint und PonderStibbons Argument der eng benachbarten die in zwei verschiedene Gruppen fallen fiele weg. Generell wäre ich natürlich auf PonderStibbons Seite, das als kontinuierlichen Prädiktor zu betrachten, aber man hat immer Optionen.

Der Zeitpunkt wurde dafür dummykodiert (T1 = 1, T2 = 0, T3 = 0)


- Dummycodierung ist etwas anderes


Um drei Zeitpunkte dummy zu codieren braucht es nur zwei Dummyvariablen. Du kannst es zwar auch so codieren, musst dann aber den Intercept weglassen.

Oder beende ich die Arbeit mit "Die Ergebnisse der Regressionen sind nicht interpretierbar"...?


Ich habe nie ein Bachelorstudium absolviert würde aber davon ausgehen, dass man in der Bachelorarbeit keine Fertigkeiten aus dem Masterstudiengang nachweisen muss. Ich würde aber doch erwarten, dass man mit den vorhandenen Mitteln das Beste aus einer gegebenen Situation macht. Also mindestens ein "dieses Modell passt hier nicht wirklich, aber das beste mir zur Verfügung stehende Modell würde folgendes ergeben. Die Ergebnisse müssen vorsichtig interpretiert werden weil..."

Wurden denn gar keine Verfahren für den Messwiederholungsfall gelehrt?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

folgende User möchten sich bei bele bedanken:
Laura3

Re: Moderierte Regressionsanalyse, Voraussetzungen verletzt

Beitragvon Laura3 » Mo 30. Aug 2021, 23:26

Vielen Dank für die Antworten!

Dass ein Mediansplit nicht ideal ist ist mir bewusst, er wurde aber der Einfachheit halber verwendet, da die Analyse (für mich) ohnehin kompliziert genug ist.

Gut, dann ist meine Vermutung wohl bestätigt, dass es an der Messwiederholung liegt. Als Verfahren mit Messwiederholung wurde uns nur die ANOVA beigebracht, welche nicht ausgewählt wurde da die UV metrisch skaliert ist nehme ich an, mir wurde allerdings viel von meinen Betreuern vorgegeben. Da ich mit den verschiedenen Vorhersagen mehrere AVs habe, wäre es vermutlich ohnehin eine MANOVA gewesen, welche uns auch nicht beigebracht wurde.

Ich bin offensichtlich kein Statistik Genie und weiß nicht ob ich genug Zeit/Verstand habe um alles nochmal irgendwie umzuschwenken, also werde ich wohl damit enden müssen, keine interpretierbare Ergebnisse zu haben.

Vielen Dank euch trotzdem!
Laura3
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 14. Jul 2021, 12:05
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Moderierte Regressionsanalyse, Voraussetzungen verletzt

Beitragvon PonderStibbons » Di 31. Aug 2021, 09:04

Dass ein Mediansplit nicht ideal ist ist mir bewusst, er wurde aber der Einfachheit halber verwendet, da die Analyse (für mich) ohnehin kompliziert genug ist.

Finde ich schwierig nachzuvollziehen, da man ohne weiteres ohne
einen Mediansplit rechnen kann und die Ergebnisse jetzt vermutlich
uninterpretierbar sind.

Gut, dann ist meine Vermutung wohl bestätigt, dass es an der Messwiederholung liegt. Als Verfahren mit Messwiederholung wurde uns nur die ANOVA beigebracht, welche nicht ausgewählt wurde da die UV metrisch skaliert ist nehme ich an, mir wurde allerdings viel von meinen Betreuern vorgegeben. Da ich mit den verschiedenen Vorhersagen mehrere AVs habe, wäre es vermutlich ohnehin eine MANOVA gewesen, welche uns auch nicht beigebracht wurde.

Die Messwiederholungs-Varianzanalyse geht leider nicht, weil
"Sicherheit" nicht ein für alle Mal fix ist, sondern bei jedem
Messzeitpunkt anders. Will man das adäquat darstellen, dann
tatsächlich Mehrebenenmodell. Oder man bleibt wie gesagt
einfach bei den Korrelationen und vergleicht diese paarweise,
zum Beispiel anhand des oben verlinkten online-Rechners

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Laura3

Re: Moderierte Regressionsanalyse, Voraussetzungen verletzt

Beitragvon Laura3 » Di 31. Aug 2021, 14:29

Vielen Dank für den Tipp! Eine Frage dazu: Wenn die Korrelationen nicht signifikant sind, macht es dann noch Sinn diese paarweise zu vergleichen?
Laura3
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 14. Jul 2021, 12:05
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Moderierte Regressionsanalyse, Voraussetzungen verletzt

Beitragvon PonderStibbons » Di 31. Aug 2021, 14:37

Kann durchaus der Fall sein.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron