STATISTIK-FORUM.de

Psychostatistik · von **Psychostatistik** » Mo 14. Feb 2022, 18:22

Hallo zusammen,

da in meiner multiplen linearen Regression die Residuen nicht normalverteilt sind und Varianzheterogenität vorliegt, möchte ich ein Generalisiertes lineares Modell (glm) rechnen.

Folgende Verteilungsannahmen werden mir von R vorgeschlagen:
binomial(link = "logit")
gaussian(link = "identity")
Gamma(link = "inverse")
inverse.gaussian(link = "1/mu^2")
poisson(link = "log")
quasi(link = "identity", variance = "constant")
quasibinomial(link = "logit")
quasipoisson(link = "log")

Leider erscheint mir keine Verteilungsannahme so richtig auf meine Daten zu passen, weshalb ich euren Rat benötige:

Mein Kriterium ist jeweils der Mittelwert von 30 Items (7 stufige Likertskala). Die Variable ist also metrisch und es handelt sich um keine "Zähl-daten".
Leider ist die Verteilung zudem Linksschief, da ich ansonsten "Gamma" wählen hätte können.

Welche Verteilung würdet ihr für das Generalisierte lineare Modell wählen?

Herzlichen Dank für eure Unterstützung!

PonderStibbons · von **PonderStibbons** » Mo 14. Feb 2022, 18:58

Mein Kriterium ist jeweils der Mittelwert von 30 Items (7 stufige Likertskala).

Zur Sicherheit: Likertskala ist die Bezeichnung des Messinstruments, das aus den einzelnen Likert-Items besteht.
Nicht der Name des Item-Antwortformats. - Wieso eigentlich so immens viele (30) Items? Was wird da gemessen?

Welche Verteilung würdet ihr für das Generalisierte lineare Modell wählen?

Wie groß ist die Stichprobe und wie ergibt sich die Annahme, dass Heteroscedascität sowie nicht-normale
Residuen vorliegen?

Mit freundlichen Grüßen

PonderStibbons

strukturmarionette · von **strukturmarionette** » Di 15. Feb 2022, 10:29

Hi,

Mein Kriterium ist jeweils der Mittelwert von 30 Items

- dann bieten sich m.E. zunächst Itemanalysen an mit möglichst großer (bestmöglichst zufälliger) Stichprobe aus deiner Zielpopulatipon
- Prozeduren /Funktionen in der Prgrammiersprache R ließen sich gewiss recherchieren
- Prädiktoren sind?

Gruß
S.

Psychostatistik · von **Psychostatistik** » Di 15. Feb 2022, 10:38

Hallo PonderStibbons,

Wieso eigentlich so immens viele (30) Items? Was wird da gemessen?

Es handelt sich um eine Skala die Vertrauen in Medien, anhand von mehreren Subdimensionen, erfasst. Die Subdimensionen zusammen genommen eigenen sich laut Literatur dazu, das allgemeine Vertrauen in Medien abzubilden.

Wie groß ist die Stichprobe und wie ergibt sich die Annahme, dass Heteroscedascität sowie nicht-normale
Residuen vorliegen?

Die Stichprobe ist N = 778. Mir ist bewusst, dass bei so großen Stichproben die "klassischen Tests" auf Normalverteilung (z.B. Shapiro-Wilk-Test) und auf Homosketastizität (Breusch Pagan) nicht mehr geeignet sind. Daher stützt sich diese Annahme vor allem auf graphische Analysen (Residuenplots, Q-Q-Plot) und Tests auf Schiefe und Kurtosis.

Liebe Grüße
Psychostatistik

PonderStibbons · von **PonderStibbons** » Di 15. Feb 2022, 10:47

Bei einer derart großen Stichprobe ist die Normalverteilungsannahme der Residuen entbehrlich.
Die Heteroscedascität kannst Du durch Verwendung robuster Standardfehler berücksichtigen,
gibt es auch in R.

Mit freundlichen Grüßen

PonderStibbons

STATISTIK-FORUM.de

Generalisierte lineare Modelle (GLM) | Wahl der Verteilung

Generalisierte lineare Modelle (GLM) | Wahl der Verteilung

Re: Generalisierte lineare Modelle (GLM) | Wahl der Verteilu

Re: Generalisierte lineare Modelle (GLM) | Wahl der Verteilu

Re: Generalisierte lineare Modelle (GLM) | Wahl der Verteilu

Re: Generalisierte lineare Modelle (GLM) | Wahl der Verteilu

Wer ist online?