Generalisierte lineare Modelle (GLM) | Wahl der Verteilung

Alle Verfahren der Regressionanalyse.

Generalisierte lineare Modelle (GLM) | Wahl der Verteilung

Beitragvon Psychostatistik » Mo 14. Feb 2022, 18:22

Hallo zusammen,

da in meiner multiplen linearen Regression die Residuen nicht normalverteilt sind und Varianzheterogenität vorliegt, möchte ich ein Generalisiertes lineares Modell (glm) rechnen.

Folgende Verteilungsannahmen werden mir von R vorgeschlagen:
binomial(link = "logit")
gaussian(link = "identity")
Gamma(link = "inverse")
inverse.gaussian(link = "1/mu^2")
poisson(link = "log")
quasi(link = "identity", variance = "constant")
quasibinomial(link = "logit")
quasipoisson(link = "log")

Leider erscheint mir keine Verteilungsannahme so richtig auf meine Daten zu passen, weshalb ich euren Rat benötige:

Mein Kriterium ist jeweils der Mittelwert von 30 Items (7 stufige Likertskala). Die Variable ist also metrisch und es handelt sich um keine "Zähl-daten".
Leider ist die Verteilung zudem Linksschief, da ich ansonsten "Gamma" wählen hätte können.

Welche Verteilung würdet ihr für das Generalisierte lineare Modell wählen?

Herzlichen Dank für eure Unterstützung!
Psychostatistik
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mo 14. Feb 2022, 17:22
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Generalisierte lineare Modelle (GLM) | Wahl der Verteilu

Beitragvon PonderStibbons » Mo 14. Feb 2022, 18:58

Mein Kriterium ist jeweils der Mittelwert von 30 Items (7 stufige Likertskala).

Zur Sicherheit: Likertskala ist die Bezeichnung des Messinstruments, das aus den einzelnen Likert-Items besteht.
Nicht der Name des Item-Antwortformats. - Wieso eigentlich so immens viele (30) Items? Was wird da gemessen?
Welche Verteilung würdet ihr für das Generalisierte lineare Modell wählen?

Wie groß ist die Stichprobe und wie ergibt sich die Annahme, dass Heteroscedascität sowie nicht-normale
Residuen vorliegen?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Generalisierte lineare Modelle (GLM) | Wahl der Verteilu

Beitragvon strukturmarionette » Di 15. Feb 2022, 10:29

Hi,

Mein Kriterium ist jeweils der Mittelwert von 30 Items

- dann bieten sich m.E. zunächst Itemanalysen an mit möglichst großer (bestmöglichst zufälliger) Stichprobe aus deiner Zielpopulatipon
- Prozeduren /Funktionen in der Prgrammiersprache R ließen sich gewiss recherchieren
- Prädiktoren sind?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Generalisierte lineare Modelle (GLM) | Wahl der Verteilu

Beitragvon Psychostatistik » Di 15. Feb 2022, 10:38

Hallo PonderStibbons,

Wieso eigentlich so immens viele (30) Items? Was wird da gemessen?

Es handelt sich um eine Skala die Vertrauen in Medien, anhand von mehreren Subdimensionen, erfasst. Die Subdimensionen zusammen genommen eigenen sich laut Literatur dazu, das allgemeine Vertrauen in Medien abzubilden.

Wie groß ist die Stichprobe und wie ergibt sich die Annahme, dass Heteroscedascität sowie nicht-normale
Residuen vorliegen?

Die Stichprobe ist N = 778. Mir ist bewusst, dass bei so großen Stichproben die "klassischen Tests" auf Normalverteilung (z.B. Shapiro-Wilk-Test) und auf Homosketastizität (Breusch Pagan) nicht mehr geeignet sind. Daher stützt sich diese Annahme vor allem auf graphische Analysen (Residuenplots, Q-Q-Plot) und Tests auf Schiefe und Kurtosis.

Liebe Grüße
Psychostatistik
Psychostatistik
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mo 14. Feb 2022, 17:22
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Generalisierte lineare Modelle (GLM) | Wahl der Verteilu

Beitragvon PonderStibbons » Di 15. Feb 2022, 10:47

Bei einer derart großen Stichprobe ist die Normalverteilungsannahme der Residuen entbehrlich.
Die Heteroscedascität kannst Du durch Verwendung robuster Standardfehler berücksichtigen,
gibt es auch in R.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste

cron