Problem mit Normalverteilung bei multipler Regression

Alle Verfahren der Regressionanalyse.

Problem mit Normalverteilung bei multipler Regression

Beitragvon sgm23 » Do 20. Jan 2022, 17:15

Hey zusammen,
ich habe ein statistisches Problem, bei dem ich gerade nicht weiterkomme...

Ich habe folgende drei Hypothesen:

1) IntrMot führt zu höherer ABN (wird jeweils einzeln mit 3 Subskalen IntrMot geprüft)
2) ExtrMot führt zu höherer ABN (wird jeweils einzeln mit 4 Subskalen ExtrMot geprüft)
3) IntrMot hat einen höheren Einfluss auf die ABN als die ExtrMot

Dummerweise ist die Normalverteilung der Residuen bei allen 7 Mot-Subskalen verletzt, was aber eine Voraussetzung für die Regression ist. Daher habe ich Hypothese 1 & 2 jeweils mit Bootstrapping-Verfahren gerechnet und geprüft.

Nun zu meinem eigentlichen Problem: Wie kann ich die Hypothese 3 prüfen? Ursprünglich wollte ich das in einer multiplen Regression mit zwei Modellen machen, die ich dann gegenseitig vergleiche - da die Normalverteilung der Residuen ja aber verletzt ist, geht das nicht. Hat jemand eine Idee, was ich dann rechnen kann?

Vielen Dank!
sgm23
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 20. Jan 2022, 16:39
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Problem mit Normalverteilung bei multipler Regression

Beitragvon bele » Do 20. Jan 2022, 17:44

Hey,

sgm23 hat geschrieben:ich habe ein statistisches Problem, bei dem ich gerade nicht weiterkomme...


Cool, das trifft genau das Thema unseres Forums. Magst Du uns Dein statistisches Problem mal schildern?

Ich habe folgende drei Hypothesen:


Deine Thesen beziehen sich anscheinend auf vorhandene Daten und mitreden kann natürlich nur, wer etwas über diese Daten weiß. OB es sich um ein Längsschnittdesign handelt oder um Querschnitte, Zeitreihen und natürlich die immer wieder gerne ausgelassene Frage nach den Stichprobenumfängen. Schau mal hier: nutzung-des-forums-f44/das-musste-mal-gepostet-werden-t6682.html

1) IntrMot führt zu höherer ABN (wird jeweils einzeln mit 3 Subskalen IntrMot geprüft)
2) ExtrMot führt zu höherer ABN (wird jeweils einzeln mit 4 Subskalen ExtrMot geprüft)


Hast Du die Subskalen immer gemeinsam manipuliert oder jede Skala für sich getrennt?

Daher habe ich Hypothese 1 & 2 jeweils mit Bootstrapping-Verfahren gerechnet und geprüft.


Man mag kaum glauben, wieviele Verfahren es gibt, die auf dem Bootstrap beruhen. Wenn Du das Studiendesign und die Datenerhebung beschrieben hast können wir auch einer Erklärung folgen, was Du da gemacht hast und mitdenken, ob ein ähnlicher Ansatz auf für Hypothese 3 geeignet erscheint.

Hat jemand eine Idee, was ich dann rechnen kann?


Ohne irgendwas über die Daten zu wissen? Nein.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1398 mal in 1384 Posts

Re: Problem mit Normalverteilung bei multipler Regression

Beitragvon sgm23 » Do 20. Jan 2022, 19:15

Hey Bernhard,
danke Dir für Deine Antwort.

Die Infos zu den Daten habe ich tatsächlich vergessen :o Danke für die Nachfrage!

Die Studie ist ein Querschnittdesign (n = 117), mithilfe eines Fragebogens wurden alle Teilnehmenden befragt.

Daten:
- 3 Subskalen zur IntrMot (mit jeweils 3 Fragen und fünfstufiger Likert-Skala -> hinterher wurde dann der Mittelwert von den drei Antworten eines Probanden als Subskalengesamtwert genommen)
- 4 Subskalen zur ExtrMot war es ähnlich (4 Subskalen á jeweils 4 Fragen bei fünfstufiger Likert-Skala -> und auch hier wurde der Mittelwert der vier Antworten als Subskalengesamtwert berechnet)
- 1 Skala bei ABN (4 Fragen in vierstufiger Likertskala -> Mittelwert wieder als Subskalengesamtwert)

Hab ich noch eine wichtige Info vergessen?
sgm23
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 20. Jan 2022, 16:39
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Problem mit Normalverteilung bei multipler Regression

Beitragvon bele » Do 20. Jan 2022, 22:57

Hallo sgm,

ich weiß immer noch nicht, was genau Du mit Bootstrapping gemacht hast und ich glaube nicht, dass mit "mehr Einfluss haben" schon ausreichend genau definiert ist, was genau Du wissen willst. Aber versuchen wir es mal:

Ich nehme mal an, Du hast beispielsweise 5000 Bootstrap-Samples von Deinen Daten genommen, jeweils eine OLS-Regression gerechnet und aus den dabei entstehenden Koeffizienten hast Du dann die Verteilung und damit die Standardfehler der Koeffizienten gewonnen. Wenn das so ist, dann hast Du 5000 mal eine Regression mit IntrMot und 5000mal eine Regression mit ExtrMot gemacht und für jede dieser Regressionen kann man ein Maß der Anpassungsgüte, beispielsweise ein R² oder ein RMSE oder so berechnen.
Wenn IntrMot und ExtrMot genau gleich einflussreich sind, dann sollte sich mit beiden gleich hohe R² oder RMSE erreichen lassen. Wenn aber 100mal so oft das eine mehr erreicht als das andere, dann wäre das schon ein relevanter Beleg (p-Werte aus Bootstrapping).

Ein anderer Weg "viel Einfluss" zu messen ist eine Regression mit standardisierten Prädiktoren und wenn die Prädiktoren standardisiert sind kann man an der Höhe der Koeffizienten Einflüsse vergleichen. Auch hier gilt: Aus den beispielsweise 5000 gebootstrapten Koeffizentensets lässt sich durch Häufigkeitsvergleich wieder ein Signifianztest basteln, der keine Normalverteilungsannahmen macht.

Hilft das?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1398 mal in 1384 Posts

Re: Problem mit Normalverteilung bei multipler Regression

Beitragvon sgm23 » Fr 21. Jan 2022, 00:24

Hey Bernhard,
vielen Dank für Deine Antwort! Der zweite Weg mit der Regression der standardisierten Prädiktoren klingt für mich vielversprechend. Ich hab's grade auch gleich ausprobiert und es hat funktioniert.

Mit dem Bootstrapping kann ich aber nur ausrechnen, ob die Prädiktoren einen signifikanten Einfluss auf das Kriterium haben und nicht ob die Prädiktoren sich signifikant von den jeweils anderen unterscheiden. Oder gibt es da einen Weg, auf den ich gerade nicht komme?

Liebe Grüße
sgm23
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 20. Jan 2022, 16:39
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Problem mit Normalverteilung bei multipler Regression

Beitragvon bele » Fr 21. Jan 2022, 07:48

Hey,
Du kannst auch je zwei Koeffizienten miteinander vergleichen, wenn Du deren Werte aus 5000 Bootstrapsamples kennst. Beispielsweise könntest Du daraus 5000 Differenzen bilden und zählen, wieviel davon positiv und wieviel davon negativ sind.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1398 mal in 1384 Posts

Re: Problem mit Normalverteilung bei multipler Regression

Beitragvon strukturmarionette » Fr 21. Jan 2022, 10:27

Hi,

- N?
- Was spricht gegen eine multiple lineare Regression?

Gruß
S.
Zuletzt geändert von strukturmarionette am Fr 21. Jan 2022, 22:14, insgesamt 1-mal geändert.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Problem mit Normalverteilung bei multipler Regression

Beitragvon Sumo88 » Fr 21. Jan 2022, 13:24

"Mit dem Bootstrapping kann ich aber nur ausrechnen, ob die Prädiktoren einen signifikanten Einfluss auf das Kriterium haben und nicht ob die Prädiktoren sich signifikant von den jeweils anderen unterscheiden. Oder gibt es da einen Weg, auf den ich gerade nicht komme?"

Entschuldigung, ich weiß nicht wie das mit dem Zitieren geht und ich bin jetzt selber nicht so der Statistik-Überflieger. Aber für sowas wäre evtl. ein Post Hoc Test da, oder?
Sumo88
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 19. Jan 2022, 19:03
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Problem mit Normalverteilung bei multipler Regression

Beitragvon PonderStibbons » Fr 21. Jan 2022, 14:17

Ist hier auch in Arbeit.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Problem mit Normalverteilung bei multipler Regression

Beitragvon bele » Fr 21. Jan 2022, 14:55

@Sumo88: Das mit dem Kommentieren geht mit ganz normalen [quote]-Tags. Wenn Dir das nichts sagt, dann such mal nach 'BBCode' , z. B. https://en.wikipedia.org/wiki/BBCode

@PonderStibbons: Danke für den Hinweis. Dann können wir ja erstmal abwarten, ob dutchies Vorschläge das Problem lösen.
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1398 mal in 1384 Posts

folgende User möchten sich bei bele bedanken:
sgm23

Nächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste

cron