STATISTIK-FORUM.de

intheend · von **intheend** » Di 26. Sep 2017, 23:20

Hallo,

meine Hypothese lautet "Je höher der sozioökonomische Status, desto höher der Notendurchschnitt".
Dazu habe ich nun eine Regressionsanalyse gerechnet. Dabei gab es jedoch nicht etwa einen einzelnen Indexwert für den sozioökonomischen Status, der als einziger Prädiktor in die Analyse aufgenommen worden wäre. Sondern es wurden eine Reihe von Indikatoren für den Sozioökonomischen Status als Prädiktoren aufgenommen. Dabei ergaben sich folgende Ergebnisse:

Bildungsgrad Mutter: ß = -.03, p=.850
Bildungsgrad Vater: ß = .16, p=.250
Beruflicher Status der Mutter: ß = .13, p = .298
Beruflicher Status des Vaters: ß = -.30, p = .025
Bildungsressourcen im Haushalt: ß = .37, p = .000

Wie man sieht, sind die Betagewichte teilweise positiv und teilweise negativ.
Betrachtet man hingegen allein die Korrelationen, waren alle Zusammenhänge zwischen den genannten Prädiktoren und dem Notendurchschnitt positiv und teilweise signifikant.

Die für mich nun schwierige Frage: Ist die Hypothese nun bestätigt oder nicht?

strukturmarionette · von **strukturmarionette** » Mi 27. Sep 2017, 05:46

Hi,

- zunächst bitte die Skalenniveaus aller Variablen mitteilen einschl der Stichprobenumfänge
- danach könnten weitere Überlegungen erfolgen

Gruß
S.

PonderStibbons · von **PonderStibbons** » Mi 27. Sep 2017, 08:34

meine Hypothese lautet "Je höher der sozioökonomische Status, desto höher der Notendurchschnitt".

Höher oder besser?

Dazu habe ich nun eine Regressionsanalyse gerechnet. Dabei gab es jedoch nicht etwa einen einzelnen Indexwert für den sozioökonomischen Status, der als einziger Prädiktor in die Analyse aufgenommen worden wäre.

Warum nicht? Wenn mehrere Variablen dasselbe Konstrukt operationalisieren, ist es womöglich eine Verschwendung
von Freiheitsgraden, alle Variablen separat aufzunehmen statt einen Index zu formen.

Die für mich nun schwierige Frage: Ist die Hypothese nun bestätigt oder nicht?

Deine Vorgehen ist nicht nur aus dem oben genannten Grund problematisch, sondern eben auch aufgrund dessen,
dass Hypothese und Analyse nicht zusammenpassen. Was Du getestet hast ist bzw,. interpretieren willst ist,
ob jede der 5 Variablen innerhalb einer multiplen Regressionsgleichung (also unter Berücksichtigung der anderen
Variablen, mit denen sie mutmaßlichkorreliert sind) einen positiven Regressionskoeffizienten hat. Was da konkret
gemessen wurde und wie gut das zur Hypothese passt, kann ich dabei nicht beurteilen. Vielleicht liest Du mal zum
Stichwort Suppressoreffekt.

Was man hätte machen können, wenn man schon die 5 Einzelvariablen verwendet und überzeugt ist, dass sie
gemeinsam sozio-ökonomischen Status repräsentieren, wäre eine blockweise Regression, d.h. alle 5 Variablen
in einem Schritt dem Grundmodell hinzufügen und schauen, ob sich eine statistisch signifikante Änderung des R²
ergibt. Betrachtung einzelner Regressionsgewichte wäre dabei hinfällig, entsprechend dem Umstand, dass eine
bestimmte Hypothese getestet werden soll. Das Problem ist, wenn man eine Analyse bereits gerechnet hat und
dann aufgrund der Ergebnisse nun eine andere probiert, die Ergebnisse aus der ganzen Aktion von fragwürdiger
Aussagekraft sind.

Mit freundlichen Grüßen

PonderStibbons

intheend · von **intheend** » Mi 27. Sep 2017, 14:32

- zunächst bitte die Skalenniveaus aller Variablen mitteilen einschl der Stichprobenumfänge

Alles metrisch. Notendurchschnitt (N = 200), Bildungsgrad von Mutter (N = 186) und Vater (N = 183), beruflicher Status von Mutter (N = 180) und Vater (N = 192), Bildungsressourcen (N = 211).

- danach könnten weitere Überlegungen erfolgen

Ich bin gespannt.

Höher oder besser?

Ah sorry, das war jetzt mein Fehler auf die Schnelle. In meiner Hypothese steht eigentlich "schulische Leistung", da hätte es gepasst. Aber ich wollte es hier für das Forum konkreter machen und dabei wurde es falsch.

Deine Vorgehen ist nicht nur aus dem oben genannten Grund problematisch, sondern eben auch aufgrund dessen,
dass Hypothese und Analyse nicht zusammenpassen

Das befürchte ich langsam auch. Das Problem, wie ich es sehe, stellt sich wie folgt:
Die multiple Regressionsanalyse wäre gut geeignet um nachzuweisen, dass sich der Notendurchschnitt (mit schön hoher Varianzaufklärung und Signifikanz) aus den genannten Indikatoren des Sozioökonomischen Status vorhersagen lässt. Aber ich will mit meinen Hypothesen eigentlich auch die Richtung des Zusammenhangs in Bezug auf das Gesamtkonstrukt prüfen. Hätte ich nur einen Prädiktor, könnte ich die Richtung am Vorzeichen ablesen. Aber bei mehreren Prädiktoren scheint mir das - aufgrund von Suppressoreffekten und weiß der Kuckuck was da alles passieren kann - irgendwie ziemlich schwierig zu sagen.
Wenn ich einen Index bilde, muss ich ja eine Antwort darauf finden, wie ich die Prädiktoren gewichten soll. Aber warum sollte sich dieses Problem mit der Gewichtung nicht ohne Index genauso stellen: Woher will die Regression wissen, wie diese Gewichtung aussieht?

Wie löse ich das nun bloß?
- Einen Index zu bilden macht mir mehrere Probleme: Zum einen weiß ich nicht, wie ich die Prädiktoren gewichten soll. Dahinter scheint mir immer eine gewisse Willkür zu stecken. Zum zweiten scheint man damit Informationen zu verlieren. Zumindest habe ich bemerkt, dass die gemeinsame Varianzaufklärung kleiner wird als wenn ich eine multiple Regression mit allen Prädiktoren rechne. Zum dritten müsste dann ja die interne Konsistenz entsprechend hoch sein, richtig? Wie hoch sollte Cronbachs Alpha dann sein? Ich fürchte, ich habe zu wenig. Und nicht zuletzt habe ich die ganzen Regressionsanalysen nun schon gerechnet. Scheint mir ein irrer Zeitaufwand zu sein, das alles nun nochmal anders zu rechnen, oder nicht?
- Es wäre in diesem Fall weniger schlimm für mich, die Hypothesen anzupassen. Ich weiß, das wird schnell kriminell. Aber in diesem Fall zu rechtfertigen, denn eigentlich sind die Hypothesen - wie ich es sehe - nicht aufgrund der Ergebnisse ein Problem, sondern die Analyse war schon von vorn herein falsch konzipiert. Ich habe noch eine andere Regression, bei der alle ß Gewichte positiv sind. Aber gleichzeitig korreliert einer der Indikatoren negativ mit dem Kriterium. Kann man in diesem Fall folgern, dass das Gesamtkonstrukt positiv zusammenhängt, wenn doch ein Indikator des Konstrukts negativ zusammenhängt? Eine solche Aussage macht doch irgendwie keinen Sinn, oder liege ich falsch? Das scheint mir irgendwie alles von der Konzeption her schon falsch zu sein. Auch hier mehrere Probleme: Wie formuliere ich die Hypothesen dann, dass ich sie mit der multiplen Regression beantworten kann? "Die Indikatoren des Sozioökonomischen Status sagen die schulische Leistung vorher", wäre sowas eine typische Formulierung? Aber nun interessiere ich mich für die Richtung des Zusammenhangs schon irgendwie auch. Dann müsste ich mir überlegen, inwiefern ich das mit möglichst geringem Aufwand vielleicht auch noch prüfen könnte...

eine blockweise Regression, d.h. alle 5 Variablen in einem Schritt dem Grundmodell hinzufügen und schauen, ob sich eine statistisch signifikante Änderung des R² ergibt

Naja, es gibt darüber hinaus keine weiteren Prädiktoren mehr. Demnach entspräche eine hierarchische Regression, bei der in einem Schritt alle 5 Prädiktoren hinzugefügt werden, ja einer normalen multiplen Regression. Womit ich aber immer noch keine Aussage über die Richtung des Zusammenhangs treffen könnte.

PonderStibbons · von **PonderStibbons** » Mi 27. Sep 2017, 15:30

: Zum einen weiß ich nicht, wie ich die Prädiktoren gewichten soll. Dahinter scheint mir immer eine gewisse Willkür zu stecken.

Du forscht zum Thema "sozioökonomischer Status", daher habe ich vorausgesetzt oder gehofft, dass Du ein
gut gestütztes Konzept hast.
Welches das ist, kann ich aus den Variablen zwar nicht so recht ersehen, aber ich stecke in der Materie auch
nicht drin. Falls begriffliche Definition und theoretische Annahmen noch unzureichend sind, kann die statistische
Analysemethode das nicht ersetzen.

Kann man in diesem Fall folgern, dass das Gesamtkonstrukt positiv zusammenhängt, wenn doch ein Indikator des Konstrukts negativ zusammenhängt?

Weiß ich nicht. Gibt viele Möglichkeiten. Codierungen anders als angenommen, Suppressoreffekte, die Wirklichkeit
ist anders als die Annahmen etc.

Naja, es gibt darüber hinaus keine weiteren Prädiktoren mehr.

Das vereinfacht die Sache zumindest an dem Punkt.

Mit freundlichen Grüßen

PonderStibbons

STATISTIK-FORUM.de

Interpretationsprobleme bei negativen Betagewichten

Interpretationsprobleme bei negativen Betagewichten

Re: Interpretationsprobleme bei negativen Betagewichten

Re: Interpretationsprobleme bei negativen Betagewichten

Re: Interpretationsprobleme bei negativen Betagewichten

Re: Interpretationsprobleme bei negativen Betagewichten

Wer ist online?