Einfluss von Störvariable bei multipler Regression

Alle Verfahren der Regressionanalyse.

Einfluss von Störvariable bei multipler Regression

Beitragvon MarioW » Do 14. Jan 2016, 14:56

Liebe Community,

ich sitze gerade an meiner Masterarbeit (Psychologie) mit dem allgemeinen Thema „Zusammenhang zwischen Schulnoten und Studienleistungen“. Ich habe über ein Online-Fragebogen ca. 200 verwertbare Datensätze von entsprechend vielen Studienteilnehmern erhalten.
Die Studienleistungen habe ich durch die gegenwärtige Studiums-Durchschnittsnote oder die Bachelorabschlußnote – ich habe sowohl gegenwärtige wie auch ehemalige Studierende in meiner Stichprobe operationalisiert. Ich verwende zur Auswertung SPSS (Version 19).

Ich möchte (u.a.) folgendes mit meiner Studie untersuchen:

Zusammenhang A) Abiturabschlußnote und Studienleistungen

verglichen mit

Zusammenhang B) zwischen vier Einzelfachnoten (Mathe, Deutsch, Bio, Englisch) unter dem Einfluss des jeweiligen Anforderungsniveaus in der Oberstufe (Erweitert, Grundlegend, Abgewählt) auf die Studienleistung.

Obwohl man das auch kritisieren kann, nehme ich für meine Daten (Noten) Intervallskalenniveau an, das Anforderungsniveau (Dummy-Variablen) ist natürlich ordinal-skaliert.

Für Zusammenhang A) würde ich die Methode der Pearson-Produkt-Moment-Korrelation wählen und für Zusammenhang B) eine multiple Regression (Einschlussmethode) mit etwas mehr Prädiktoren als mir lieb sind, nämlich: 4 Facheinzelnoten sowie 8 Dummyvariablen für den Einfluss des Anforderungsniveaus (auf Wunsch kann ich diese Dummy-Matrix auch noch darstellen, ich glaube aber, dass es gerade nicht so relevant ist) – das Kriterium bei dieser multiplen Regression ist natürlich die Studiennote.
Soweit habe ich den Eindruck gut unterwegs zu sein. Mein Problem kommt jetzt erst. Innerhalb meiner Stichprobe habe ich eine Störvariable entdeckt. Zwischen dem Studiumsabschnitt, in dem sich meine Studienteilnehmer befinden – operationalisiert über die bereits im Studium erworbenen Leistungspunkte (Credits) – und der Studienleistung besteht ein signifikanter Zusammenhang (r = -.26, p < 0.001). Ähnlich, aber nach 95% Konvention knapp „nicht signifikant“ mit der Abiturnote (r= -.132, p = .062).

Nun sind das nunmal die Daten, die ich habe und muss damit weitermachen. Bei gewissen Korrelationen, z.B. dem Zusammenhang A) würde ich über eine partielle Korrelation den Einfluß der Störvariable herausrechnen (sieht soweit da auch ganz gut aus: r von Abinote und Studiumsnote sinkt durch Herauspartialisierung von Credits „nur“ von .426 auf .409, jeweils p < 0.001).

Nun weiß ich allerdings nicht, wie ich den Einfluß dieser Variable für die Methode zur Analyse des Zusammenhangs B) kontrolliere. Ich habe dazu mal im Bortz Statistikbuch nachgelesen und zumindest herausgefunden, dass ich die Beta-Gewichte der einzelnen Prädiktoren um den Einfluss der Störvariable bereinige, wenn ich die Störvariable in meine Regressionsgleichung aufnehme.
Ziel meiner Analyse ist es jedoch, die Korrelation A) mit der multiplen Korrelation B) zu vergleichen, auf die Beta-Gewichte gehe ich Grunde gar nicht ein. Nun ist meine Frage: Wenn ich mein multiples Regressionsmodell um den Prädiktor „Credits“ erweitere, wie verändert sich meine Interpretation von der multiplen Korrelation (korrigiertes r²). Wenn ich das mal ausprobiere steigt die im Vergleich von ohne- zu mit „Credits“ von .21 auf .243. Ist einer von den Werten um den Einfluß der Störvariable bereinigt oder nicht?

Vielen Dank schon mal fürs lesen, für Hinweise und Ideen wäre ich sehr dankbar! :)
MarioW
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Do 14. Jan 2016, 14:16
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Einfluss von Störvariable bei multipler Regression

Beitragvon PonderStibbons » Do 14. Jan 2016, 15:26

dass ich die Beta-Gewichte der einzelnen Prädiktoren um den Einfluss der Störvariable bereinige, wenn ich die Störvariable in meine Regressionsgleichung aufnehme.

Das machst Du sowohl in der ersten Analyse (da machst Du keine Korrelation,
sondern gleich eine Regression) als auch in der zweiten.

Ziel meiner Analyse ist es jedoch, die Korrelation A) mit der multiplen Korrelation B) zu vergleichen, auf die Beta-Gewichte gehe ich Grunde gar nicht ein.

Das wären dann wohl die beiden R², aber wie wirst Du die denn vergleichen,
mit welchem Test?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
MarioW

Re: Einfluss von Störvariable bei multipler Regression

Beitragvon MarioW » Do 14. Jan 2016, 15:48

Danke für die Antwort!

PonderStibbons hat geschrieben:
dass ich die Beta-Gewichte der einzelnen Prädiktoren um den Einfluss der Störvariable bereinige, wenn ich die Störvariable in meine Regressionsgleichung aufnehme.

Das machst Du sowohl in der ersten Analyse (da machst Du keine Korrelation,
sondern gleich eine Regression) als auch in der zweiten.


Meinst Du mit "erste" und "zweite" A) und B) oder die multiple Regression einmal ohne Einbezug der Credits und einmal mit Einbezug der Credits? Ich verstehe den Hinweis nicht ganz.

PonderStibbons hat geschrieben:
Ziel meiner Analyse ist es jedoch, die Korrelation A) mit der multiplen Korrelation B) zu vergleichen, auf die Beta-Gewichte gehe ich Grunde gar nicht ein.

Das wären dann wohl die beiden R², aber wie wirst Du die denn vergleichen,
mit welchem Test?


Ja, das ist etwas mißverständlich ausgedrückt von mir. Letzlich kenne ich keinen statistischen Test, ich hätte das dann einfach dahingestellt und einfach so kontrasiert. Im Sinne von: Die Vorhersage mithilfe der Fachnoten und dem Anforderungsniveau ist genausogut wie die der Abiturnote, möglicherweise sogar besser (in der Literatur wird stets das Gegenteil behauptet, entsprechend ist das erstmal schon ein Erfolg).

An dem Punkt der Analyse bin ich noch nicht, ggf. müsste ich mir dann nochmal eine Methode raussuchen, die obige Behauptung statistisch absichert ´´. Ich habe - ebenfalls nach Bortz - eine nicht näher benannte Methode gefunden, bei der man Korrelationen auf Gleicheit überprüfen kann (s.168 ff. im Bortz 2010 / 7 Auflage), muss aber mal recherchieren ob ich da einfach multiple Korrelationen einsetzen darf obwohl ich das bisher noch nicht explizit erwähnt gefunden habe. Fällt Dir da sonst spontan eine potentiell geeignete Methode ein, über die ich mich mal schlaulesen könnte?
MarioW
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Do 14. Jan 2016, 14:16
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Einfluss von Störvariable bei multipler Regression

Beitragvon PonderStibbons » Do 14. Jan 2016, 16:07

Meinst Du mit "erste" und "zweite" A) und B)

Erste Analyse ist Analyse zum Zusammenhang A. Es ist nicht erforderlich, bei A unbd B verschieden zu rechnen.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 9 Gäste

cron