Liebe Community,
ich sitze gerade an meiner Masterarbeit (Psychologie) mit dem allgemeinen Thema „Zusammenhang zwischen Schulnoten und Studienleistungen“. Ich habe über ein Online-Fragebogen ca. 200 verwertbare Datensätze von entsprechend vielen Studienteilnehmern erhalten.
Die Studienleistungen habe ich durch die gegenwärtige Studiums-Durchschnittsnote oder die Bachelorabschlußnote – ich habe sowohl gegenwärtige wie auch ehemalige Studierende in meiner Stichprobe operationalisiert. Ich verwende zur Auswertung SPSS (Version 19).
Ich möchte (u.a.) folgendes mit meiner Studie untersuchen:
Zusammenhang A) Abiturabschlußnote und Studienleistungen
verglichen mit
Zusammenhang B) zwischen vier Einzelfachnoten (Mathe, Deutsch, Bio, Englisch) unter dem Einfluss des jeweiligen Anforderungsniveaus in der Oberstufe (Erweitert, Grundlegend, Abgewählt) auf die Studienleistung.
Obwohl man das auch kritisieren kann, nehme ich für meine Daten (Noten) Intervallskalenniveau an, das Anforderungsniveau (Dummy-Variablen) ist natürlich ordinal-skaliert.
Für Zusammenhang A) würde ich die Methode der Pearson-Produkt-Moment-Korrelation wählen und für Zusammenhang B) eine multiple Regression (Einschlussmethode) mit etwas mehr Prädiktoren als mir lieb sind, nämlich: 4 Facheinzelnoten sowie 8 Dummyvariablen für den Einfluss des Anforderungsniveaus (auf Wunsch kann ich diese Dummy-Matrix auch noch darstellen, ich glaube aber, dass es gerade nicht so relevant ist) – das Kriterium bei dieser multiplen Regression ist natürlich die Studiennote.
Soweit habe ich den Eindruck gut unterwegs zu sein. Mein Problem kommt jetzt erst. Innerhalb meiner Stichprobe habe ich eine Störvariable entdeckt. Zwischen dem Studiumsabschnitt, in dem sich meine Studienteilnehmer befinden – operationalisiert über die bereits im Studium erworbenen Leistungspunkte (Credits) – und der Studienleistung besteht ein signifikanter Zusammenhang (r = -.26, p < 0.001). Ähnlich, aber nach 95% Konvention knapp „nicht signifikant“ mit der Abiturnote (r= -.132, p = .062).
Nun sind das nunmal die Daten, die ich habe und muss damit weitermachen. Bei gewissen Korrelationen, z.B. dem Zusammenhang A) würde ich über eine partielle Korrelation den Einfluß der Störvariable herausrechnen (sieht soweit da auch ganz gut aus: r von Abinote und Studiumsnote sinkt durch Herauspartialisierung von Credits „nur“ von .426 auf .409, jeweils p < 0.001).
Nun weiß ich allerdings nicht, wie ich den Einfluß dieser Variable für die Methode zur Analyse des Zusammenhangs B) kontrolliere. Ich habe dazu mal im Bortz Statistikbuch nachgelesen und zumindest herausgefunden, dass ich die Beta-Gewichte der einzelnen Prädiktoren um den Einfluss der Störvariable bereinige, wenn ich die Störvariable in meine Regressionsgleichung aufnehme.
Ziel meiner Analyse ist es jedoch, die Korrelation A) mit der multiplen Korrelation B) zu vergleichen, auf die Beta-Gewichte gehe ich Grunde gar nicht ein. Nun ist meine Frage: Wenn ich mein multiples Regressionsmodell um den Prädiktor „Credits“ erweitere, wie verändert sich meine Interpretation von der multiplen Korrelation (korrigiertes r²). Wenn ich das mal ausprobiere steigt die im Vergleich von ohne- zu mit „Credits“ von .21 auf .243. Ist einer von den Werten um den Einfluß der Störvariable bereinigt oder nicht?
Vielen Dank schon mal fürs lesen, für Hinweise und Ideen wäre ich sehr dankbar!