Hallo zusammen,
kurz der Hintergrund der Daten:
für eine Hausarbeit habe ich eine Umfrage durchgeführt (n=70). Dabei habe ich in 5 verschiedenen Kategorien nach dem Ankerpunkt Prinzip die Probanden gebeten, Aussagen zu bewerten (die wichtigste Aussage bekommt immer die 10, die restlichen 4 Aussagen dürfen auf einer Skala von 1-9 bewertet werden -> musste aufgrund des Themas so gemacht werden -> ratio skaliert). Am Ende jeder Kategorie musste dann die Attraktivität (Arbeitsplatzattraktivität) auf einer Skala von 1-10 angegeben werden. Am Ende mussten die Probanden dann noch die gesamte Attraktivität ihres Arbeitsplatzes über alle 5 Kategorien angeben.
Mein Problem:
Ich hatte mit meiner Professorin ausgemacht, dass ich eine Stufenregression mache. Also ich bilde zuerst pro Kategorie eine multiple Regression mit jeweils 5 Prädiktoren und dann am Ende eine Regression mit den 5 Attraktivitätsskalen und der gesamten Attraktivität. Ziel war dann dabei herauszufinden, welcher Faktor den größten Einfluss auf die wahrgenommene Arbeitsplatz-Attraktivität hat. (1. Schritt: Welche Kategorie hat den größten Einfluss 2.Schritt: Welches Item in der Kategorie hat den größten Einfluss)
In der ersten 5 Regressionen komme ich jedoch mit meinem adjustierten r² nicht einmal über 0.03. In der Gesamtregression am Ende liege ich bei 0,76. Meine Vermutung ist, dass ich durch das Erhebungsdesign automatisch eine extreme Streuung eingebaut habe. Ich hatte beispielsweise in einer Kategorie mal probiert zu n=70 einfach 400 weitere Datensätze hinzuzufügen, die alle genau gleich geantwortet haben. Selbst dann schaffe ich es mit r² gerade mal auf 0,22.
Meine Frage ist jetzt: Darf ich, wenn mein r² soo gering ist, überhaupt eine Aussage über meine Regressionskoeffizienten treffen? Offensichtlich liegt ja kein linearer Zusammenhang vor. Zusätzlich frage ich mich, welche Aussage dann die Gesamtregression überhaupt hat, wenn innerhalb der 5 "Unterregressionen" r² so extrem niedrig ist. Meine Aussage die ich treffen würde wäre, dass es keinen Zusammenhang zu geben scheint zwischen dem, was Arbeitnehmer wichtig finden und dem, wie Arbeitgeber es im Alltag umsetzen.
Hiermal der Output einer Unterregression:
https://ibb.co/CzL6prm
Hoffe das war soweit verständlich...