Liebe alle,
ich muss wieder einmal Eure Hilfe in Anspruch nehmen... es ist wahrscheinlich eine total simple Frage, aber ich bin grade ziemlich durcheinander...
Man liest in der Literatur häufig (aber irgendwie auch nicht immer), dass nicht-signifikante Prädiktoren aus einem Regressionsmodell herausgenommen werden können (oder sollten?). Ich dachte bisher eigentlich, dass zu viele Prädiktoren nicht so schlimm sind, so lange man sich am korrigierten R2 orientiert und die Power nicht zu sehr darunter leidet, aber jetzt habe ich eben schon mehrfach gelesen, dass man nicht-signifikante Regressoren entfernen sollte, weil sonst auch das korrigierte R2 nicht wirklich aussagekräftig ist... allerdings gibt es doch für mein Modell ja eine theoretische Begründung, so dass ich es intuitiv falsch finde, die Parameter aus dem Modell zu entfernen.
In meinem speziellen Fall ergeben sich noch weitere Gründe, aus denen heraus ich unsicher bin, wie ich in meiner Regressionsanalyse mit den nicht-signifikanten Regressoren umgehen soll, und zwar aus folgenden zwei Gründen:
(1) Ich habe unter den Regressoren Kontextvariablen, von denen in der Literatur ausgegangen wird, dass sie einen Einfluss ausüben; das tun sie aber bei mir in der Regel nicht (zumindest sind die nict signifikant, wobei beta aber auch nicht immer Null ist, aber bei meinem N wohl nicht groß genug). Sollte ich sie im Modell lassen, um zu zeigen, dass meine anderen Prädiktoren signifikant sind, wenn diese Kontextfaktoren konstant gehalten werden? Oder sollte ich sie rausschmeißen, sofern sich dadurch nichts an den anderen Prädiktoren ändert?
(2) Da ich eine international vergleichende Studie habe, mit Fragebögen in drei verschiedenen Sprachen und offenbar hoch kulturspezifischem Antwortverhalten (in einem Land tendenziell sehr hohe Einschätzungen, im anderen Land durchweg eher niedrig etc.), rechne ich für jedes Ländersample jeweils eine eigene Regressionsanalyse und mache im Anschluss einen "qualitativen" Vergleich der Muster. Gerade um die Vergleichbarkeit trotzdem zu erhalten, möchte ich eigentlich für alle drei Länder das gleiche Modell rechnen. Es werden aber in den einzelnen Ländern unterschiedliche Prädiktoren signifikant, so dass ich die Vergleichbarkeit einschränken würde, wenn ich einen Prädiktor in der einen Analyse lösche und in der anderen nicht... also alle drin lassen? Oder alle löschen, die in allen drei Ländern nicht-signifikant sind (dann wieder Problem 1)?
Schon einmal vielen Dank für Eure Antworten!
Verwirrte Grüße vom Schaumgummiball