Guten Tag Zusammen,
ich habe in meiner Studie verschiedene Skalen erhoben und unter anderem eine neue Skala konstruiert.
Mittels multipler Regression wollte ich herausfinden, inwiefern meine neu entwickelte Skala einen Vorteil gegenüber den anderen Skalen aufwies.
Mein Prof schlug vor, zunächst die Rohkorrelation zwischen meiner Skala und den verschiedenen AV's zu berechnen und dann verschiedene multiple Regressionen und dabei dann vor allem auf die Semipartialkorrelation zu blicken.
Das Ganze erfolgte in zwei Schritten. Meine neue Skala erfasst eine gewisse Art von Emotionen. Daher sollte ich im ersten Schritt zunächst nur die Skalen mit in die Analyse aufnehmen, die ebenfalls Emotionen erfassen. Im nächsten Schritt sollte ich dann ALLE Skalen in das Modell schmeißen (die anderen Skalen erfassen noch ASpekte wie Einstellungen etc.), um zu schauen, wie sich der Zusammenhang zwischen meiner Skala und der AV verändert.
Heißt quasi drei Schritte: 1. Rohkorrelation, 2. Multiple Regression mit den emotionsbasierten Skalen, 3. Multiple Regression mit allen Skalen.
Folgendes Problem. Bei einer AV zeigte sich sowohl in Schritt 1, als auch in Schritt zwei kein signifikanter Zusammenhang. Im dritten Schritt wurde der Zusammenhang auf einmal signifikant, aber auch nicht in der Richtung, wie es erwartet wurde. Inhaltlich lässt sich das kaum erklären. Daher meine Frage:
Kann ich dieses Ergebnis als ein statsitisches Artefakt beschreiben? Ich habe in dem letzten Modell ziemlich viele Prädiktoren aufgenommen. Die können ja z.B. dazu führen, dass der Determinationskoeffizient verzerrt wird. Kann die hohe Anzahl der Prädiktoren auch als Grund angeführt werden, dass ein Koeffizient signifikant wird, obwohl er es eigentlich nicht ist?
Ich habe dann mal noch eine Regression nur mit den Skalen durchgeführt, die im dritten Schritt ergänzt wurden (also nur die Skalen zu Einstellungen etc.) - und siehe da, kein signifikanter Zusammenhang mehr.
Ich finde da leider im Internet keine Erklärung für. Ist meine statistische Erklärung plausbiel? Seht ihr da noch andere mögliche Gründe, weshalb ein Koeffizient fälschlicherweise signifikant wird? Wenn ihr wisst, gerne auch die richtigen statistischen Begriffe, damit ich irgendwie noch eine Quelle dazu suchen kann.
Vielen Dank für die Hilfe!
Isa