Hallo,
ich habe ein paar grundlegende Fragen zum Thema Regression, bei der einerseits mehrere Prädiktoren (multipel) und andererseits mehrere abhängige Variablen (multivariat) untersucht werden.
Angenommen, ich habe einen Fragebogen, welcher ein psychologisches Merkmal erfasst und dieses lässt sich in drei Faktoren zerlegen: Im Endeffekt bekomme ich von dem Fragebogen drei Summenscores (einen pro Faktor).
Ebenfalls angenommen: Jede Person, welche den Fragebogen ausfüllt, unterzieht sich auch einem Test (der Aufmerksamkeit). Hier soll die Person bestimmte Elemente auf einem Bildschirm zählen und irgendwo im Hintergrund ist ein Bild platziert, welches die Person ggf. ablenken könnte.
Prinzipiell interessiert mich, ob ein Faktor (oder auch mehrere) des Fragebogens in Zusammenhang damit steht, dass eine Person sich in dem kleinen Aufmerksamkeitstest ablenken lässt.
Um das "Ablenken" bei der Aufgabe zu erheben, zeichne ich beim Lösen der Aufgabe die Augenbewegungen der Person auf. Aus diesen Daten kann ich dann zwei Größen ableiten: Einerseits, wie viel Zeit verstrichen ist, bist die Person zum ersten Mal auf die Ablenkung geschaut hat. Andererseits, wie lange sie insgesamt auf diese Ablenkung geschaut hat. Die Zeit messe ich in Sekunden.
Vorstellbar ist, dass eine Person, welche sich leicht ablenken lässt, schneller auf die Ablenkung schaut. Vorstellbar ist auch, dass eine Person, welche sich leicht ablenken lässt, insgesamt länger auf die Ablenkung schaut.
Nun dachte ich daran, die Variablen zeit_bis (verstrichene Zeit bis zum ersten mal die Ablenkung fokussiert wird) und zeit_in (kumulierte Zeit; also die Zeit, welche eine Person insgesamt auf die Ablenkung geschaut hat) mittels Regressionsanalyse durch die Prädiktoren a, b und c des Fragebogens zu schätzen.
Also quasi:
zeit_bis = a + b + c
zeit_in = a + b + c
Das wären ja einfach zwei univariate multiple Regressionen. Da die zwei Variablen zeit_bis und zeit_in allerdings nicht unabhängig voneinander sind (die Residuen würden korrelieren, richtig?) bekomme ich Probleme beim Testen der Signifikanz.
Entsprechend müsste ich eine multivariate multiple Regression rechnen, richtig?
Ich würde mich bei der Umsetzung an diese Schrift halten.
Ist das soweit korrekt oder mache ich irgendwo einen Fehler? Ich würde mich sehr über eure Antworten Freuen!
Beste Grüße