ich will eine Binäre Logistische Regression durchführen, die
- - einen 0/1-Dummy (D)
- eine mittelwertzentrierte metrischen Variable (M)
- und einen Interaktionsterm der zuvor genannten Variablen (D*M)
Nun wird mir vorgeworfen, dass im Modell Multikollinearität vorliegen muss, da der Interaktionsterm D*M immer entweder D oder aber M ergibt, z.B.:
- - bei D=0 gilt D * M = 0 und somit = D
- bei D=1 gilt D * M = M
Die Häufigkeit von D=0 ist dabei 3/4, die von D=1 ist 1/4.
Somit korrelieren D und D*M bzw. M und D*M schon dem Augenschein nach sehr stark.
Ich habe sowohl die Tolleranz (TOL) als auch den Variance Inflation Factor (VIF) als Test auf Multikollinearität durchgeführt aber keine Multikollinearität im Modell (das auch weitere Variablen beinhaltet) festgestellt. Trotzdem wird weiter darauf beharrt, dass Multikollinearität vorliegen muss, ohne dass mir ein Lösungsansatz nahegelegt wird.
Ich meine: Interaktionen zwischen einem Dummy und einer Metrischen Variable, wie meine, muss es in Regressionen aller unterschiedlicher Arten doch schon 1000fach gegeben haben, ohne das es für jemanden ein Problem dargestellt hat, oder? Es liegt doch in der "Natur der Sache" das ein solcher Interaktionsterm aus Dummy und metrischer Variable mit seinen bestandteilen korreliert, oder?
Hat jemand von Euch vielleicht eine Idee, was ich übersehe haben könnte, oder wie ich mich argumentativ aus dieser Zwickmühle befreien könnte?
Viele liebe Grüße
Anna