Hallo allerseits,
ich habe eine abhängige Variable y und mehrerer unabhängige Variablen x_i. Die x_i hängen zum teil von einander ab. Z.B. x_1={A,B,C} und x_2={1,2,3,4,5,6} wobei A= 1 oder 2 aus x_2 ist. Die x_1 sind nicht so fein strukturiert wie die x_2, sind aber im Prinzip das gleiche, nur auf einer anderen Ebene. Somit eine gewissen Korrelation.
Ich möchte nun meine Daten Untersuchen. Ich habe also z.B. :
y x_1 x_2
y_1 A 1
y_2 A 2
y_3 B 2
y_4 B 3
y_5 C 5
y_6 C 6
Wenn ich jetzt den Zusammenhang von x_1 auf y untersuchen will, darf ich dann y zusammenfassen
y_1* A
y_2* B
y_3* C
und damit dann eine Lin. Regression zu berechnen?
Für den Fall, dass ich die zweite unabhängige Variable benutze würde ich dann wieder folgende Daten benutzen:
y_1 1
y_2 2
y_3 2
y_4 3
y_5 5
y_6 6
Ich möchte nicht x_1 und x_2 in meinem Modell haben jeweils immer nur eine Variable von beiden.
Vielen Dank schonmal für eure Hilfe.