Hallo,
im Rahmen meiner Abschlussarbeit möchte ich in einer multiplen Regression folgendes Szenario untersuchen.
1.) Ich habe für n=300 Unternehmen die tatsächlichen Marketingkosten ermittelt
2.) Für die selben Unternehmen habe ich Proxywerte f. d. Marketingkosten auf Basis der Werte aus einer Datenbank
Ich möchte nun ermittlen welche Einflussfaktoren, wie z.B. Marktkonzentration, Industrie in der sich das Unternehmen befindet, Marktwachstum etc., die Differenz zwischen 2.) und 1.) treiben (Die Werte aus der Ermittlung nach 2. sind immer größer als die Werte aus 1. - dies ist in dem Ermittlungsvorgehen begründet).
Ich frage mich nun die ganze Zeit, welches die abhängige Variable ist. Zuerst dachte ich, dass die abhängige Variable die Differenz, also 2.) - 1.) wäre. Nun frage ich mich aber, ob es nicht viel sinnvoller wäre, 1.), also die tatsächlichen Marketingkosten, als die abhängige Variable und 2.), die Proxyvariable (welche man jederzeit für alle möglichen Unternehmen in der Datenbank einsehen kann), als weitere unabhängige Variable zu nehmen.
Was meint ihr? Ich habe bisher mit zwei Leuten darüber geredet und jeder hat eine andere Vorgehensweise bevorzugt.
Vielen Dank für eure Meinung im Voraus.
Einen schönen Tag euch.