Hallo zusammen,
ich schreibe gerade meine Masterarbeit und muss dafür einen Fragebogen auswerten.
Die ganzen deskriptiven Statistiken habe ich bereits abgearbeitet und befinde mich jetzt auf der schließenden Ebene, genauer bei der Regressionsanalyse.
Bei der zu erklärenden Variable soll die Attraktivität eines Preises mit mehreren erklärenden Variablen beschrieben werden (multible Regression). Das erste Problem bestand darin, dass ein Großteil der Variablen nicht normalverteilt ist, was ich jedoch so gut wie möglich durch eine log Transformation gelöst habe. Ebenfalls ist die zu erklärende Variable durch Multiplikation mehrere Variablen erzeugt worden, um die Attraktivität aus verschiedenen Komponenten zusammenzusetzen.
Meine Frage ist diejenige: Darf ich bei der Regression erklärende Variablen aufnehmen aus denen die zu erklärende Variable erzeugt wurde? Natürlich steigt dadurch mein R-Quadrat und die Signifikanz der Variablen erheblich an, wodurch die erklärende Varianz um ca. 40% steigt. Oder wird dadurch mein Modell unbrauchbar und hat trotz dem hohen R-Quadrat keine Aussagekraft.
Danke für die Hilfe.
VG
Florian8686