Danke erstmal für die schnelle Antwort.
Sorry, ich habe mich ein wenig unvollständig und missverständlich ausgedrückt. (Mir raucht der Kopf)
ich möchte den Einfluss mehrerer Kriterien auf den Preis von Produkten mittels einer multiplen Regression testen.
Die Stichprobe beinhalten ca. 890.000 Datensätze.
Ich habe eine Reihe von nominalen unabhängigen Variablen die ich anhand von Dummy-Variablen in das Modell einbringe.
Die beiden unabhängigen Variablen die ich hier angehängt habe bereiten mir Probleme:
Das erste Diagramm zeigt den Preisindex und die verkaufte Menge.
Der Preisindex ist logarithmiert. Ich bin mir anhand des Diagramms nicht sicher ob das ein linearer Zusammenhang ist.
Bzw. welche Transformation sinnvoll ist, um diese zu erreichen. Habe diverse Kombinationen von 1/y; ln(y); etc. versucht, aber kein eindeutiges Bild erhalten und mich nun gefragt ob das nicht schon als linearer Zusammenhang angesehen werden kann. Der originäre Zusammenhang sieht so aus:
https://www.bilder-upload.eu/bild-b1bee ... 0.png.htmlBei dem zweiten Diagramm handelt es sich um eine vierstufiges Ranking das die Größe des Kunden angibt.
Verstehe ich deinen Hinweis richtig, dass diese dann ebenfalls mittels Dummys berücksichtigt werden müssten?
Viele Grüße und Danke
Sebastian