Hallo zusammen,
zunächst zur Entschuldigung: Ich verfüge nur über geringe statistische Kenntnisse und kann dementsprechend nicht mit allen Fachbegriffen etwas anfangen. Ich bin quasi reiner Anwender und arbeite mit Excel. In der Regel betrachte ich den Energieverbrauch auf Monatsbasis für min. 1 Jahr und normalisiere diesen mit den Einflussfaktoren wie Temperatur, Produktionsmenge etc.
Ich habe vor einiger Zeit einen Kurs besucht zur Anwendung der Regressionsanalyse zur Berechnung von Kennzahlen im Energiemanagement. Im Energiemanagement stellt der Schnittpunkt aus der Excel-Ausgabe die energetische Grundlast dar. Das heißt diese darf nicht negativ sein, da es in der Industrie immer eine gewisse energetische Grundlast gibt. Soweit so gut. In dem Kurs hieß es aber auch, dass die Variablen nicht negativ sein dürfen. Eine Variable die in der Ausgabe gerne mal negativ ist, ist z.B. die zur Temperatur. Der Zusammenhang erscheint mir auch logisch, da ja bei sinkenden Temperaturen der Heizenergieverbrauch steigt.
Beispiel:
Koeffizienten
Schnittpunkt 9.339.600,39
X Variable 1 4896,119416
X Variable 2 -9884,582215
X Variable 3 8373,027571
X Variable 4 -173056,0468
X Variable 5 58138,51529
X Variable 6 -5551,11127
Formel:
Normalisierter Energieverbrauch = 9.339.600,39 + V1*4896,119416 + V2*(-98845) + V3*8373,027571 + V4*(-173056,0468) + V5*58138,51529 + V6*(-5551,11127)
Auf den Punkt gebracht: Dürfen bei einer multiplen linearen Regression die Variablen in der Excel-Ausgabe negativ sein oder funktioniert dann die Formel für die Normalisierung nicht mehr?
Mir ist bewusst, dass das für manche Anwendungsfälle Sinn ergibt. Ich bin mir nur bei der Betrachtung des Energieverbrauchs nicht sicher, weil eben der Kursleiter meinte, dass alle Koeffizienten positiv sein müssen, damit die Formel für die Normalisierung funktioniert.