Hallo Community!
Ich habe vor, Kurven mit Referenzkurven zu vergleichen und zu bewerten. Die Referenzkurven (6 Kurven bzw. 6 Plots) stammen aus Messungen eines realen Modells. Dieses Modell liegt nun auch mit 94 Parametern virtuell vor und soll so angepasst werden, dass es sich wie das reale Modell mit den 6 Referenzkurven bzw. 6 Plots verhält (also dass reale Messungen und virtuelle nahezu gleich sind, was im Moment nicht der Fall ist).
Es geht aber erst mal darum herauszufinden, welche Parameter aus dem virtuellen Modell besonders starken Einfluss auf EINE der 6 Kurven haben und dabei alle anderen 5 Kurven möglichst gering beeinflussen. So soll dann der Optimierer effizienter arbeiten, der sonst eine Ewigkeit brauchen würde, wenn der alle 94 Parameter je Referenzkurve berücksichtigen müsste. Die Messkurven aus dem virtuellen Modell wurden durch Simulationen bestimmt. Ich betrachte nun 6 Ausgangskurven und 6x188 weitere Kurven, aus Konfigurationen, bei denen denen die Parameterwerte jeweils und nacheinander ein mal halbiert und ein mal verdoppelt wurden. Warum halbiert und verdoppelt wurde, soll hier mal egal sein Mal ein Beispiel, was mein Ziel ist:
Ich habe die Ausgangskurven "Eins", "Zwei", "Drei", "Vier", "Fünf" und "Sechs" aus Konfiguration 1 (keine Änderungen). Ich hab nun mit eurer Hilfe herausgefunden, dass die Konfiguration X die größte Abweichung zur Ausgangskurve "Eins" hervorruft, und dabei die Abweichung zu den Kurven "Zwei", "Drei", "Vier", "Fünf" und "Sechs" nahe null ist. Also große Veränderung im Plot "Eins" und geringe bei allen anderen. Sag ich dem Optimierer, er soll nur den Parameter, dessen Wert in Konfiguration X geändert wurde, verwenden, schafft er es schnell das virtuelle Modell an die Referenzkurve "Eins" anzupassen. Die erste reale Messkurve stimmt nahezu mit der virtuelle überein.
Problem bei dem ganzen:
- Wird an einem Parameter geschraubt, ändert sich das Modellverhalten i.d.R. hinsichtich aller Kurven, nur eben unterschiedlich stark. Ich will Parameter herausbekommen, die einen großen Einfluss auf eine und einen möglichst geringen Einfluss auf alle anderen haben. So kann der Optimierer die 6 Referenzkurven, an die das Modell angepasst werden soll, nahezu isoliert betrachten.
- Wie berechne ich hier sinnvollerweise die Abweichung? Ich betrachte momentan den RMSE (Root Mean Squared Error - sollte ähnlich der Standardabweichung sein), MSE (Mean Squared Error), LSE (Least Squared Error), MdSE (Meadian Squared Error), sMAPE (scaled Mean Absolute Percentage Error) und so weiter und würde gerne einige ausschließen, die nicht sinnvoll zu verwenden sind.
Vielleicht könnt ihr mir schon helfen, wenn ihr mir sagen könnt, wann eine relative Abweichung (%) einer "normalen" (Differenz) vorzuziehen ist. Oder wann der Median den Vorzug ggü. dem ar. Mittelwert bekommen sollte. Es handelt sich beim Modell um ein Fahrwerk - Ausreißer sind nicht zu erwarten. Die Kurven verlaufen beinahe durch den Nullpunkt, weswegen ich die relative Abweichung schon fast ausschließe (sehr große Werte).
Ich hoffe, ich habe mich einigermaßen verständlich ausgedrückt und verschrecke niemanden mit dem ellenlangen Text Die Statistik ist mir relativ fremd, wie man merkt.. Auch allgemeine Tipps können mir sehr weiterhelfen!
Edit: Hier mal die Abweichungen
Absolute Abweichung: https://www.bilder-upload.eu/bild-8e7f6 ... 9.png.html
Prozentuale: https://www.bilder-upload.eu/bild-67db9 ... 8.png.html
Die Prozentuale Abweichung geht teils bis ca. 5000 % hoch.
Edit2: Ich lese oft von einer Regressionsanalyse. Ist das hier anwendbar? Schließlich will ich jeweils Kurven miteinander vergleichen..