also, ich weiss was Overfitting ist und der GMDH-Algorithmus verwendet Testdatensätze um mit Trainingsdatensätzen trainierte Gleichungsstrukturen zu prüfen. Ich kenne auch den Unterschied zwischen Kausalität und Korrelation. Auch die Begriffe Grey, White und Blackboxmodellierung sind mir ein Begriff.
Ich frage mich woher man wissen kann, dass ein Polynom 5. Ordnung nicht vielleicht doch den richtigen Zusammenhang Sterblichkeit<->Flussabstand modelliert? Warum machen wir Regressionsanalyse, wenn wir die richtige Struktur schon vorab zu kennen glauben?
Auf Deine Frage, wie sonst die Herangehensweise ist, gibt es leider keine universelle Antwort. Es gibt keine eierlegende Wollmilchsau. Warum denkst Du, gibt es den ganzen Hype um Deep Learning, wenn man das alles auch mit Polynom-Regression erledigen könnte?
Bleiben wir mal beim Thema und das Modellierungsproblem lässt sich perfekt mit Regression lösen, es muss nur die richtige Gleichung gefunden werden. Ich akzeptiere gern, dass es keine universelle Antwort gibt. Bisher wurden hier im Thread jedoch als "nicht universelle Antworten" lediglich "Ausprobieren" (meinetwegen auch mit Vorwissen über Korrelationen u.ä.) und "GMDH" genannt. Ich glaube von mir.