STATISTIK-FORUM.de

tttoben · von **tttoben** » Do 25. Apr 2019, 14:01

Hallo,

also, ich weiss was Overfitting ist und der GMDH-Algorithmus verwendet Testdatensätze um mit Trainingsdatensätzen trainierte Gleichungsstrukturen zu prüfen. Ich kenne auch den Unterschied zwischen Kausalität und Korrelation. Auch die Begriffe Grey, White und Blackboxmodellierung sind mir ein Begriff.

Ich frage mich woher man wissen kann, dass ein Polynom 5. Ordnung nicht vielleicht doch den richtigen Zusammenhang Sterblichkeit<->Flussabstand modelliert? Warum machen wir Regressionsanalyse, wenn wir die richtige Struktur schon vorab zu kennen glauben?

Auf Deine Frage, wie sonst die Herangehensweise ist, gibt es leider keine universelle Antwort. Es gibt keine eierlegende Wollmilchsau. Warum denkst Du, gibt es den ganzen Hype um Deep Learning, wenn man das alles auch mit Polynom-Regression erledigen könnte?

Bleiben wir mal beim Thema und das Modellierungsproblem lässt sich perfekt mit Regression lösen, es muss nur die richtige Gleichung gefunden werden. Ich akzeptiere gern, dass es keine universelle Antwort gibt. Bisher wurden hier im Thread jedoch als "nicht universelle Antworten" lediglich "Ausprobieren" (meinetwegen auch mit Vorwissen über Korrelationen u.ä.) und "GMDH" genannt. Ich glaube von mir.

PonderStibbons · von **PonderStibbons** » Do 25. Apr 2019, 14:34

Um was geht es denn inhaltlich - was ist das Thema, worin bestehen die abhängige und die Prädiktorvariablen?
Wieviele Prädiktoren sind es und wie groß ist die Stichprobe?

Mit freundlichen Grüßen

PonderStibbons

Holgonaut · von **Holgonaut** » Sa 27. Apr 2019, 08:51

Hi Heinz

bele hat geschrieben: Vorausgesetzt natürlich, dass Netze überhaupt infrage kommen.

Ich hab erst vor kurzem begonnen, mich damit zu beschäftigen. Kannst du das etwas ausführen? Was sind Situationen, in denen NN nicht infrage kommen?

tttoben · von **tttoben** » Mo 29. Apr 2019, 10:30

Das hatte bele geschrieben. Aber bei mir kommen sie bspw. nicht infrage, weil ich das ganze in TwinCAT programmieren muss, und es da überhaupt keine solche Bibliotheken gibt.

bele · von **bele** » Mo 29. Apr 2019, 14:23

Holgonaut hat geschrieben: Kannst du das etwas ausführen? Was sind Situationen, in denen NN nicht infrage kommen?

Stimmt, das hatte ich geschrieben. Meinen letzten Post in diesen Thread konnte ich nicht absetzen, weil der Absenden-Button nicht funktionierte, aber anscheinend habe nur ich gelegentlich dieses Problem. tttoben hatte ja wenig über sein ursprüngliches Problem geschrieben. Wenn ihm ein Prof gesagt hätte "das Modellierungsproblem lässt sich perfekt mit Regression lösen - lösen sie das mit Polynomen", dann wäre ein NN nicht infrage gekommen. Wenn man die Regression nicht zur Vorhersage, sondern als Strukturaufdeckendes Verfahren verwendet, dann hat man bei einer linearen Regression deutlich mehr Chancen, die Koeffizienten als Mensch zu deuten und zu interpretieren als bei einem NN. Wenn man in einer konservativen Struktur unterwegs ist, in der Publikationswürdigkeit durch einen oder mehrere p-Werte unter 5% definiert wird, dann sind NN nicht unbedingt optimal, p-Werte zu produzieren. Wenn Vorhersgewerte mit einfachen Mitteln (Nomogramm, Taschenrechner, JavaScript im Browser auf dem Handy) ausgerechnet werden müssen oder der Vorhersagealgorithmus auf ein Poster passen muss, dann sind NN nicht die erste Wahl, wenn eine lineare Regression gleiches liefert. Und dann soll es ja auch Regressionen auf Basis kleiner Datenmengen geben.
Wahrscheinlich kannst Du mir für einzelne Punkte Gegenargumente und Ausnahmen aufführen aber wahrscheinlich gibt es auch noch mehr Situationen, in denen ein NN nicht wirklich gut passt. Von TwinCAT beispielsweise hatte ich zuvor noch nie gehört.

Mein Eindruck war, dass wir beide von einem XY-Problem ausgegangen sind und deshalb rechts und links nach Lösungen gesucht haben, während tttoben das nicht so sieht und alles, was nicht optimale Polynomregression ist, als off topic betrachtet (daher "Bleiben wir mal beim Thema").

LG,
Bernhard

STATISTIK-FORUM.de

Auswahl unabhängiger Variablen bzw. Strukturidentifikation

Re: Auswahl unabhängiger Variablen bzw. Strukturidentifikati

Re: Auswahl unabhängiger Variablen bzw. Strukturidentifikati

Re: Auswahl unabhängiger Variablen bzw. Strukturidentifikati

Re: Auswahl unabhängiger Variablen bzw. Strukturidentifikati

Re: Auswahl unabhängiger Variablen bzw. Strukturidentifikati

Wer ist online?