Auswahl unabhängiger Variablen bzw. Strukturidentifikation

Alle Verfahren der Regressionanalyse.

Re: Auswahl unabhängiger Variablen bzw. Strukturidentifikati

Beitragvon tttoben » Do 25. Apr 2019, 14:01

Hallo,

also, ich weiss was Overfitting ist und der GMDH-Algorithmus verwendet Testdatensätze um mit Trainingsdatensätzen trainierte Gleichungsstrukturen zu prüfen. Ich kenne auch den Unterschied zwischen Kausalität und Korrelation. Auch die Begriffe Grey, White und Blackboxmodellierung sind mir ein Begriff.

Ich frage mich woher man wissen kann, dass ein Polynom 5. Ordnung nicht vielleicht doch den richtigen Zusammenhang Sterblichkeit<->Flussabstand modelliert? Warum machen wir Regressionsanalyse, wenn wir die richtige Struktur schon vorab zu kennen glauben?


Auf Deine Frage, wie sonst die Herangehensweise ist, gibt es leider keine universelle Antwort. Es gibt keine eierlegende Wollmilchsau. Warum denkst Du, gibt es den ganzen Hype um Deep Learning, wenn man das alles auch mit Polynom-Regression erledigen könnte?


Bleiben wir mal beim Thema und das Modellierungsproblem lässt sich perfekt mit Regression lösen, es muss nur die richtige Gleichung gefunden werden. Ich akzeptiere gern, dass es keine universelle Antwort gibt. Bisher wurden hier im Thread jedoch als "nicht universelle Antworten" lediglich "Ausprobieren" (meinetwegen auch mit Vorwissen über Korrelationen u.ä.) und "GMDH" genannt. Ich glaube von mir.
tttoben
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Mo 22. Apr 2019, 14:26
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Auswahl unabhängiger Variablen bzw. Strukturidentifikati

Beitragvon PonderStibbons » Do 25. Apr 2019, 14:34

Um was geht es denn inhaltlich - was ist das Thema, worin bestehen die abhängige und die Prädiktorvariablen?
Wieviele Prädiktoren sind es und wie groß ist die Stichprobe?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Auswahl unabhängiger Variablen bzw. Strukturidentifikati

Beitragvon Holgonaut » Sa 27. Apr 2019, 08:51

Hi Heinz

bele hat geschrieben: Vorausgesetzt natürlich, dass Netze überhaupt infrage kommen.


Ich hab erst vor kurzem begonnen, mich damit zu beschäftigen. Kannst du das etwas ausführen? Was sind Situationen, in denen NN nicht infrage kommen?
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Re: Auswahl unabhängiger Variablen bzw. Strukturidentifikati

Beitragvon tttoben » Mo 29. Apr 2019, 10:30

Das hatte bele geschrieben. Aber bei mir kommen sie bspw. nicht infrage, weil ich das ganze in TwinCAT programmieren muss, und es da überhaupt keine solche Bibliotheken gibt.
tttoben
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Mo 22. Apr 2019, 14:26
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Auswahl unabhängiger Variablen bzw. Strukturidentifikati

Beitragvon bele » Mo 29. Apr 2019, 14:23

Holgonaut hat geschrieben: Kannst du das etwas ausführen? Was sind Situationen, in denen NN nicht infrage kommen?


Stimmt, das hatte ich geschrieben. Meinen letzten Post in diesen Thread konnte ich nicht absetzen, weil der Absenden-Button nicht funktionierte, aber anscheinend habe nur ich gelegentlich dieses Problem. tttoben hatte ja wenig über sein ursprüngliches Problem geschrieben. Wenn ihm ein Prof gesagt hätte "das Modellierungsproblem lässt sich perfekt mit Regression lösen - lösen sie das mit Polynomen", dann wäre ein NN nicht infrage gekommen. Wenn man die Regression nicht zur Vorhersage, sondern als Strukturaufdeckendes Verfahren verwendet, dann hat man bei einer linearen Regression deutlich mehr Chancen, die Koeffizienten als Mensch zu deuten und zu interpretieren als bei einem NN. Wenn man in einer konservativen Struktur unterwegs ist, in der Publikationswürdigkeit durch einen oder mehrere p-Werte unter 5% definiert wird, dann sind NN nicht unbedingt optimal, p-Werte zu produzieren. Wenn Vorhersgewerte mit einfachen Mitteln (Nomogramm, Taschenrechner, JavaScript im Browser auf dem Handy) ausgerechnet werden müssen oder der Vorhersagealgorithmus auf ein Poster passen muss, dann sind NN nicht die erste Wahl, wenn eine lineare Regression gleiches liefert. Und dann soll es ja auch Regressionen auf Basis kleiner Datenmengen geben.
Wahrscheinlich kannst Du mir für einzelne Punkte Gegenargumente und Ausnahmen aufführen aber wahrscheinlich gibt es auch noch mehr Situationen, in denen ein NN nicht wirklich gut passt. Von TwinCAT beispielsweise hatte ich zuvor noch nie gehört.

Mein Eindruck war, dass wir beide von einem XY-Problem ausgegangen sind und deshalb rechts und links nach Lösungen gesucht haben, während tttoben das nicht so sieht und alles, was nicht optimale Polynomregression ist, als off topic betrachtet (daher "Bleiben wir mal beim Thema").

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Vorherige

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 7 Gäste