Hi,
Christopherkch hat geschrieben:Eine Vorhersage wäre das Ziel. Ist dabei der Einfluss nicht aber entscheidend?
Im einfachen linearen Modell nicht ganz, aber die Welt ist voll von Alternativen wie der LASSO Regression oder randomForests bei denen der Zufall eine ordentliche Rolle spielt, sodass man der Gewichtung einzelner Prädiktoren nicht zu sehr glauben sollte, die aber auch unter schwierigen Bedingungen passable Vorhersagen erlauben können und die sich aus zehn Prädiktoren die heraussuchen, die sie brauchen. RandomForests können auch erheblich nicht-lineare Zusammenhänge abbilden.
Im Internet bin ich auf einen Rechner gestoßen, der die Stichprobengröße bei unterschiedlichen Vorraussetzungen ermittelt (Wahrscheinlich kennst du ihn):
Nein, kannte ich nicht. Wenn Du ein wahres R^2 von 50% haben solltest, kannst Du zu 90% nachweisen, dass dieses Modell besser ist als einfach nur den Mittelwert der Ergebnisse zu nehmen.
Sowohl zu LASSO also auch zu random forests gibt es bestimmt gute Youtube Videos von StatQuest. Zu LASSO und dem R Paket glmnet habe ich mal einen sehr schönen Vortrag von Trevor Hastie gesehen, ich glaube, es war dieser hier:
https://youtu.be/BU2gjoLPfDc (YMMV, ich sage nicht, dass das Deine Probleme lösen würde. Aber vielleicht sollte man davon gehört haben, wenn man eine prädiktives öineares Modell erstellen will und zuviele Variablen hat).
Random Forests kann man u.a. mit dem R Paket randomForest erstellen. Wenn das das passende Verfahren wäre, dann wäre es recht leicht anzuwenden.
LG, Bernhard