von bele » Sa 3. Dez 2016, 13:25
Wenn beim zweiten Mal so wenig kommt, kommt auch meistens später nichts wirklich brauchbares mehr, daher wage ich eine erste Antwort:
Wenn Du 7 Einflussfaktoren hast, musst Du im linearen Modell 8 Koeffizienten schätzen. 8 Koeffizienten aus 60 Datensätzen ist sportlich, aber einen Versuch wert. Wenn Du Glück hast, und die tatsächlich zugrunde liegenden Prozesse sind tatsächlich linear und die Messfehler klein und es gibt keine ausgeprägten Interaktionen, dann kannst Du damit ein gutes prognostisches Modell rechnen.
Wenn die Zusammenhänge zwischen den Prädiktoren und dem vorherzusagenden Wert weniger einfach gestrickt sind und es nur um Vorhersage handelt, dann würde ich (wieder mal) Regressionsverfahren auf der Basis von Entscheidungsbäumen vorschlagen (google mal nach "CART", "CHAID" oder "C4.5" jeweils zusammen mit "Algorithmus" oder "algorithm", außerdem "random-forest"). Damit bekommst Du ohne viel Mühe erstmal ein Regressionsmodell, dass Du einfach anwenden kannst.
Ob das dann auch was taugt, und ob es besser oder schlechter als das lineare Modell ist, ist schon schwerer zu beantworten. Googlen nach "Cross-Validation" könnte dann helfen, oder sich zur Residuen-Analyse belesen.
LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)