Liebe Foren-Nutzer,
in meinem Beruf beschäftige ich mich ich aktuell mit der Vorhersage von individuellen Gehältern. Uns steht ein Datensatz mit einem Umfang von ca. 2000 Mitarbeitern zur Verfügung. Für jeden Mitarbeiter haben wir Informationen zu Funktion, Level, Berufserfahrung etc.. Um nun den Lohn für einen neu einzustellenden Mitarbeiter vorherzusagen, haben wir an eine Lohnregression gedacht.
Nun würden wir den neueingestellen Mitarbeiter jedoch gerne nach der Vorhersage in unseren Datensatz mitaufnehmen - mit der Besonderheit, dass wir für diesem Mitarbeiter weitere Variablen (z.B. besondere Fähigkeiten, Abschluss etc.) kennen und diese gerne im Nachhinein zum Regressionmodell hinzufügen würden.
Meine Frage lautet nun: Wie können wir das am besten umsetzen?
Ich habe mich ein bisschen mit dem Thema Machine Learning beschäftigt und dachte vielleicht eine eine Lösung mit Trainingsdatenset und Testdatenset, wobei das Testdatenset immer um den jeweils neuen Mitarbeiter erweitert wird. Aber macht das überhaupt Sinn?
Ich würde mich sehr über euer Feedback freuen!
Danke und LG,
Kessi