Hallo Zusammen,
ich arbeite gerade an einem CRM-Projekt. Nun wird im Kundenbeziehungsmanagement oft gescored – und davon will ich wegkommen, da mir das irgendwie zu willkürlich vorkommt. Gibt es für die Geschlechtsausprägung en, deren hoher Einfluss in einer multiblen logisischen Regression nachgewiesen wurde, für „männlich“ 9 und für „weiblich“ 6 Punkte oder doch nur 9 und 4? Ich glaube ihr wisst, was ich meine.
In meinen MVA-Kursen im Studium habe ich gelernt, dass man in der linearen Regression für jeden einzelnen Fall die Schätzung der Logits ausrechen kann:
Z= konstante + Regressionskoeffizient Variable 1*Ausprägung Variable 1 + …+ Regressionskoeffizient Variable n*Ausprägung Variable n (ich hab da leider die korrekte Formel nicht)
Mit z eines Falls kann man dann die Wahrscheinliche Ausprägung der AV (Kunde tätigt in den nächsten 6 Monaten einen Wiederkauf) berechnen:
P= ez/1+ ez = 1/(1+e-z)
Durch viele alte Kundendaten von Abgeschlossenen Nutzungsintervallen (ich spreche von mehreren Tausend) möchte ich allgemeingülte Werte für die Regressionskoeffizienten der Variablen berechnen. Und dann die Ausprägungen der aktuellen Fälle in die obige Gleichung einsetzen, welche mir dann die Wahrscheinlichkeit eines Wiederkaufs in 6 Monaten für jeden einzelnen Kunden angibt. Das muss man dann nur noch ranken, und schon habe ich eine Liste derer, bei denen sich Dialogmaßnahmen am meisten lohnen.
Irgendwie finde ich das überzeugender als ein Scoringsystem, was denkt ihr?
Das ganze steht vor folgendem Hintergrund:
Es geht in dem Projekt darum, den Wiederkaufszeitpunkt von Bestandskunden zu berechnen. Dabei stehen die ganzen alten Kundendaten der letzten 10 Jahre zur Verfügung, über Profildaten (Geschlecht, Alter, usw), die Nutzungsdauer (so 6-8 Jahre) bis zum Serviceverhalten. Ich habe vor, diese historischen Daten in zwei Gruppen zu teilen: von der einen Hälfte nehme ich den Datenstand wenige Monate nach dem Kauf, von der anderen Hälfte den Datenstand von 6 Monaten vor dem Wiederkauf. Somit habe ich genug echte Beobachtungen: die eine Hälfte hat eben nicht nach sechs Monaten gerebuyt (wow, was für ein Wort), die andere schon.
Ist diese Herangehensweise zulässig? Ist natürlich keine Wissenschaft, aber ich denke, lieber nehme ich die Erfahrungen aus 10000 Fällen abgeschlossenen und wende sie auf die neuen an, als ein Scoringsystem über den Daumen zu brechen.
Oder hat jemand ein alternativvorschlag, was die Methode anbelangt? Eine Zeitreihenanalyse geht leider nicht, hat mir mein Mathematikerkollege gesagt, dazu haben wir zu wenig Beobachtungspunktgspunkte pro Fall.
Bitte gerne nachfragen, falls etwas zu undeutlich ausgeführt ist!