Kaufwahrscheinlichkeit mit mehreren Merkmalen berechnen

Fragen, die sich auf kein spezielles Verfahren beziehen.

Kaufwahrscheinlichkeit mit mehreren Merkmalen berechnen

Beitragvon Kabir » Fr 5. Jun 2020, 20:30

Hi,

ich arbeite gerade an einer wissenschaftlichen Arbeit die Wahrscheinlichkeit eines Kaufabschlusses zu berechnen und komme jetzt nicht weiter. Würde mich über eine Hilfe freuen.

Ich habe zuerst mehrere tausend Datensätze in 10 metrische und 1 nominelles Merkmal kategorisiert (Mitarbeiteranzahl, Budget, etc.). Diese dann verglichen mit jenen Kunden, die gekauft haben und jenen die nicht gekauft haben. Genauer gesagt die Wahrscheinlichkeit des Kaufes auf Basis der einzelnen Kategorien berechnet.

Bsp:
- Unternehmen aus der Branche "Beratung" kauft zu 40%
- Unternehmen mit einer Mitarbeiteranzahl zwischen 200-500 kauft zu 33%
- Unternehmen mit einem Jahresbudget zwischen 15.000-20.000 kauft zu 35%

Jetzt möchte ich diese Wahrscheinlichkeiten heranziehen um zu sehen wie wahrscheinlich es ist, dass ein neues Unternehmen/Nichtkunde mit seinen Merkmalen, den Kauf macht. Also wenn beispielsweise die obigen 3 Merkmale so zutreffen.

Mir ist klar, dass ich die Wahrscheinlichkeiten nicht einfach addieren kann, da sie sich gegenseitig beeinflussen oder überlappen. Ein Unternehmen mit einer höheren Mitarbeiteranzahl hat für gewöhnlich auch ein höheres Jahresbudget für Ausgaben. Jetzt müsste ich auch diese Überlappungen zueinander berücksichtigen - ein Gedanke war anhand einer Korrelationsmatrix das Verhältnis zueinander zu bestimmen. Aber was dann?

Wie mache ich das Ganze?

LG
Kabir
Kabir
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 5. Jun 2020, 20:02
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Kaufwahrscheinlichkeit mit mehreren Merkmalen berechnen

Beitragvon PonderStibbons » Fr 5. Jun 2020, 21:10

Eine Standard-Herangehensweise wäre die multiple binär-logistische Regression.
Vorhergesagt wird ein binäres Kriterium wie Kauf ja/nein. Jeder Prädiktor
in der Gleichung (Branche, Unternehmensgröße etc.) erhält ein Gewicht, das
unter Berücksichtigung der übrigen Prädiktoren ermittelt wird. Die
Regressionsgleichung mit Gewichten kann dann zur Vorhersage der
Kaufwahrscheinlichkeit neuer Fälle verwendet werden.

Mit feundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Kabir

Re: Kaufwahrscheinlichkeit mit mehreren Merkmalen berechnen

Beitragvon Kabir » Fr 5. Jun 2020, 21:36

Danke für die rasche Rückmeldung. Ich hatte vergessen zu erwähnen, dass ich nicht so bewandert bin in Datenanalyse und bisher alles mit Excel gemacht habe. Könnte eventuell Zugang zu SPSS oder R bekommen - aber das obige wüsste ich jetzt nicht anzuwenden. Kannst du mir das noch etwas näher erklären?

So wie ich das verstehe hilft mir die binär logistische Regression zu analysieren wie hoch der Einfluss eines Kriteriums auf den Kauf ist. Also helfen mir die berechneten Wahrscheinlichkeiten hier nicht? Wie gewichte ich dann die einzelnen Kriterien und wie setze ich sie dann in eine Regressionsgleichung um die Wahrscheinlichkeit für den Kauf zu bestimmen?
Kabir
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 5. Jun 2020, 20:02
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Kaufwahrscheinlichkeit mit mehreren Merkmalen berechnen

Beitragvon bele » Fr 5. Jun 2020, 22:08

Hallo Kabir,

such doch mal auf Youtube nach "logistische Regression" oder besser, wenn Du ausreichend Englisch verstehst, "logistic regression". Solche Wissenschaftsthemen sind auf Youtube oft Englisch besser erklärt. Dann schaust Du Dir mal drei oder vier Einführungsvideos dazu an und denkst gründlich drüber nach. Hier ist der richtige Ort, individuelle Verständnisfragen zu stellen. "Ich hab das Kapitel im Buch und die vorbereitenden Kapitel alle nicht gelesen, kannst Du mir das erklären" sprengt den Rahmen dessen, was ein Forumspost gut kann.

Ach ja: Die meisten Videos werden die lineare Regression voraussetzen. Falls Dir das noch nichts sagt, wirst Du etwas Zeit einplanen müssen, um diese Grundlage zu schaffen.

LG,
Bernhard

https://www.youtube.com/watch?v=yIYKR4sgzI8
https://www.youtube.com/watch?v=bUgpJeeReBY
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5917
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts

folgende User möchten sich bei bele bedanken:
Kabir

Re: Kaufwahrscheinlichkeit mit mehreren Merkmalen berechnen

Beitragvon PonderStibbons » Fr 5. Jun 2020, 23:35

Kabir hat geschrieben:Wie gewichte ich dann die einzelnen Kriterien und wie setze ich sie dann in eine Regressionsgleichung um die Wahrscheinlichkeit für den Kauf zu bestimmen?

Das Gewichten übenimmt die Software.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Kabir

Re: Kaufwahrscheinlichkeit mit mehreren Merkmalen berechnen

Beitragvon Kabir » Do 11. Jun 2020, 18:09

Danke Bernhard und danke PonderStibbons!

Ich habe mich in die ganze Thematik eingearbeitet und einige Stunden mit Recherche verbracht. Habe eine multiple binär logisitsche Regression mit SPSS gemacht. Die Vorhersage liegt bei ca 71%, was ganz gut ist. Jetzt würde ich gerne eine Formel formulieren, die mir hilft zu evaluieren ob ein neuer Kunde kauft oder nicht. Wie kann ich die aus SPSS herauslesen? Unter welchem Punkt finde ich das?

Würde es helfen wenn ich die Ausgabedatei hier teile? Könntet ihr mal drüberschauen?

LG
Kabir
Kabir
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 5. Jun 2020, 20:02
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Kaufwahrscheinlichkeit mit mehreren Merkmalen berechnen

Beitragvon strukturmarionette » Fr 12. Jun 2020, 09:20

Hi,

- was sind Quellen deiner langen Recherchen?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts


Re: Kaufwahrscheinlichkeit mit mehreren Merkmalen berechnen

Beitragvon PonderStibbons » Sa 13. Jun 2020, 10:39

Du hast eine Regressionsgleichung, welche die Struktur aufweist (Beispiel mit 2 Vorhersagegrößen):
Wahrscheinlichkeit für Kauf = Konstante + b1*Variable1 + b2*Variable 2 + Fehler.
Die Regressionsgewichte b1 und b2 hat Dir die Regressionsanalyse ermittelt.

Wenn nun beispielsweise Variable 1 für "Geschlecht" steht (0=männlich, 1=weiblich)
und Variable 2 für "Alter" und Du hast vorliegend eine 43jährige Frau, dann trägst Du in
die Gleichung für diesen bestimmten Fall für Variable1=1 und für Variable2=43 ein und
lässt es ausrechnen.

Es gibt in SPSS die Möglichkeit, die Ergebnisse einer Regressionsanalyse festzuhalten und
die oben skizzierte Rechnung für neue Fälle automatisiert durchzuführen. Wo das verortet
ist, weiß ich nicht auf Anhieb, müsste sich per Menues oder im Manual finden lassen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Kaufwahrscheinlichkeit mit mehreren Merkmalen berechnen

Beitragvon Kabir » Di 16. Jun 2020, 14:11

PonderStibbons hat geschrieben:Du hast eine Regressionsgleichung, welche die Struktur aufweist (Beispiel mit 2 Vorhersagegrößen):

Es gibt in SPSS die Möglichkeit, die Ergebnisse einer Regressionsanalyse festzuhalten und
die oben skizzierte Rechnung für neue Fälle automatisiert durchzuführen. Wo das verortet
ist, weiß ich nicht auf Anhieb, müsste sich per Menues oder im Manual finden lassen.


jap, habe ich gefunden. Unter Analysieren > binär logistische Regression > Speichern > Vorhergesagte Werte > Warscheinlichkeiten + Gruppenzugehörigkeiten
Da gibt SPSS das Ergebnis wieder, aber nicht die Formel.

Danke für die Formel. Bei den metrischen Variablen klappt das gut. Jetzt habe ich aber auch nominale Variablen, die ich als kategoriale Variablen (Indikator) in der Regression definiert habe. SPSS nimmt sich da aus den Kategorien immer eine Referenzkategorie, die aber dann in der Analyse keinen Koeffizienten aufweist. Jetzt stellt sich mir die Frage wie ich diese Referenzkategorie in die Formel mit einbaue und ob ich dann auch die anderen Kategorien der einzelnen kategorialen Variablen in Referenz zu der Referenzkategorie berechnen muss -> jedoch gibt es hier auch keine Konstante der Referenzkategorie.

Rat parat?

LG
Kabir
Kabir
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 5. Jun 2020, 20:02
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Nächste

Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 11 Gäste

cron