Die "Besucher" eines Online-Shops kommen über verschiedene "Kanäle", z.B. Newsletter, Google, Facebook und Werbeanzeigen.
Im Rahmen eines "Bestellvorganges" bestellen die Besucher nicht zwingend beim ersten "Besuch" der Website, sondern häufig erst zu einem späteren Zeitpunkt.
Einen Datensatz mit über 1000 Bestellungen möchte ich folgendermaßen analysieren:
Ich möchte übersichtlich darstellen, ob ein Kanal tendenziell eher am Anfang des Bestellvorganges auftaucht, in der Mitte oder am Ende.
Beispielsweise könnte der Erstkontakt tendenziell überdurchschnittlich häufig über Facebook zustande kommen.
Die Bestellvorgänge sind sehr unterschiedlich, d.h. manche Besucher kommen 20 Mal auf die Website über unterschiedliche Kanäle, bis sie schließlich bestellen (die letzte Zeile eines Bestellvorganges ist die Bestellung).
Andere hingegen bestellen beim 1. oder 2. Besuch.
- Code: Alles auswählen
Besucher Bestellvorgang Besuch Kanal
A 111 1 Facebook
A 111 2 Google
A 111 3 Werbeanzeige
A 111 4 Newsletter
B 112 1 Google
C 113 1 Facebook
C 113 2 Werbeanzeige
C 113 3 Newsletter
D 114 1 Newsletter
E 115 .... .....
In diesem kurzen Beispiel sieht man, dass der Erstkontakt in 50% der Bestellvorgänge (EDIT: über Facebook) entsteht. Allerdings sind diese unterschiedlich lang.
Im Vorgang 114 - mit dem Kanal Newsletter - ist der erste Besuch auch der letzte Besuch.
Meine Herausforderung ist es, die unterschiedliche Anzahl der Besuche im Rahmen eines Bestellvorganges zu berücksichtigen.
Hat jemand eine Idee, wie ich für einen großen Datensatz zeige, welcher Kanal tendenziell früh, in der Mitte oder spät im Bestellvorgang kommt?
Danke für eure Hilfe

Lisa
PS: Falls es hilft, ich arbeite mit R. Ich suche jedoch eher die "konzeptionelle Idee dahinter" als die Implementierung.