Geeignete Methoden zur Datennormalisierung

Fragen, die sich auf kein spezielles Verfahren beziehen.

Geeignete Methoden zur Datennormalisierung

Beitragvon flooow » Mo 7. Mai 2018, 11:40

Hallo,

im Zuge meiner Masterarbeit beschäftige ich mich mit der computergestützten Analyse von Verkaufsdaten.
Die vorhandenen Datensätze liefern mir Informationen, welches Produkt von welchem Händler an welchem Tag in welcher Häufigkeit verkauft wurde.

Zum Einstieg in meine Analyse, habe ich mich entschieden eine Anomalie-Erkennung zu implementieren. Aktuell gehe ich dazu folgendermaßen vor:
Ich filtere das Produkt heraus, welches ich analysieren möchte und gruppiere sie nach den einelnen Händlern, von welchen die Daten kommen.

Zur Erkennung der Anomalien habe ich zwei Methoden implementiert:

1) Eine Anomalie ist gegeben, wenn der Wert größer als der Durchschnitt + Standardabweichung * Faktor ist (oder kleiner, äquivalent mit Substraktion)
Der Durchschnitt wird immer in einem (rollenden) Fenster von X Werten berechnet, die Fenstergröße und der Faktor kann selbst gewählt werden.

2) Ist identisch zu 1), nur dass bei Standardabweichung ebenfalls nur das angegebene Fenster berücksichtigt wird, nicht wie in 1) die gesamte Datenmenge (des entsprechenden Händlers).

Anfangs habe ich als grundlegenden Wert für die Berechnungen die Anzahl der Verkäufe genommen. Da diese jedoch sehr abhängig von den einzelnen Händlern sind, habe ich die Änderungsrate berechnet und dem Datensatz hinzugefügt. (Also Änderung der Verkäufeanzahl in % zum vorhergehenden Tag).

Zufrieden bin ich mit den Resultaten aber immer noch nicht ganz. Wenn über mehrere Tage nur jeweils ein Stück verkauft wurde, dann aber auch mal für ein paar Tage 2, dann würde ich das eher als Zufall interpretieren, auch wenn die Änderung bei +100% liegt. Wenn die Verkaufszahlen von 100 auf 200 ansteigen, dann ist das sicher aussagekräftiger.
Ich suche daher nach Lösungsansätzen um eine gewisse Gewichtung in die Datennormalisierung zu bekommen (oder natürlich jede andere Lösungsidee).
Ihr müsst mir das hier natürlich nicht im Detail erklären. Ein paar Stichwörter oder Links wären aber klasse :-).

Beste Grüße,
flooow
flooow
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mo 7. Mai 2018, 11:10
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Geeignete Methoden zur Datennormalisierung

Beitragvon PonderStibbons » Mo 7. Mai 2018, 11:48

Zum Einstieg in meine Analyse, habe ich mich entschieden eine Anomalie-Erkennung zu implementieren.

Wie definiert sich "Anomalie", und warum und zu welchem Zweck musst Du sie erkennen?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Geeignete Methoden zur Datennormalisierung

Beitragvon flooow » Mo 7. Mai 2018, 11:55

Anomalien sind in diesem Kontext plötzliche und kurzfristige Änderungen im Verkaufsverhalten (also eine plötzlich deutlich mehr oder weniger Verkäufe).
Die Anomalien möchte später auf Muster vergleichen (mit anderen Produkten) und ob es dort ähnliche Produkteigenschaften gibt.

Desweiteren kann ich durch eine solche Erkennung Rückschlüsse ziehen, ob Preisaktionen und/ oder Marketingaktionen erfolgreich sind bzw. notwendig sein könnten.
flooow
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mo 7. Mai 2018, 11:10
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Geeignete Methoden zur Datennormalisierung

Beitragvon PonderStibbons » Mo 7. Mai 2018, 14:44

Aus welchen Gründen bist Du nicht bei der Regel geblieben, einen Tages-Wert dann als Anomalie anzusehen, wenn er außerhalb des händlerspezifischen Bereichs Mittelwert +/- (Konstante * Standardabweichung) liegt und hast stattdessen die Änderungsrate verwendet?

Kommen auch Vorhersagemodelle in Frage, d.h. für einen gegebenen Tag wird der Verkauf aus den vorhergehenden Zeiträumen vorhergesagt, gegebebenfalls unter Einbezug von Saisoneinflüssen oder Produktlebenszyklen? Eine Anomalie wäre dann gegeben, wenn der tatsächliche Verkauf davon markant abweicht.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Geeignete Methoden zur Datennormalisierung

Beitragvon flooow » Di 15. Mai 2018, 07:45

Hallo und sorry für die späte Rückmeldung.
Vorhersagemodelle sind für den späteren Verlauf meiner Arbeit tatsächlich noch in Planung.
Vorerst gebe ich dir aber Recht. Nach längerem Überlegen scheint mir die prozentuale Abweichung mehr Probleme zu schaffen. Ich bleibe bei den absoluten Mittelwerten.

Beste Grüße,
Florian
flooow
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mo 7. Mai 2018, 11:10
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 28 Gäste