S: Beratung bei Auswahl des Statistikverfahrens

Fragen zur Planung einer Untersuchung oder eines Projekts.

S: Beratung bei Auswahl des Statistikverfahrens

Beitragvon unic0der » Fr 13. Mai 2016, 08:08

Liebe Forenmitglieder,

Habe hier eine Tabelle mit Daten aus einem Onlineshop und will diesen entsprechend optimieren. Dafür müsste ich aber zunächst die Daten analysieren.
Bild

Legende:
id: Bestellnummer
shipping_time: Zeitpunkt der Auslieferung
shipping_type: Zustellung oder Selbstabholung
branch_id: Filial-ID
customer_id: Kundennummer
created_at: Zeitpunkt der Bestellung
prod_X: Bestellmenge pro Produkt

Was mich interessieren würde:
• Hat die Saison Einfluss auf das Kaufverhalten (D.h. Gibt es in gewissen Monaten eine Präferenz zu gewissen Produkten)? Ich möchte diese Frage nur mit ja/nein beantworten können.
• Haben gewisse Stammkunden eine Affinität zu gewissen Produkten (D.h. Kann man aus der letzten Bestellung eines Stammkunden, erkennbar an der customer_id, voraussagen, dass er das nächste Mal wieder ähnliche Produkte bestellen wird)? Ich möchte diese Frage nur mit ja/nein beantworten können.

Welches bzw. welche Verfahren bringe ich hierzu am Besten zum Einsatz?
unic0der
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Fr 13. Mai 2016, 07:18
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: S: Beratung bei Auswahl des Statistikverfahrens

Beitragvon PonderStibbons » Fr 13. Mai 2016, 08:56

Sieht eventuell nach Kreuztabellen aus (Monat x Produktkategorie bzw. Stammkunde ja/nein x Produktkategorie).

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: S: Beratung bei Auswahl des Statistikverfahrens

Beitragvon unic0der » Sa 14. Mai 2016, 08:59

PonderStibbons hat geschrieben:Sieht eventuell nach Kreuztabellen aus (Monat x Produktkategorie bzw. Stammkunde ja/nein x Produktkategorie).
Mit freundlichen Grüßen
P.

Nope, denke das ist noch nicht ganz was ich suche. Ich hätte am Schluss zu jeder Frage gerne einen "Wert" der mir darüber Auskunft gibt ob es einen Zusammenhang gibt, oder nicht. Also z.B. dass am Schluss ein Korellationskoeffizent p steht (wie z.B. bei einer multiplen Regression). Ich sehe nicht wie ich das mit Kreuztabellen erreiche. :oops:
unic0der
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Fr 13. Mai 2016, 07:18
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: S: Beratung bei Auswahl des Statistikverfahrens

Beitragvon strukturmarionette » Sa 14. Mai 2016, 09:17

Hi,

Was mich interessieren würde:
• Hat die Saison Einfluss auf das Kaufverhalten (D.h. Gibt es in gewissen Monaten eine Präferenz zu gewissen Produkten)? Ich möchte diese Frage nur mit ja/nein beantworten können.
• Haben gewisse Stammkunden eine Affinität zu gewissen Produkten (D.h. Kann man aus der letzten Bestellung eines Stammkunden, erkennbar an der customer_id, voraussagen, dass er das nächste Mal wieder ähnliche Produkte bestellen wird)? Ich möchte diese Frage nur mit ja/nein beantworten können.

Beides geht nicht:
Einerseits steht in den Sternen, was unter 'Saison' 'gewisse Monate' zu verstehen ist, andererseits fehlt so etwas wie eine Produktkategorievariable bzw Spezifizierung dessen, was das sein soll.

Somit ist zunächst noch einiges an Vorüberlegungen, Vorarbeiten, Datenaufbereitungen erforderlich.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4354
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 587 mal in 584 Posts

Re: S: Beratung bei Auswahl des Statistikverfahrens

Beitragvon unic0der » Sa 14. Mai 2016, 13:52

xx
Zuletzt geändert von unic0der am Sa 14. Mai 2016, 13:56, insgesamt 1-mal geändert.
unic0der
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Fr 13. Mai 2016, 07:18
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: S: Beratung bei Auswahl des Statistikverfahrens

Beitragvon unic0der » Sa 14. Mai 2016, 13:53

strukturmarionette hat geschrieben:Beides geht nicht:
Einerseits steht in den Sternen, was unter 'Saison' 'gewisse Monate' zu verstehen ist,

Es gibt ja die Spalte created_at (= Datum): Hier kann man einfach herauslesen welche Bestellung in welchem Monat getätigt wurde.
Ich will wissen ... gibt es Unterschiede im Bestellverhalten zwischen Januar, Februar, März, April, Mai, Juni, Juli, younameit ...
Antwort: Ja/Nein.

strukturmarionette hat geschrieben:andererseits fehlt so etwas wie eine Produktkategorievariable bzw Spezifizierung dessen, was das sein soll.

Ebenfalls vorhanden. Siehe die Spalten prod2, prod3, bis prodX in der Tablelle. Natürlich könnte ich sie auch Bananen, Äpfel und Birnen benennen. Ändert aber nichts am Grundprinzip.

strukturmarionette hat geschrieben:Somit ist zunächst noch einiges an Vorüberlegungen, Vorarbeiten, Datenaufbereitungen erforderlich.
Gruß
S.

Ehrlich ... ich bin ratlos. Aus meiner Sicht sind alle Daten da. Ich bin aber kein Statistik-Experte - geschweige denn ein Anfänger.
unic0der
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Fr 13. Mai 2016, 07:18
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: S: Beratung bei Auswahl des Statistikverfahrens

Beitragvon strukturmarionette » Sa 14. Mai 2016, 19:20

Hi,

Aus meiner Sicht sind alle Daten da.

- ich will Dir dann keinesfalls widersprechen, so dass Du meine Hinweise als Nebensache betrachten kannst
- eingehende konkrete Tipps für mögliche Auswertungsprocederes hatte ja bereits PonderS gemacht, auf die ich nochmals verweise

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4354
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 587 mal in 584 Posts

Re: S: Beratung bei Auswahl des Statistikverfahrens

Beitragvon bele » Sa 14. Mai 2016, 23:26

Hallo unic0der,

ein schlauer Mann hat man gesagt, die Vierfeldertafel sei die zweitwichtigste Erfundung der Menschheit nach dem Rad. Mag sein.

unic0der hat geschrieben:Nope, denke das ist noch nicht ganz was ich suche. Ich hätte am Schluss zu jeder Frage gerne einen "Wert" der mir darüber Auskunft gibt ob es einen Zusammenhang gibt, oder nicht.


Stell Dir PonderStibbons einfach als einen großen Ozean der Weisheit vor und immer wenn der Ozean Kreuztabelle denkt, dann singen ein paar Wellen "Chiquadrat-Unabhängigkeitstest", einige Küsten rufen "odds ratio" und irgendwo in der Tiefe singen ein paar Waale "Fisher-Test". Beschäftige Dich mit dem Ökosystem rund um Kreuztabellen und dann verstehst Du die Antwort in aller Umfänglichkeit.

Möge Google mit Dir sein,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5925
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

folgende User möchten sich bei bele bedanken:
unic0der

Re: S: Beratung bei Auswahl des Statistikverfahrens

Beitragvon unic0der » So 15. Mai 2016, 08:47

bele hat geschrieben:Stell Dir PonderStibbons einfach als einen großen Ozean der Weisheit vor und immer wenn der Ozean Kreuztabelle denkt, dann singen ein paar Wellen "Chiquadrat-Unabhängigkeitstest", einige Küsten rufen "odds ratio" und irgendwo in der Tiefe singen ein paar Waale "Fisher-Test". Beschäftige Dich mit dem Ökosystem rund um Kreuztabellen und dann verstehst Du die Antwort in aller Umfänglichkeit.


Danke, mit diesem zusätzlichen Hinweis gehts jetzt in die richtige Richtung ... Zu Frage 1 ... Geht nun die Datenaufbereitung in die richtige Richtung?
->
Bild

Ansatz zu Frage 2. Wobei ich mich frage ob es einen schlaueren Weg gibt die Daten aufzubereiten, um nur einen Chi-Quadrat-Test machen zu müssen.
->
Bild
unic0der
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Fr 13. Mai 2016, 07:18
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: S: Beratung bei Auswahl des Statistikverfahrens

Beitragvon strukturmarionette » So 15. Mai 2016, 10:30

Hi,

na ja.
Irgendwelche nachvollziehbaren sinnvollen Produktkategorienbildungen passend zur Fragestellung sind nicht erfolgt.
Auch bleibt die dargestellte Vorgehensweise zur Beantwortung Deiner zweiten Hypothese (Voraussage von Käufen) vage.
Es scheint aber so zu sein, dass Du wegen Deiner offenbar sehr großen Stichprobe auch 'elegantere' Verfahren als den Chi²Test auf Unabhängigkeit zweier kategorialer Variaben anwenden könntest.
(ggfs Logit-, Probit Modelle)

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4354
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 587 mal in 584 Posts

folgende User möchten sich bei strukturmarionette bedanken:
unic0der

Nächste

Zurück zu Versuchsplanung

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 7 Gäste

cron