Zusammenhang 2 Variablen zeigen - Eine schwankt, eine nicht

Fragen, die sich auf kein spezielles Verfahren beziehen.

Zusammenhang 2 Variablen zeigen - Eine schwankt, eine nicht

Beitragvon Kaichen » Mi 11. Mai 2016, 12:04

Hallo zusammen,
ich wäre sehr dankbar über jede Hilfe. Ich suche eine statistische Methodik, die genau auf meinen Fall passt.

Und zwar habe ich zwei Variablen (Geschwindigkeit in ms und Kauf ja/nein). Es soll nun ein Zusammenhang nachgewiesen werden. Das Problem ist jedoch, dass eine normale Regression recht ungenau ist, da die Geschwindigkeit zwischen den Werten 2 und ca. 1500 schwanken kann wobei es bei Kauf nur die Werte 0 und 1 gibt. Wenn ich das Plotte bekomme ich zwei streifen, jeweils einen bei Kauf = 1 und einen bei Kauf = 0. Eine Regressionsgerade bzw. ein Koeffizient kann dies meiner Meinung nach nicht genau abbilden.

Jetzt meine Frage, hat jemand eine Idee, welches statistische Verfahren in Frage kommen kann um ein solche Problem zu untersuchen. Habe schon versucht etwas zu finden, jedoch ohne Erfolg.

Vielen Dank im voraus.

Beste Grüße,
Kai
Kaichen
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mi 11. Mai 2016, 11:47
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Zusammenhang 2 Variablen zeigen - Eine schwankt, eine ni

Beitragvon mango » Mi 11. Mai 2016, 12:11

Hallo,

die logistische Regression ist das richtige Verfahren dafür.
mango
Elite
Elite
 
Beiträge: 330
Registriert: Fr 2. Mai 2014, 16:55
Danke gegeben: 3
Danke bekommen: 55 mal in 55 Posts

Re: Zusammenhang 2 Variablen zeigen - Eine schwankt, eine ni

Beitragvon PonderStibbons » Mi 11. Mai 2016, 12:47

Und zwar habe ich zwei Variablen (Geschwindigkeit in ms und Kauf ja/nein). Es soll nun ein Zusammenhang nachgewiesen werden.

Worin besteht denn das Thema, was sind das konkret für Messungen, die vorgenommen wurden,
an was für einer Stichprobe, unter welchen Umständen, wie groß ist die Stichprobe (eminent
wichtige Angabe, immer).
Das Problem ist jedoch, dass eine normale Regression recht ungenau ist, da die Geschwindigkeit zwischen den Werten 2 und ca. 1500 schwanken kann wobei es bei Kauf nur die Werte 0 und 1 gibt. Wenn ich das Plotte bekomme ich zwei streifen, jeweils einen bei Kauf = 1 und einen bei Kauf = 0. Eine Regressionsgerade bzw. ein Koeffizient kann dies meiner Meinung nach nicht genau abbilden.

Du kannst die Parameter der Geschwindigkeit (Mittelwert, median, Standardabweichung, Interquartile Range)
zwischen den Gruppen Kauf und Nichtkauf vergleichen und gegebenenfalls einen passenden Test für einen
Mittelwertvergleich o.ä. rechnen.

Aber wie oben angedeutet, die Problembeschreibung ist noch unzureichend, man weiß nicht genau worum es
geht, da kann man erstmal nur herumraten.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Zusammenhang 2 Variablen zeigen - Eine schwankt, eine ni

Beitragvon Kaichen » Mi 11. Mai 2016, 13:04

Hey,
danke schonmal für die Antworten.

Hier noch einige zusätzliche Informationen:

Es geht darum, den Zusammenhang zwischen der Aufbaugeschwindigkeit einer Webseite mit dem anschließenden Kaufverhalten in Zusammenhang zu stellen. Die Frage ist, ob eine Verringerung der Aufbaugeschwindigkeit zu einer erhöhten Kaufrate führt. Die Messungen werden bei jedem Kunden der sich auf der entsprechenden Seite befindet durchgeführt in in einer Datenbank hinterlegt. Die Stichprobe beinhaltet ca. 6 Mio. Einträge. also 6 Mio. Nutzer der Webseite, die einen Seite öffnen.

Ich glaube die logistische Regression geht auf jeden Fall in die richtige Richtung, damit muss ich mich jetzt aber noch etwas mehr befassen. Aber auch ein Vergleich der Mittelwerte bzw. weiterer Parameter macht Sinn.
Aber wie gesagt, da ich Informatiker bin, muss ich mich damit etwas tiefer befassen.

Aber schonmal vielen Dank für eure Hilfe.

Gruß,

Kai
Kaichen
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mi 11. Mai 2016, 11:47
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Zusammenhang 2 Variablen zeigen - Eine schwankt, eine ni

Beitragvon PonderStibbons » Mi 11. Mai 2016, 14:00

Ich glaube die logistische Regression geht auf jeden Fall in die richtige Richtung, damit muss ich mich jetzt aber noch etwas mehr befassen. Aber auch ein Vergleich der Mittelwerte bzw. weiterer Parameter macht Sinn.

Angesichts der Datenmasse kannst Du auch die Aufbaugeschwindigkeiten in Quantile
aufteilen und für jedes Quantil die Kaufwahrscheinlichkeit abtragen.

Interessant wäre an einer logistischen Regression, dass sich dabei auch weitere, auf
das Kaufverhalten wirkende Merkmale einer Webseite simultan kontrollieren ließen.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Zusammenhang 2 Variablen zeigen - Eine schwankt, eine ni

Beitragvon Kaichen » Mi 11. Mai 2016, 16:36

Alles klar, dann werde ich das jetzt mal alles so versuchen.
Danke an alle.

Viele Grüße,

Kai
Kaichen
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mi 11. Mai 2016, 11:47
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: Google [Bot] und 1 Gast

cron