Logistische Regression für diese Problematik richtig?

Alle Verfahren der Regressionanalyse.

Logistische Regression für diese Problematik richtig?

Beitragvon Kula » Mi 29. Apr 2015, 10:29

Hallo an Alle :)

Ich sitzte derzeit an einem Problem welches mir großes Kopfzerbrechen bereitet.
Ich habe Wochentage an denen Bestellungen ausgelöst werden. Die Wochentage sind Mo-Fr, die Bestellungen sind mit 1 für erfolgte Bestellung am Tag X und 0 für nciht-erfolgte Bestellung am Tag X codiert.
Beispielhaft würde das dann so aussehen:

Tag Bestellung(1/0)
Mo 1
Di 1
Mi 1
Do 0
Fr 0

Insgesamt möchte ich später mit dem Modell vorhersagen, mit welcher Wahrscheinlichkeit (hier zB.) am nächsten Montag eine Bestellung ausgelöst wird (Sa und So werden ignoriert).

Mein Ansatz war jetzt eine log. Regression allerdings bekomme ich da ein Ergebnis, welches die vorhandenen Daten nur unzureichend beschreibt.
Meine Ahnung ist, dass es zu wenig exogene Variablen gibt um eine höhere Modellgüte zu erreichen.

Ich bin langsam echt am verzweifeln. Hat jemand eine bessere Idee für mich oder gar einen anderen Lösungsansatz?
Vielen, vielen Dank für eure Hilfe!
Kula
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mi 29. Apr 2015, 10:13
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression für diese Problematik richtig?

Beitragvon strukturmarionette » Mi 29. Apr 2015, 11:50

Hi,

Mein Ansatz war jetzt eine log. Regression allerdings bekomme ich da ein Ergebnis, welches die vorhandenen Daten nur unzureichend beschreibt.


- Was meinst du damit 'unzureichend'?

und:

Wie sezten sich die Rohdaten zusammen?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Logistische Regression für diese Problematik richtig?

Beitragvon Kula » Mi 29. Apr 2015, 12:36

Hallo,

mit unzureichend meine ich, dass mein Modell nur 56% der Daten richtig abgebildet hat.
Außerdem bekomme ich bei Nagelkerkes R² Werte von ~0,04 was ja ein Hinweis auf die unzureichende Qualität des Modells für die Daten ist.

Die Rohdaten sind wie beschrieben nur Wochentage (UV,ordinalskaliert, Mo-Fr) und Bestellungen (AV,binomiale Ausprägung 0/1). Ich habe Dummy-Variablen zu den einzelnen Wochentagen gebildet, da die ja ordinalskaliert sind und danach das Modell von SPSS lösen lassen.

vG
Kula
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mi 29. Apr 2015, 10:13
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression für diese Problematik richtig?

Beitragvon bele » Mi 29. Apr 2015, 12:43

Hallo Kula,

ohne den Hintergrund zu kennen leuchtet es nicht ein, warum die Wochentage ordinal skaliert sein sollten. Nehmen wir an, dass immer Montags und Freitags viel bestellt wird, in der Mitte der Woche aber nicht. Dann kann ein logistisches Modell das nicht gut abbilden. Eine einfache Grafik (Balkengrafik, noch besser Boxplots) mit den Wochentagen auf der x-Achse und den Bestellungen auf der y-Achse könnte erste Hinweise geben. Wenn da noch weitere Prädiktoren hinzu kommen, würde ich es mit nominal skalierten Wochentagen versuchen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Logistische Regression für diese Problematik richtig?

Beitragvon PonderStibbons » Mi 29. Apr 2015, 13:31

bele hat geschrieben: Eine einfache Grafik (Balkengrafik, noch besser Boxplots) mit den Wochentagen auf der x-Achse und den Bestellungen auf der y-Achse könnte erste Hinweise geben. Wenn da noch weitere Prädiktoren hinzu kommen, würde ich es mit nominal skalierten Wochentagen versuchen.

Ack.

Nebenbei kommt es mir vor, als würde mit Kanonen auf Spatzen geschossen.
Es gibt n Montage, n Dienstage etc., für jeden erfassten Tag ein binäres
outcome; das ist doch eine einfach 5 x 2-Kreuztabelle, und die Wahrscheinlichkeit,
dass an einem Montag bestellt wird (zwangsläufig auch der Prognosewert),
lässt sich unmittelbar ablesen. Oder kommen weitere Prädiktoren hinzu?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Logistische Regression für diese Problematik richtig?

Beitragvon Kula » Mi 29. Apr 2015, 14:02

Hallo,
danke für die Antworten!

PonderStibbons hat geschrieben:
bele hat geschrieben: Eine einfache Grafik (Balkengrafik, noch besser Boxplots) mit den Wochentagen auf der x-Achse und den Bestellungen auf der y-Achse könnte erste Hinweise geben. Wenn da noch weitere Prädiktoren hinzu kommen, würde ich es mit nominal skalierten Wochentagen versuchen.

Ack.

Nebenbei kommt es mir vor, als würde mit Kanonen auf Spatzen geschossen.
Es gibt n Montage, n Dienstage etc., für jeden erfassten Tag ein binäres
outcome; das ist doch eine einfach 5 x 2-Kreuztabelle, und die Wahrscheinlichkeit,
dass an einem Montag bestellt wird (zwangsläufig auch der Prognosewert),
lässt sich unmittelbar ablesen. Oder kommen weitere Prädiktoren hinzu?

Mit freundlichen Grüßen

P.


Ja das ist richtig. Zwangsläufig sind hier die rel. Häufigkeiten die Wahrscheinlichkeitswerte.

Die Frage ist, gibt es eine Möglichkeit ein noch genauere Vorhersage als die rel. Häufigkeiten zu bekommen oder scheitert dies an der rel. begrenzten Datengrundlage?
Kula
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mi 29. Apr 2015, 10:13
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression für diese Problematik richtig?

Beitragvon PonderStibbons » Mi 29. Apr 2015, 14:19

Die Frage ist, gibt es eine Möglichkeit ein noch genauere Vorhersage als die rel. Häufigkeiten zu bekommen oder scheitert dies an der rel. begrenzten Datengrundlage?

Ich weiß nicht, was Du mit "rel. begrenzte Datengrundlage" konkret meinst, daher
kann ich nicht beurteilen, ob und wieso daran etwas scheitert. Und was schwebt Dir
beim Ziel "genauere Vorhersage" in etwa vor?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Logistische Regression für diese Problematik richtig?

Beitragvon bele » Mi 29. Apr 2015, 14:27

Kula hat geschrieben:Die Frage ist, gibt es eine Möglichkeit ein noch genauere Vorhersage als die rel. Häufigkeiten zu bekommen oder scheitert dies an der rel. begrenzten Datengrundlage?


Hallo Kula,

Du hast noch nicht beantwortet, ob weitere Prädiktoren dazu kommen. Wenn nein und wenn die Annahme, dass Wochentage nominal und nicht ordinal einzubringen sind, sinnvoll ist, dann hast Du nicht mehr Informationen als in den Mittelwerten zum Ausdruck kommt. Wenn Du genauere Vorhersagen willst musst Du mehr Information einbringen. Mehr Information könnte in Form größerer Fallzahl oder weiterer Prädiktoren ins Spiel kommen. Erst bei mehr Prädiktoren macht Regressionsrechnung Sinn. Im Übrigen würde die lineare Regression mit nominalen-dummycodierten Wochentagen auch genau diese Mittelwerte ergeben.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste