abhängige Variable mit 4 Ausprägungen

Alle Verfahren der Regressionanalyse.

abhängige Variable mit 4 Ausprägungen

Beitragvon Casual » Di 19. Mai 2015, 19:08

Hallo,

ich möchte eine multiple lineare Regression machen, allerdings hat meine abhängige y Variable lediglich 4 Ausprägungsmöglichkeiten. Sie kann die Werte 1, 2, 3 oder 4 annehmen. Die Werte sind dabei metrisch-diskret.
Meine Frage: Macht eine solche Regression bei einer abhängigen Variablen mit lediglich vier Ausprägungen überhaupt Sinn ? Wenn ja, gibt es Besonderheiten auf die ich zu achten habe ?

Beispiel:
Ich betrachte ein Fußballturnier und möchte schauen, inwiefern bestimmte Parameter wie Ballbesitz in %, Anzahl an Eckbällen, Anzahl an Toren, Anzahl roter Karten etc. einen Einfluss auf meinen Erfolg beim Turnier haben. Für den Erfolg beim Turnier möchte ich die erreichte Rundenanzahl im Turnier als Proxy verwenden. Meine abhängigen Variablen wären also die obigen Parameter und die unabhängige Variable ist die erreichte Rundenanzahl (Ausprägung 1 = 1. Runde erreicht, Ausprägung 2 = 2. Runde erreicht, Ausprägung 3 = 3. Runde erreicht, Ausprägung 4 = 4. Runde erreicht).

Vielen dank im Voraus für eure Hilfe:)
Casual
Mitglied
Mitglied
 
Beiträge: 24
Registriert: Fr 28. Dez 2012, 13:43
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: abhängige Variable mit 4 Ausprägungen

Beitragvon DHA3000 » Di 19. Mai 2015, 19:28

Google mal "Mulinomial logistic regression"!
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

Re: abhängige Variable mit 4 Ausprägungen

Beitragvon Casual » Di 19. Mai 2015, 23:11

Meine abhängige Variable ist metrisch-diskret skaliert. Ist das multinomiale Modell dann wirklich geeignet?
Casual
Mitglied
Mitglied
 
Beiträge: 24
Registriert: Fr 28. Dez 2012, 13:43
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: abhängige Variable mit 4 Ausprägungen

Beitragvon bele » Mi 20. Mai 2015, 08:34

Ja, Deine Daten sind metrisch, aber was bringt das, wenn eine "normale" lineare Regression in die Irre geführt wird? Nehmen wir an, Du hast einen Datensatz, bei dem alles stimmt - alle positiven Voraussetzungen sind erfüllt und trotzdem erreicht die Mannschaft nur die vierte und nicht die sechste Runde. Dann sieht die lineare Regression hier ein großes Residuum und versucht die Parameter so zu verändern, dass auch tolle Ausgangswerte nur zu Runde vier und nicht zu Runde sechs werden. Einem logistischen Modell wäre das egal. Eine ordinale logistische Regression könnte daher vorteilhaft sein. Letztlich ist es ok, beides auszuprobieren, aber ich tippe auf ein ordinales logistisches Modell.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1398 mal in 1384 Posts

Re: abhängige Variable mit 4 Ausprägungen

Beitragvon PonderStibbons » Mi 20. Mai 2015, 09:44

Ich betrachte ein Fußballturnier und möchte schauen, inwiefern bestimmte Parameter wie Ballbesitz in %, Anzahl an Eckbällen, Anzahl an Toren, Anzahl roter Karten etc. einen Einfluss auf meinen Erfolg beim Turnier haben. Für den Erfolg beim Turnier möchte ich die erreichte Rundenanzahl im Turnier als Proxy verwenden.

Das ist doch so einfach gar nicht möglich. Die Parameter werden in den späteren Runden
durchdie Qualität des Gegners mitbestimmt, diese wird im Verlauf höher, ergo erzeugen
nicht nur die Prädiktoren den Erfolg, sondern der Erfolg beeinflusst die Ausprägung
der Prädiktoren. Und wie berücksichtigst, Du, dass dieselbe Mannschaft mit mehreren
Spielen in den Datensatz eingehen kann? Oder ist das lediglich unscharf ausgedrückt, und
es ist gemeint: bestimmte Parameter im ersten Spiel werden zur Vorhersage der
Rundenzahl herangezogen?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: abhängige Variable mit 4 Ausprägungen

Beitragvon DHA3000 » Mi 20. Mai 2015, 11:04

Casual hat geschrieben:Meine abhängige Variable ist metrisch-diskret skaliert. Ist das multinomiale Modell dann wirklich geeignet?


Na, deine Variable kann 1,2,3,4 annehmen. Allerdings nicht als ordered probit, sonst vergleichst du zu einer festen Basiskategorie.

@PonderStibbons:
Doch, das müsste gehen, wenn ich mir nur den Ballbesitz, Eckbälle, usw. in der spezifischen Ausprägung anschaue, oder? Denn ich vergleiche ja dann
zwei Kathegorien miteinander. Dann könnte ich darüber und über die Interaktion mit "Sieg" als Dummy herausfinden, ob dies die Coefficienten zu einer Verbesserung beigetragen haben.

Allerdings würde dies dann auch den Vergleich Vorrunde/Finale beinhalten. Vielleicht einem mehrstufigen conditional logit/probit. Aber da habe ich keinerlei Anwendungserfahrung.
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

Re: abhängige Variable mit 4 Ausprägungen

Beitragvon Casual » Mi 20. Mai 2015, 12:48

@ PonderStibbons: Stimmt, dass die Stärke des Gegners mit fortschreitender Rundenzahl zunimmt, hätte ich nicht bedacht. Angenommen in den ersten zwei Runden verändert sich die Gegnerstärke nicht, so könnte ich doch Durchschnittswerte aus den ersten beiden Runden verwenden und diese nutzen, um eine Vorhersage über die letztendlich erreichte Rundenanzahl zu machen? Ist das valide?

Darüber hinaus: Welches Modell wäre nun das Passende, wenn meine abhängige Variable lediglich vier Ausprägungen hat ? (Ich habe nicht komplett jedes Detail eurer Antworten verstanden. Ist ein logit-Modell nun richtig oder doch linear?)
Ich bin gerade dabei mich in das Thema Regression einzuarbeiten, daher verzeiht mir bitte gewisse Unwissenheit)
Zuletzt geändert von Casual am Mi 20. Mai 2015, 13:33, insgesamt 1-mal geändert.
Casual
Mitglied
Mitglied
 
Beiträge: 24
Registriert: Fr 28. Dez 2012, 13:43
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: abhängige Variable mit 4 Ausprägungen

Beitragvon Casual » Mi 20. Mai 2015, 12:53

Allerdings hätte ich dann nicht betrachtet, wie sich die Prädiktoren Verhalten wenn ausschließ die besten Mannschaften aufeinandertreffen ( spätere Runden des Turnieres )
Casual
Mitglied
Mitglied
 
Beiträge: 24
Registriert: Fr 28. Dez 2012, 13:43
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: abhängige Variable mit 4 Ausprägungen

Beitragvon PonderStibbons » Mi 20. Mai 2015, 13:35

Ich verstehe das mit der Rundenzahl leider nicht, sinnvoll wäre doch die Vorhersage des
Erfolges in jeweils 1 Spiel (wobei im Fussball meines Wissens die Zahl der Torchancen
der beste Leistungsindikator ist). Vielleicht wäre auch eher ein Design für abhängige
Messungen geeignet: in jedem Spiel der ersten Runde treffen je 2 Mannschaften
aufeinander, man kann über alle Spiele hinweg untersuchen, welche Leistungsparameter
den Gewinner versus Verlierer tatsächlich unterscheiden.

Nebenbei würde ich annehmen, dass in den Sprtwissenschaften, mindestens die in
den USA, solche Fragen für Mannschaftssprotarten bereits bearbeitet wurden, da
sollte es doch eigentlich Hinweise geben, wie man bei sowas am besten vorgeht.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: abhängige Variable mit 4 Ausprägungen

Beitragvon Casual » Mi 20. Mai 2015, 14:27

Hallo,
ich habe leider nur die erreichte Rundenzahl als Daten vorliegen. Deswegen möchte ich diese als Erfolgsvariable verwenden. Eine Mannschaft, die die 4. Runde erreicht hat, soll daher als erfolgreicher angesehen werden, als eine Mannschaft, die nur die 3. Runde erreicht hat.
Da es nur 4 Runden gibt, hat meine metrisch-diskrete abhängige Variable nur vier Ausprägungen.
Unter diesen Umständen: Wäre hier ein lineares Modell oder ein ordinales Logit Modell oder noch etwas anderes geeignet?

Danke:)
Casual
Mitglied
Mitglied
 
Beiträge: 24
Registriert: Fr 28. Dez 2012, 13:43
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Nächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste

cron