Form der Variablen

Alle Verfahren der Regressionanalyse.

Form der Variablen

Beitragvon PPanzer » Mi 9. Jan 2019, 20:06

Hallo zusammen,

ich schreibe zurzeit eine Seminararbeit zum Thema Sportdisziplinen und multiplen Regressionsanalysen.
In der Disziplin Weitwurf habe ich mich zu folgender Regressionsanalyse entschieden:



Der Finalwurf ist also der bei der Meisterschaft erzielte letzte, bzw. höchste Wurf bei diesem Wettbewerb eines jeden teilnehmenden Sportlers. Die Sportler können in der Disziplin Weitwurf, über verschiedene Turniere "Bonus-Meter sammeln" für die finale Meisterschaft. Die Bonusmeter betragen ungefähr zwischen 0 und 7 Metern und werden zusätzlich auf den Finalwurf später angerechnet. Die Trainingswürfe können sehr stark schwanken von Sportler zu Sportler. Es werden hierbei alle gemachten Würfe im gesamten Beobachtungszeitraum außerhalb von Turnieren oder Wettbewerben addiert, sodass bei "fleißigen" Sportlern auch durchaus Werte über 30.000 Meter auftauchen und andere gerade einmal 1.000 Meter vorweisen können. Ob der Sportler einem Verein angehört oder nicht wird ebenfalls noch mit 0 oder 1 angegeben.

In dem Fall der oben aufgestellten Regressionsanalyse stelle ich mir nun die Frage, wie ich bei der Bestimmung der Form der jeweiligen Variablen vorgehen muss, also z.B. ob Variablen quadriert, logarithmiert oder die Wurzeln gezogen werden müssen.
Hierzu habe ich im ersten Schritt die Variablen "unangetastet" gelassen und die Regressionsanalyse durchgeführt. Wenn ich nun z.B. die Wurzel der Trainingswürfe verwende erhöht sich das R².
Kann ich hierdurch sagen, dass je höher mein R² ist, desto besser ist mein Regressionsmodell?
Oder gibt es andere Alternative um zu bestimmen, ob Variablen quadriert, logarithmiert, usw. werden sollten? Wie kann ich hier am Besten vorgehen?

Vielen Dank vorab!

Gruß PPanzer
PPanzer
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Mi 9. Jan 2019, 16:46
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Form der Variablen

Beitragvon strukturmarionette » Do 10. Jan 2019, 03:19

strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Form der Variablen

Beitragvon bele » Do 10. Jan 2019, 09:23

PPanzer hat geschrieben:Kann ich hierdurch sagen, dass je höher mein R² ist, desto besser ist mein Regressionsmodell?


Je höher Dein R^2, umso besser passt es zu den Daten, mit denen Du die Regression gefüttert hast. Ja. Das bedeutet leider nicht unbedingt, dass es für die Vorhersage an "neuen" Daten auch immer besser wird. Ein geeigneter Suchbegriff dafür wäre "Overfitting". Ein weiterer sinnvoller Suchbegriff wäre "Residuen Analyse". Insgesamt ist die Frage nach dem optimalen Modell alles andere als trivial, weshalb strukturmarionettes Verweis auf ein gutes Buch leider angemessen ist. Aber vielleicht hilft das ja soweit schon etwas.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

folgende User möchten sich bei bele bedanken:
PPanzer


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 10 Gäste