Hallo zusammen,
ich schreibe zurzeit eine Seminararbeit zum Thema Sportdisziplinen und multiplen Regressionsanalysen.
In der Disziplin Weitwurf habe ich mich zu folgender Regressionsanalyse entschieden:
Der Finalwurf ist also der bei der Meisterschaft erzielte letzte, bzw. höchste Wurf bei diesem Wettbewerb eines jeden teilnehmenden Sportlers. Die Sportler können in der Disziplin Weitwurf, über verschiedene Turniere "Bonus-Meter sammeln" für die finale Meisterschaft. Die Bonusmeter betragen ungefähr zwischen 0 und 7 Metern und werden zusätzlich auf den Finalwurf später angerechnet. Die Trainingswürfe können sehr stark schwanken von Sportler zu Sportler. Es werden hierbei alle gemachten Würfe im gesamten Beobachtungszeitraum außerhalb von Turnieren oder Wettbewerben addiert, sodass bei "fleißigen" Sportlern auch durchaus Werte über 30.000 Meter auftauchen und andere gerade einmal 1.000 Meter vorweisen können. Ob der Sportler einem Verein angehört oder nicht wird ebenfalls noch mit 0 oder 1 angegeben.
In dem Fall der oben aufgestellten Regressionsanalyse stelle ich mir nun die Frage, wie ich bei der Bestimmung der Form der jeweiligen Variablen vorgehen muss, also z.B. ob Variablen quadriert, logarithmiert oder die Wurzeln gezogen werden müssen.
Hierzu habe ich im ersten Schritt die Variablen "unangetastet" gelassen und die Regressionsanalyse durchgeführt. Wenn ich nun z.B. die Wurzel der Trainingswürfe verwende erhöht sich das R².
Kann ich hierdurch sagen, dass je höher mein R² ist, desto besser ist mein Regressionsmodell?
Oder gibt es andere Alternative um zu bestimmen, ob Variablen quadriert, logarithmiert, usw. werden sollten? Wie kann ich hier am Besten vorgehen?
Vielen Dank vorab!
Gruß PPanzer