PonderStibbons hat geschrieben:Warum kann eine große Lücke zwischen Vorhersage eines Falles und dessen tatsächlichem Wert nicht sein? Wenn das Modell insgesamt nicht sehr vothersagefähig ist (abzulesen an der Varianzaufklärung, d.h. einem niedrigen Rquadrat) kann das allemal vorkommen. „Discuss the limits“ hieß es doch in der Aufgabe, und wie das Modell verbessert werden kann.
Letzteres geht unter anderem, indem einem eine oder mehrere wichtige Prädiktoren einfallen, die für eine verbesserte Vorhersage sorgen könnten. Sowas müsste sich in der Literatur zum Thema Marktwertermittlung eigentlich finden lassen. Vielleicht gibt es zudem auch nicht-lineare Beziehungen (sowas wie Alter im Quadrat als Einflussgröße). Außerdem sind Geldgeschichten oft sehr schief verteilt und die Vorhersage ist dann in manchen Bereichen, z.B den höheren Werten, extrem schlecht. Man könnte in einem X-Y-Streudiagramm die predicted values den tatsächlichen gegenüberstellen, vielleicht erkennt man da Bereiche, in denen die Abweichung besonders groß ist. Aber das ist von hieraus nur spekulativ.
Der Einfluss einer Variable lässt sich unter anderem an dessen standardisierten Regressionsgewicht Beta ersehen. Wie Du schon sagst, je weiter von 0 entfernt, desto gewichtiger.
Statistische Signifikanz kann man in SPSS normalerweise in den Spalten mit dem Titel „sig“. Konventionell nimmt man an, dass ein Sig-Wert kleiner als 0,05 dafür spricht, dass der Einfluss einer Variable überzufällig ist.
Mit freundlichen Grüßen
PonderStibbons
Danke!
Irgendwie komme ich dennoch nicht wirklich weiter.
In aufgabe drei wird gefragt welche independent variables statistisch significant sind?
Ich weiß einfach wie ich das testen kann. Wenn ich eine Correlation laufen lasse, sehe ich welche welche 2 variablen korrelieren und dann sehe ob die Korrelation significant ist. Also überhaupt nicht das was ich brauche. Wenn ich eine Regression laufe lasse über das data set. Sehe ich von lediglich 2 die einen pvalue von <0,05 haben. und vor Allem die von denen ich dachte sind nicht dabei.
Ich weiß nicht über welches statistische Verfahren ich sehen kann welche independent variablen statistisch signifikant sind.... grrr
sofern ich das herausfinde kann ich versuche diese independent zu nehmen und damit mit linearer regression den Marktwert predicten/berechnen. Aber hier hakt es an allen ecken und enden.
Nochmals die Aufgabenstellung:
1)Identify the continuous, binary, and categorical variables. Convert the data so that all values to be analyzed are numeric (Display a sample 10 observations in your submission).
2)Determine whether any of the predictor variables are significantly correlated to each other.
3)Which independent variables are statistically significant?
4)Evaluate the model. Choose an offensive soccer player in a top European league (e.g., the Premier League, the La Liga, Serie A etc.) and compute his predicted market value using the regression model.
5)Discuss the limitations of the model and how the model can be improved.
Bin um jeden Rat dankbar.
Grüße