Hallo Community,
ich bin leider nicht der beste Statist , dennoch meine Frage nach meinem besten erklärt:
In meiner Varianzanalyse wollte ich schauen, wie ein Motorrad von verschiedenen Variablen abhängt. Bspw. soll der Einfluss des Wertes des eines bestimmten Motorrades durch u.a. Laufleistung, Erstzulassung, PLZ-Gebiet und Farbe bestimmt werden - das Bild ist anbei.
Der F-Wert gibt den Einfluß der Variable wieder. Logischerweise liegt der größte Einfluß bei der Laufleistung.
_________________ Df________ Sum Sq ___________Mean Sq____________F value ________ Pr(>F)
DATA1$km________1 _________3.756e+09_________3.756e+09_________4316.909________< 2e-16 ***
DATA1$EZ _______11_________2.481e+07 ________2.255e+06__________2.592__________0.00326 **
DATA1$PLZ_______ 9 _________1.568e+07 ________1.743e+06_________ 2.003__________0.03715 *
DATA1$Farbe_____ 4 _________4.897e+06_________1.224e+06__________1.407_________ 0.23045
Doch was ist wenn man die Laufleistung aus der Analyse entfernt?
_________________ Df________Sum Sq____________Mean Sq__________F value________Pr(>F)
DATA1$EZ________11________ 1.273e+08 ________11568939 ________ 2.191 ________0.0136 *
DATA1$PLZ_______ 9_________2.188e+08 ________24312243 ________ 4.604 ________6.68e-06 ***
DATA1$Farbe______4 ________5.998e+07________ 14993860 ________ 2.839 ________ 0.0237 *
Wieso ändert sich nun die Rangfolge nach F, d.h. meine Frage ist wieso auf einmal das PLZ-Gebiet und die Farbe wichtiger als die EZ im Vergleich zur oberen Analyse sind?