Hallo zusammen,
ich schreibe gerade meine MA und untersuche den Zusammenhang von Wetter und Tourismus, indem ich eine Multiple Regression durchführe.
Als abhängige Variable habe ich Zahlen zu Teilnehmer an Gästeführungen (also metrisch skaliert) pro Tag über die Jahre 2015-2019.
Als unabhängige Variablen habe ich die folgenden:
- Hitzetage (dummy-codiert -> 0 = der Tag ist kein Hitzetag, 1= der Tag ist ein Hitzetag)
- Veranstaltungen (dummy-codiert -> 0 = der Tag hat keine Veranstaltung, 1= der Tag hat eine Veranstaltung)
- Ferien und Feierttage (dummy-codiert -> 0 = der Tag ist kein Ferien/Feiertag, 1= der Tag ist ein Ferien/Feiertag)
- Typische Einkaufstag (Ordinal -> 1= Sonntag (schlecht), 2 = Dienstag/Mittwoch ... 6= Samstag (sehr gut))
Die Variablen Veranstaltungen und Ferien/Feiertage habe ich ebenfalls in metrischer Form, also wie viele Veranstaltungen an dem Tag stattfinden und wie viele Bundesländer an dem Tag Ferien/Feiertag haben.
Nun zu meinen Fragen:
1. Sollte ich die unabhängigen Variablen Veranstaltungen und Ferien/Feiertage lieber in metrischer oder als Dummy-Variable verwenden?
(Ferien/Feiertage in metrischer Form statt Dummy-Variable führt zu höherem r squared bei Multipler Regression; bei Veranstaltungen ist es genau andersrum)
2. Habe ich ein Problem in meiner Multiplen Regression, wenn meine Einkaufstage ordinal skaliert sind?
(Dachte eig, dass unterschiedliche Skalenniveaus bei der MR kein Problem sind aber habe auch gelesen, dass ordinalskalierte Daten eher als Dummy-Variable verwendet werden sollen.)
3. Benötige ich in R die scale Funktion für meine Multiple Regression?
Ich würde mich sehr freuen, wenn mir jemand helfen könnte.
Viele Grüße