ich bin noch immer bei meinem Projekt, aber bin schon etwas weiter gekommen. Jetzt hänge ich bei der Analyse der folgenden Hypothese fest:
H4:Menschen machen mehr Sport bei Beschäftigung auf Distanz, als bei Beschäftigung in Präsenz.
Dazu will ich die zwei Variablen
Sportliche Aktivität (sport_t1-t4; Häufigkeit pro Woche; ordinals) und
Arbeitsplatz (arbeitsplatz_t1-t4; Homeoffice oder nicht Homeoffice) vergleichen.
Es muss jedoch beachtet werden, dass ein Proband zu jedem Item Antworten zu 4 verschiedenen Zeiträumen (t1 bis t4) gegeben hat.
Welche Analyse macht hier Sinn?
- Code: Alles auswählen
> head
# A tibble: 6 x 8
sport_t1 sport_t2 sport_t3 sport_t4 arbeitsplatz_t1 arbeitsplatz_t2 arbeitsplatz_t3 arbeitsplatz_t4
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 2 2 2 2 1 1 1 1
2 4 2 4 4 0 1 1 1
3 4 2 4 2 0 1 1 1
4 2 4 2 3 0 1 1 1
5 3 2 2 2 0 1 0 1
6 2 3 2 0 0 1 1 1
> str
tibble [38 × 8] (S3: tbl_df/tbl/data.frame)
$ sport_t1 : num [1:38] 2 4 4 2 3 2 1 3 3 3 ...
$ sport_t2 : num [1:38] 2 2 2 4 2 3 0 1 2 2 ...
$ sport_t3 : num [1:38] 2 4 4 2 2 2 1 4 3 1 ...
$ sport_t4 : num [1:38] 2 4 2 3 2 0 0 1 2 0 ...
$ arbeitsplatz_t1: num [1:38] 1 0 0 0 0 0 1 0 0 0 ...
$ arbeitsplatz_t2: num [1:38] 1 1 1 1 1 1 1 1 1 1 ...
$ arbeitsplatz_t3: num [1:38] 1 1 1 1 0 1 1 0 1 1 ...
$ arbeitsplatz_t4: num [1:38] 1 1 1 1 1 1 1 1 0 1 ...