Hallo zusammen,
ich habe ein riesen Problem mit meiner Bachelorarbeit. Die Arbeit soll die Auswirkungen nicht sportlicher körperliche Aktivität (Gehen, Fahrradfahren, Gartenarbeit, Haushaltsarbeiten) auf die Gesundheit und die Mortalität hin untersuchen. Ich arbeite dafür mit einem Datensatz der LASA Studie (https://www.lasa-vu.nl/lasa-introduction.htm). Das ist eine Studie aus den Niederlanden, welche seit 1992 läuft und mit einer Kohorte (N=3107) gestartet ist. Alle 3 Jahren findet eine erneute Datenerhebung mit den selben Personen statt, es gibt natürlich Dropt-Outs und Personen die versterben. Nach exakt 10 Jahren (2002) kam eine zweite Kohorte mit (N=1002) hinzu. Es wurden die selben Messungen wie in den Jahren zuvor durchgeführt, sowohl mit der originalen Kohorte als auch mit der Neuen. Es gibt also insgesamt 7 Messzeitpunkte (B bis H), welche alle 3 Jahre auseinander liegen.
Ich möchte nun untersuchen, ob es einen Zusammenhang zwischen der körperliche Aktivität und der Sterblichkeit (Sterbealter) gibt. Dafür habe ich jeweils die Daten von Gehen/Minuten/Woche, Fahrradfahren/Min/W, Gartenarbeit/Min/W, leichte Haushaltstätigkeiten/Min/W und schwere Haushaltstätigkeiten/Min/W für die einzelnen Messzeitpunkte (B-H) in einer SPSS Datei zusammengetragen. Außerdem enthält die Datei die ID der Testpersonen, das Geschlecht und das Sterbealter.
Zunächst habe ich versucht über eine lineare Regression mit dem Sterbealter als abhängige und den Aktivitätsdaten (jeweils für die verschiedenen Messzeitpunkte) als unabhängige Variablen herauszufinden, ob ein Zusammenhang besteht. Leider habe ich wirklich sehr wenig Ahnung von deskriptiver Statistik und weiß nicht ob das was ich mache überhaupt zielführend ist, ich völlig auf dem Holzweg bin oder einige sehr wichtige Schritte vergessen habe.
Ich hoffe die Grundidee ist soweit verständlich, ich bin über jegliche Hilfe dankbar und vielleicht gibt es sogar eine nette Person die sich meines Problems annimmt und mir hilft.
Vielen Dank,
Luca