Hallo zusammen,
ich entschuldige mich im Vorhinein schon einmal für meine Unwissenheit und bedanke mich für eure Hilfe!
Im Rahmen meiner Seminararbeit soll ein Datensatz mit R analysiert werden (Autounfälle in GB 1969-84).
Ich bin mittlerweile bei der deduktiven Analyse angelangt, um folgende Hypothesen zu untersuchen:
H1: Die Höhe der gefahrenen Kilometer hat Einfluss auf die Anzahl der Todesfälle bzw. Verletzten.
H2: Die Sitzposition im Auto hat Einfluss auf die Anzahl der tödlich verunglückten und schwer verletzten Autofahrer (front seats, rear seats).
H3: Mit der Einführung der Sicherheitsgurtpflicht verringert sich die Anzahl der tödlich verunglückten und schwer verletzten Autofahrer.
Meine Idee wäre gewesen, H1 mittels eines Streudiagramms und Regressionslinie zu prüfen.
Hiernach hätte ich die Koeffizienz bestimmt un cor.test durchgeführt.
H2 hätte ich zunächst ein Liniendiragramm mit plot erstellt, um drei Kurven für Gesamtanzahl Killed drivers und jeweils eine für Killed Passagers Frontbereich und Killed Passengers Hinterer Bereich darzustellen.
Hiernach weiß ich für die Überprüfung leider nicht weier. Oder ist das der falsche Ansatz?
Um H3 zu analysieren, hätte ich den Datensatz aufgesplittet, nach Monaten, wo es ein Gesetz für Sicherheitsgurtpflicht gab (ab 1983) und wann nicht (1969-82).
Danach hätte ich die jeweiligen Standardabweichungen gebildet und ein Boxplot generiert. Und einen Shapiro-Test für die den P-Wert vorgenommen.
Wie würdet ihr bei der Analyse der Hypothesen vorgehen? Ich habe "Angst", bei der deduktiven Analyse schon zu viel vorweg zu nehmen, und bin mir unsicher, was dann bei der explorativen Analyse zu betrachten ist.
Vielen, vielen Dank für eure Unterstützung.
LG, Daelldra