Hallo zusammen,
ich möchte für die Uni eine große Menge an Daten der letzten Jahre analysieren (> 200.000 Fälle, 1 AV, ca 10 UV wovon 3 Dummys sind), um darauf aufbauend Prognosen machen zu können. Dafür verwende ich die multiple lineare Regression, da diese Methodik vorgegeben ist. Nun ist es so, dass eben alle Daten komplett vorliegen, außer eventuelle einzelne Fälle die aus irgendeinem Grund nicht aufgezeichnet oder falsch eingeben wurden. Die Fälle wurden zwar über die letzten Jahre gesammelt, theoretisch und anhand einer ersten deskriptiven Auswertung hat die Zeit aber keinerlei Einfluss auf die Ergbnisse.
Nun frage ich mich, ob ich mein Vorgehen als Vollerhebung von Querschnittdaten bezeichnen kann und (falls ja) welche Besonderheiten ich 1. bei so vielen Daten und 2. bei einer Vollerhebung beachten muss.
Vielen Dank schonmal!
LG