Hallo,
Wenn ich eine Große Datenmenge von ein zwei Millionen Datensätzen habe und darauf eine Multiple lineare Regression mit 10 Variablen berechne, macht es dann Sinn, sich noch das Residuum genauer anzuschauen? Ich habe gehört, dass bei großen Datensätzen eine Verteilungsanalyse schwierig ist.
Vielen Dank!