Hallo Zusammen,
ich habe eine Frage zu einer Regressionsanalyse:
ich habe einen gepoolten Querschnittsdatensatz mit einer hohen anzahl an beobachtungen (ca. 20.000). Allerdings sind einige beobachtungen nicht unabhängig voneinander, da sie von insgesamt 10.000 verschiedenen individuen stammen. das heißt also ein individuum ist mehrmals in dem datensatz vertreten. diese beobachtungen eines individuums sind für mein verständnis nicht unabhängig voneinander und können somit zu verzerrungen meiner koeffizienten führen. habe ich das richtig verstanden?
wie kann ich dieses problem lösen?
vielen Dank!