Zunächst muss zwischen dem theoretischen Fehler (meist
, kann aber auch e sein) und den empirischen Residuen (meist e oder
) unterschieden werden.
Die empirischen Residuen sind schlicht die (tatsächlich berechenbaren) Abweichungen der vorhergesagten Werten von den beobachteten Werten.
Für die theoretischen Fehler wird eine (Normal)Verteilung mit Mittelwert 0 und Varianz
angenommen. Sind diese Annahmen verletzt, kommt es zu Verzerrungen bei der Schätzung der Koeffizienten und/oder Standardfehler.
Interessenat wird das
bei der "soziologischen" Herleitung (oder der "light" Variante der Herleitung) des binär logisitischen Modells (etwa hier:
http://www.uni-bamberg.de/fileadmin/uni ... g-BBES.pdf). Dort verschwindet der Fehler nämlich in der Tat auf wundersame Art und Weise (die mir auch noch niemand plausibel erklären konnte) und es ist de facto unmöglich das (eigentlich identische) probit Modell auf diese Weise herzuleiten.
Du stellst hier eine wichtige Frage. Versuch die Antwort zu verinnerlichen, und merk Dir einfach schon mal vorab, dass die Annahmen über den Fehler den Hauptunterschied zwischen vielen Regressionsmodellen ausmacht.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.