Hallo zusammen!
Ich möchte den Zusammenhang zwischen Kriminalität und der demographischen Altersstruktur in Regionen untersuchen und habe eine Frage, welche von 2 verschiedenen Spezifikationen zur Erfassung der Altersstruktur sinnvoller ist.
1) ln krm = alpha + beta1*ln age0-14 + beta2*ln age15-29 + beta3*ln age40-64 + beta4*ln age65-99 + beta5*lnX
Dabei ist krm die Anzahl der Delikte pro 1 Mio. Einwohner, und die Gruppen age jeweils die Anzahl der Einwohner in der jeweiligen Altersgruppe (0-14, 15-29, 40-64, 65-99), und X sind ein paar Kontrollvariablen. Alle Variablen sind logarithmiert.
Oder alternativ:
2) ln krm = alpha + beta1*(age15-29/age0-99) + beta2*(age40-64/age0-99) + beta3*(age65-99/age0-99) + beta4*lnX
Diese Spezifikation unterscheidet sich insofern, dass nun die prozentualen Anteile der Altersgruppen zur Gesamtbevölkerung erfasst werden (Anzahl Einwohner in Altersgruppe xy/Gesamtanzahl Einwohner), und der Logarithmus nun für die Altersgruppen weggelassen wird (da sie ja schon in Prozenten ausgedrückt werden). Um Multikollinearität zu umgehen, wird zudem die Altersgruppe 0-14 Jahre weggelassen.
Für beide Spezifikationen bekomme ich ähnliche Ergebnisse, wobei die Koeffizienten in der Spezifikation 1) deutlich signifikanter und ausgepägter sind. Welche Spezifikation ist eurer Ansicht nach zu präferieren, bzw. wie ändert sich die Aussage zwischen 1) und 2)? Insbesondere da, krm ja pro Mio. Einwohner gemessen wird.
Freue mich über euer Feedback!
VG Tobias