Die eigentliche Frage von mir ist, ob man das überhaupt so in das Modell reinnehmen und dann auch interpretieren kann?
Theoretisch oder praktisch? Klar kann man das theoretisch interpretieren -- es wird nur irgendwann relativ kompliziert. Da hilft vieleicht eine Grafik oder so weiter. Praktisch ist die Frage nur von Dir zu beantworten. Schätz das Modell und schau mal, ob dabei was rumkommt. Das Problem wird aller Vorraussicht nach sein, dass Dir die Standradfehler explodieren werden. Das ist evtl. der Hintergrund der Idee, sich die Korrelationsmatrix anzuschauen. Ich halte das für wenig hilfreich, weil
Multikollinearität sich nicht unbedingt in bivariaten Korrelationen ausdrückt.
In Artikeln finde ich ganz unterschiedliche Vorgehen; manche schreiben auch, dass man nicht mehrere Interaktionseffekte aufnehmen soll.
Genaue Literaturangaben wären hier hilfreich, um diese Artikel zu kommentieren. Der Grund wesshalb i.d.R. nicht alle Interaktionen spezifiziert werden, habe ich oben genannt. Statistisch/mathematisch wüsste ich nicht, was dagegen sprechen sollte.
Zudem möchte ich auch gern wissen, ob man bei den 3 Bildungsgruppen eine der Ausprägungen als Referenz draußen lassen muss, also nur ddr*bildung_1 und ddr*bildung_2 aufnimmt?
Wenn Du das nicht tust, übernimmt das die Software. Würdest Du alle Indikatoren aufnehmen, wären diese kollinear mit der Konstanten.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.