Hallo zusammen,
ich komme gerade einfach nicht weiter und vermutlich macht es an dieser Stelle mal Sinn nach Tipps und Hinweise aus der Community zu fragen.
Ich möchte durch eine binäre logistische Regression herausfinden, wie sich der Einfluss von Bildung (niedrig, mittel, hoch) auf die Wahrscheinlichkeit auswirkt, wählen zu gehen. Natürlich ist mir bewusst, dass auch andere Variablen einen signifikanten Einfluss auf die Wahl-Wahrscheinlichkeit haben (und es eine wechselseitige Beziehung zwischen Bildung und den anderen UVs gibt). Deswegen verwende ich als weitere UVs Geschlecht, Politisches Interesse und Alter.
Ich möchte zeigen, dass die Wahrscheinlichkeit wählen zu gehen in den letzten Jahren bei allen Bildungsgruppen abgenommen hat, jedoch die Wahrscheinlichkeit bei jenen mit niedriger Bildung deutlich mehr abgenommen hat als bei den anderen Gruppen.
Ich will also schauen, wie sich die Wahrscheinlichkeit über die Jahre geringer geworden ist. Rechne ich dann die logistische Regression pro Jahr oder werfe ich das Jahr als zusätzliche UV in die Regression? Ich will mir dann eine Abbildung generieren lassen, die mir anzeigt wie die Wahrscheinlichkeit wählen zu gehen (Y-Achse) sich über die Jahre (X-Achse) verändert, abhängig von der Bildung. Wie mache ich das? Rechne ich die Regression mit allen Variablen und lasse mir die errechneten Wahrscheinlichkeiten dann gruppiert nach Bildung anzeigen? Das war nämlich mein bisheriger Ansatz. Es gibt auch eine Abbildung, die ich versuche (mit den gleichen Daten) zu rekonstruieren (siehe Bild). Ihr sieht als zweites Bild bisher mein Ergebnis, wobei ich die Wahrscheinlichkeiten pro Jahr berechnet habe.
Habt ihr eine Idee für mich?