
sitze an einer übungsaufgabe aus einem statistikbuch und komme irgendwie nicht richtig weiter.
ich versuche mal das problem zu schildern:
ich habe einen datensatz mit 3 Variablen (eine ziel, zwei einflussvariablen) und ich möchte ein passendes lineares modell dazu finden.
die zielvariable ist metrisch, die einflussvariablen metrisch und nominal skaliert(zwei ausprägungen).
ich habe mir als erstes mal angeschaut, wie einzelne plots des datensatzes aussahen und festgestellt, dass man, wenn man die nominal skalierte variable in den Gruppen einzeln betrachten würde eine lineare Regression sehr gut passen würde. da ich aber alle einflussvariablen auf ihren einfluss testen möchte habe ich danach geprüft, welchen einfluss die metrisch skalierte variable auf die zielvariable hat... und meiner meinung nach ist der einfluss auch signifikant!
also habe ich nun beide einflussvariablen zusammen in einem ancova modell geprüft und die p-werte sehen super aus... also ich finde das deutet alles auf ein modell ohne interaktionsterme hin, jetzt habe ich mir aber die diagnostikplots angeschaut und der qq-plot zeigt mir leider, dass die residuen nicht normalverteilt sind....
ich habe jetzt schon ein bisschen herumprobiert, ob ich mein modell nicht irgendwie ein bisschen anpassen könnte (logarithmische darstellung, quadratischen term hinzugefügt...) aber mir gehen langsam die ideen aus!
ich würde mich freuen, wenn mir jemand irgendwie einen tipp geben könnte, was eventuell noch helfen würde! (ich hoffe mal man versteht mein problem

schöne grüße an alle!!
