Hallo liebe Forumsmitglieder,
ich bin gerade dabei meine Masterarbeit zu schreiben und möchte dafür eine multiple Regression durchführen. Ich wäre euch unendlich dankbar, wenn ihr mit helft. Bitte verzeiht mir, wenn meine
Erläuterung vielleicht etwas holprig ist, denn so richtig verstanden habe ich wohl noch nicht alles.
Ich habe ca. 10 Variablen und habe jetzt ein paar Tests mit den Daten durchgeführt, da ich bereits befürchtet habe, dass die Prämissen nicht erfüllt sein werden.
Diese habe ich erstmal nur mit ein paar der Variablen durchgeführt, damit es vielleicht erstmal überschaubar bleibt.
Ich habe mir den Residuenplot angesehen und dieser weist eindeutig auf Heteroskedastizität hin. Ein sehr starkes Dreiecksmuster eben. Ich habe gelesen, dass man
da eventuell was über Transformation einer Variablen machen kann. Da es Studien gibt, die etwas ähnliches machen wie ich, habe ich deren Lösung ausprobiert und versucht
alle möglichen Variablen zu logarithmieren. Ich habe auch versucht mir das durch anlesen begreiflich zu machen, aber letztendlich ist es ein rumprobieren gewesen. Jedenfalls
sehen die Residuen sehr viel mehr nach einer zufälligen Punktewolke aus wenn ich zunächst mal die abhängige Variable logarithmiere. Wenn ich stattdessen nur die unabhängigen
logarithmiere, sieht es nicht viel besser aus. Am besten ist es aber nach meinem Verständnis, wenn ich sowohl die AV als auch die UVs logarithmiere.
Das ist ja jetzt ganz schön und gut mit den Punkten und den Wolken aber so richtig verstanden habe ich das offensichtlich leider nicht.. Kann ich das irgendwie vernünftig rechtfertigen
und vor allem überhaupt noch interpretieren, wenn ich das alles logarithmiere? Verfälsche ich damit eventuell auch die Zusammenhänge?
Es sieht so aus als ob die besagten Studien das genau so gemacht haben. Die abhängige Variable wurde logarithmiert und auch einige der UVS.
Ich bin jetzt auch auf die SPSS Funktion "Kurvenanpassung" gestoßen und habe für die verschiedenen UVs das jeweils mit der AV ausprobiert. Ich habe linear, exponentiell und logarithmisch ausprobiert.
Bei einigen Variablen sieht exponentiell gut aus. Bei manchen sieht einfach alles nach nichts aus.
Ich habe mir auch Streu/Punktdiagramme anzeigen lassen von der AV mit den verschiedenen UVs. Ohne Transformation, nur AV logarithmiert, beides logarithmiert, nur UV logarithmiert. Und da sieht die vorletzte Lösung immer ganz schön nach nem linearem Zusammenhang aus. Die anderen Lösungen sehen eher nach nichts aus. Das weißt auch auf einen exponentiellen Zusammenhang hin, so wie ich das verstanden habe?
Die Fragen nochmal zusammengefasst:
1.Woher weiß man, welche Variable man transformieren muss?
2.Habe ich das richtig verstanden, dass es dann sinnvoll ist, sowohl Uv als auch AVs zu logarithmieren, wenn der Zusammenhang exponentiell ist?
3.Wenn ich die abhängige Variable transformiere, wird ja der Zusammenhang mit allen unabhängigen Variablen verändert, oder? Kann das nicht problematisch sein, denn es ist ja möglich, dass die anderen UVs in einem anderen Zusammenhang zur AV stehen? Bin ich gezwungen für jede UV dann eine andere Transformation durchzuführen?
4.Manche Variablen können auch nicht einfach logarithmiert werden, weil sie den Wert 0 beinhalten. Was dann?
5.Kann man Dummy Variablen dann einfach unverändert lassen?
Ich habe wirklich versucht mir das mit Büchern und Googeln zu erkären. Aber meistens hören die Erklärungen dort auf, wo meine Fragen beginnen. Deshalb wäre ich wirklich sehr froh, wenn mir jemand helfen könnte/würde.
Viele hoffnungsvolle Grüße