Hallo liebe Leute,
brauche dringend Hilfe. Ich finde dieses Forum superrr weil man sofort eine Antwort bekommt.
Ich habe da ein Problem. Ich muss die lineare Regression anwenden. Da habe ich bestimmte Voraussetzungen wie:
Normalverteilung der Residuen
Homoskedastizität der Residen
Unabhängigkeit der Residuen.
Ich habe nun nicht normalverteilte residuen. Nun muss ich diese transformieren. Ich weiss nicht ob mein Ansatz richtig ist.
Also:
/*Die Datei hab ich zuerst eingelesen*/
DATA probe;
SET link.versuch;
RUN;
/*habe mit Proc reg die Residuen in eine andere Datei=reg ausgegeben*/
PROC REG;
MODEL hdl= bmi;
OUTPUT OUT=reg R=res P=predicted;
RUN; QUIT;
/* Histogramm erstellt*/
PROC UNIVARIATE data=reg NORMAL;
VAR res;
HISTOGRAM res/NORMAL;
QQPLOT res/NORMAL(MU=est SIGMA=est);
RUN;
So habe ich zunächst untersucht ob die Residuen normalverteilt sind. Waren sie aber nicht dann habe ich transformiert. Was ich nun nicht verstehe ist, welche Variable ich transformieren muss( die abhängige oder die unabhängige). Hier werden ja die Residuen untersucht, welche Varaible muss dann transformiert werden???
So habe ich es mal gemacht:
/*Die Datei hab ich zuerst eingelesen*/
DATA probe;
SET link.versuch;
log_bmi= log(bmi);
RUN;
/*habe mit Proc reg die Residuen in eine andere Datei=reg ausgegeben*/
PROC REG;
MODEL hdl= log( bmi);
OUTPUT OUT=reg R=res P=predicted;
RUN; QUIT;
/* Histogramm erstellt*/
PROC UNIVARIATE data=reg NORMAL;
VAR res;
HISTOGRAM res/NORMAL;
QQPLOT res/NORMAL(MU=est SIGMA=est);
RUN;
Wäre das soweit richtig?
Ich will die einfache lineare Regression durchführen. Ich habe noch weitere unabhängige Variablen wie Alter ,Geschlecht, Taillenumfang..... Muss ich für alle Variablen eine eigene Prozedur machen. Kann es sein das es danach trotzdem nicht normalverteilt ist? Und wenn alle Voraussetzungen nicht gelten, welchen Test könnte ich als Alternative anwenden?
Für eine Antwort wäre ich sehr dankbar.Ist mir wirklich soooo wichtig. Ich freue mich auf gute Antwerten
Mit freundlichen Grüßen