Unsicher über richtiges Vorgehen, Voraussetzungen wie testen

Alle Verfahren der Regressionanalyse.

Unsicher über richtiges Vorgehen, Voraussetzungen wie testen

Beitragvon Varianz » Di 24. Mär 2015, 13:21

Hallo liebe Forums-User,

ich bin noch totale Statistik-Anfängerin und mache gerade einen freiwilligen Kurs zu R in den Semesterferien. Da ich dort schlecht mitkomme, wollte ich jetzt zuhause nochmal ein bisschen üben und stolpere schon über die einfachsten Sachen. :roll: Ich wäre sehr dankbar, wenn ihr mir ein bisschen auf die Sprünge helfen würdet.

Ich will eine multiple Regression rechnen. Hypothese ist: Je höher der IQ und je höher der Bildungsabschluss, desto häufiger findet Theaterbesuch statt.
Prädiktorvariablen: IQ (intervallskaliert) und höchster Bildungsabschluss (11 Kategorien, wäre dann ja nominalskaliert, oder?)
Kriteriumsvariable: Theaterbesuch (Likert-Skala mit 4 Items (Art der besuchten Stücke) und je 4 Antwortkategorien (sehr häufig bis nie). Würde die Likert-Skala als intervallskaliert annehmen.

Mein großes Problem ist: Ich muss nun überprüfen, ob die Voraussetzung für eine Regression gegeben sind, oder? Aber wie mache ich das in R? In der Statistik-Vorlesung habe ich zwar was zu "Residuen müssen normalverteilt sein" usw. gehört, aber wie ich das jetzt konkret an diesen Variablen teste weiß ich nicht und die Antworten im Internet verwirren mich nur noch mehr.

Wäre toll, wenn sich jemand kurz Zeit nimmt und mir erklärt, wie ich vorgehen muss. :oops:

Danke,
Hannah
Varianz
Beobachter
Beobachter
 
Beiträge: 16
Registriert: Di 24. Mär 2015, 13:09
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Unsicher über richtiges Vorgehen, Voraussetzungen wie te

Beitragvon bele » Di 24. Mär 2015, 16:35

Hallo Hannah,

zunächst musst Du prüfen, dass Deine Variablen in R den richtigen Typ haben. Die 11 Kategorien von Bildungsabschluss sollen ja als Dummys in die Regression eingehen, die Theaterbesuche aber metrisch. Dann muss die Variable Bildungsabschluss vom Typ factor, die Variabe Theaterbesuch vom Typ num oder integer oder so sein. In irgendeiner Form wirst Du dann die Funktion lm aufrufen, sagen wir, das ginge so:
Code: Alles auswählen
regr <- lm(Theaterbesuch ~ IQ + Bildungsabschluss, data= dataframename)

Damit hättest Du das Ergebnis einer linearen Regression de Namen "regr" gegeben. Die Residuen der Regression erhälst Du dann über regr$residuals. Zum Beispiel kannst Du einen Quantile-Quantile-Plot zur Überprüfung auf Normalverteilung wie folgt zeichnen lassen:
Code: Alles auswählen
qqnorm(regr$residuals)
qqline()

oder ein Histogramm mit
Code: Alles auswählen
hist(regr$residuals)


LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Unsicher über richtiges Vorgehen, Voraussetzungen wie te

Beitragvon Varianz » Di 24. Mär 2015, 17:48

Hallo Bernhard,

tausend Dank für deine schnelle Antwort!

Bitte sei mir nicht böse, wenn ich noch mehr Fragen stellen muss:
Ich habe mit str(DATENSATZ$Variablenname) überprüft, in welcher Form die Variablen vorhanden sind. Alle Variablen (auch der Bildungsabschluss) sind num. Heißt das, ich muss den Bildungsabschluss erst in factor umwandeln? Wie mache ich das?

Nochmal herzlichen Dank für deine Hilfe!!!

LG,
Hannah
Varianz
Beobachter
Beobachter
 
Beiträge: 16
Registriert: Di 24. Mär 2015, 13:09
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Unsicher über richtiges Vorgehen, Voraussetzungen wie te

Beitragvon bele » Di 24. Mär 2015, 23:24

Wenn Du das nicht händisch in Dummys umwandeln willst, dann nicht. Sonst Schau Dir mal die Funktionen factor, as.factor, ordered etc. an.
Code: Alles auswählen
help(factor)


LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 14 Gäste