Hallo allerseits!
Entschuldigt wenn die Frage blöd ist. Ich weiß wie man eine Korrelationsmatrix in R erstellt, das ist kein Problem, die Frage ist nur ob und wenn ja wie ich das für meinen Datensatz machen kann.
Kurze Erklärung: meine Daten werten gefundene Fehler aus also ist ein Eintrag zum Beispiel:
id=0; Fehler= A; bildgroesse=groß; position= außen; farbe= schwarzweiß; gefunden=ja
Die Antwortmöglichkeiten sind binär also groß(1)/klein(0), außen(0)/innen(1), bunt(1)/schwarzweiß(0) und gefunden ja(1)/nein(0).
Nun wollte ich schauen ob die einzelnen Variablen einen Einfluss aufeinander haben, und wollte dazu eben eine Korrelationsmatrix erstellen.
Mein Problem ist aber, kann man das überhaupt machen? weil man braucht jedes Mal eigentlich die Variable gefunden/nicht gefunden.
Mein R Code sieht so aus:
subset1 <- subset(Datensatz1, select= c(size, position, color, found))
korr1 <- cor(subset1)
korr1
Ich denke aber das dies nicht richtig ist. Ich weiß gar nicht wie ich das ausdrücken soll, aber ich denke das gefunden muss irgendwie als fixer Faktor genommen werden und dann schaut man sich an ob size, position und color sich gegenseitig beeinflussen.
Ich wäre sehr dankbar, wenn jemand mein Gedankenchaos sortieren könnte und mir helfen könnte.
Entschuldigt, mein Statistikwissen ist gering und ich konnte im Internet bisher kein vergleichbares Beispiel finden.
Liebe Grüße,
Conny