Hallo Lisa,
lisa45602 hat geschrieben:... um zu sehen, ob ich sie als mögliche Kovariate in meine Anova mit aufnehmen muss.
Vorneweg muss ich erstmal PonderStibbons zustimmen, dass das kein guter Plan ist. Nimm das Geschlecht mit in die ANOVA auf, wenn die Sachlage das nahelegt. Die ANOVA wird Dir schon sagen, ob das Geschlecht relevant ist.
Oder gibt es eine andere Möglichkeit, dies in R zu berechnen?
In der letzten Studie, die ich gerechnet habe, waren unter mehr als zweihundert Teilnehmern nur ein(e) Nicht-Binäre(r). In diesem Fall und für Deinen Verwendungszweck könntest Du überlegen, ob Du die Korrelation einfach ohne die Nicht-binären rechnest.
Ansonsten (wenn Deine Lehrer:innen Dich zwingen, so etwas vor dem Einschluss zu rechnen) ist die Alternative zur Korrelation hier die ANOVA. Die kann Dir sagen, ob verschiedene Geschlechter zu verschieden hohen Werten in einer metrischen Variable führen.
Ich habe mal ein paar Beispieldaten in R simuliert und wenn Du den Code unten Schritt für Schritt in Deiner eigenen R Session ausprobierst, siehst Du, wie ich das angehen würde (wenn überhaupt, siehe oben):
- Code: Alles auswählen
# Zunächst ein paar Beispieldaten erfinden
bsp <- data.frame(Alter = runif(100, 20, 80),
Geschlecht = sample(c("Frau", "Mann" ,"nicht-binär"),
100, 1, c(.5, .45, .05)),
Selbstvertrauen = sample.int(20, 100, 1),
stringsAsFactors = TRUE)
# Mal die ersten Zeilen anschauen, wie die Beispieldaten aussehen
head(bsp, 10)
# Und jetzt schauen, in welchem Datenformat die Werte vorliegen
str(bsp)
# Jetzt schauen wir erstmal, wieviele Diverse überhaupt vorkommen (Zufallszahl, wird jedes Mal anders sein)
table(bsp$Geschlecht)
# Jetzt könnten wir eine ANOVA rechnen
aov(Selbstvertrauen ~ Geschlecht, data = bsp) |> summary()
# oder für diesen Teilaspekt nur Männer und Frauen betrachten. Dafür führen wir
# eine neue Datenspalte ein, die das Geschlecht enthält und bei divers ein NA,
# außerdem müssen wir das dann noch in ein Zahlenformat wandeln:
bsp$GeschlechtBinär <-
as.integer(ifelse(
bsp$Geschlecht == "nicht-binär",
yes = NA,
no = bsp$Geschlecht
))
table(bsp$GeschlechtBinär, useNA = "always")
# Pearson-Korrelation mit einer Binären Variable heißt "Punkt-Biseriale Korrelation"
# siehe auch https://de.wikipedia.org/wiki/Punktbiseriale_Korrelation
cor.test(bsp$GeschlechtBinär, bsp$Selbstvertrauen)
LG,
Bernhard