Absolute Häufigkeit Längsschnitt

Fragen, die sich auf kein spezielles Verfahren beziehen.

Absolute Häufigkeit Längsschnitt

Beitragvon thorben-meyer » Do 31. Mär 2022, 17:46

Hallo,

ich habe eine Anfänger-Frage für das Bestimmen der absoluten Häufigkeiten in einem Längsschnitt-Datensatz in R.

Ich habe drei Messzeitpunkte: t1, t2, t3
Das Geschlecht wurde zum Zeitpunkt t1 erhoben.
Zum Zeitpunkt t1 haben 304 Leute an der Studie teilgenommen und davon waren 248 weiblich.
Zum Zeitpunkt t2 und t3 gab es erheblichen Dropout und viele Proband:innen haben nicht mehr an der Befragung teilgenommen, daher habe ich viele NAs. Bei t2 haben nur noch 90 Teilnehmer:innen die Fragen beantwortet haben und bei t3 nur noch 50.

Ich würde nun gerne herausfinden, wie viele der Teilnehmer:innen, die auch t2 und t3 vervollständigt haben (also die keine NAs haben, sondern richtige Antwort-Werte) weiblich sind. Weiß jemand, wie sich das bei R ausgeben lässt?

Danke & viele Grüße
Thorben
thorben-meyer
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Mi 23. Feb 2022, 17:01
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Absolute Häufigkeit Längsschnitt

Beitragvon PonderStibbons » Do 31. Mär 2022, 19:07

Wenn es keine Muster des Typs "t2 nicht teilgenommen, t3 wieder teilgenommen" gibt,
dann sind die Frauen in t3 = die Frauen, die zu t1 und zu t2 und zu t3 teilgenommen haben.

Fragen zu R sind hier gut aufgehoben.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Absolute Häufigkeit Längsschnitt

Beitragvon bele » Do 31. Mär 2022, 20:15

Hallo Thorben,
In einem Punkt muss ich PonderStibbons einschränken: Fragen zu lavaan werden am besten hier im Forum von Holger beantwortet. Das hast Du ja schon gemerkt. Für alles andere zu R stimme ich PonderStibbons zu.
Zur konkreten Frage musst Du noch erklären, wie die Daten in R vorliegen. Sind die Ergebnisse zu den verschiedenen Messzeitpunkten in verschiedenen Spalten nebeneinander oder in der gleichen Spalte untereinander? Am liebsten werden Fragen mit Beispieldaten, sei es als R Code oder als CSV angenommen, denn dann lassen sich auch sehr konkrete Antworten formulieren.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5916
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts

Re: Absolute Häufigkeit Längsschnitt

Beitragvon thorben-meyer » Fr 1. Apr 2022, 14:04

Hallo,
danke für die netten Antworten.

Die erste Spalte meines Datensatzes ist die ID der Proband:innen, die zweite dann das Geschlecht zum Zeitpunkt T1. In weiteren Spalten folgen dann die Antworten zu den Items (ich nenne sie hier mal a, b, c und d). Also: aT1, bT1, cT1, dT1, aT2, bT2, cT2, dT2, aT3, bT2, cT2, dT3

Ich kann aus Datenschutzgründen leider keinen Auszug des Datensatzes hochladen aber die Struktur sieht dann in etwa so aus

ID Geschlecht aT1 bT1 cT1 dT1 aT2 bT2 cT2 dT2 aT3 bT2 cT2 dT3

Wie gesagt wurden die Items zu T1 von allen Teilnehmer:innen vervollständigt. Dementsprechend konnte ich mir die Anzahl der weiblichen Proband:innen zu T1 einfach mit table(daten$SQ1_Geschlecht) ausgeben lassen.
Zu T2 und T3 gibt es dann einen großen Dropout, in dem Datensatz sind dann entsprechend viele NAs. Ich möchte nun herausfinden, wie viele der Leute, die auch T2 und T3 vervollständigt haben, weiblich sind.

Ich hoffe, das hilft weiter um meine Frage verständlicher zu machen.

Danke nochmals und liebe Grüße
Thorben
thorben-meyer
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Mi 23. Feb 2022, 17:01
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Absolute Häufigkeit Längsschnitt

Beitragvon bele » Fr 1. Apr 2022, 16:56

Hallo Thorben,

thorben-meyer hat geschrieben:Ich kann aus Datenschutzgründen leider keinen Auszug des Datensatzes hochladen aber die Struktur sieht dann in etwa so aus


Für Fragen in Foren ist es immens wertvoll zu lernen, wie man Beispieldatensätze generiert. Ich lasse jetzt zum Zeigen mal die Unterteilung in a, b, c, d weg und wir erstellen folgenden Datensatz:

Code: Alles auswählen
daten <- data.frame(gender = sample(c("m", "f"), 60, 1, c(.2, .8)),
                    T1 = sample(1:5, 60, 1),
                    T2 = sample(c(1:5, NA), 60, 1, c(1,1,1,1,1,5)),
                    T3 = sample(c(1:5, NA), 60, 1, c(1,1,1,1,1,10)))
head(daten, 20)


Probier das in Deinem R aus. Sieht es so aus, als könnten wir damit was anfangen?

Gut, jetzt wollen wir mehrfach das gleiche machen, deshalb bietet es sich an, eine kleine Funktion zu schreiben. Diese zählt mit der Funktion sum, wie oft ein Wert in einem Vector x nicht NA ist. Ich hoffe doch, die Fehlenden sind in Deinem Datensatz als NA gekennzeichnet? Gut, nachdem sie jedes Element von x mit is.na geprüft hat, zählt sich die TRUE Werte mit sum zusammen und teilt dann durch die Zahl der Werte in x:

Code: Alles auswählen
anteil_ohne_na <- function(x) sum(!is.na(x)) / length(x)
# Anwendungsbeispiele:
anteil_ohne_na(daten$T1)
anteil_ohne_na(daten$T2)
anteil_ohne_na(daten$T3)


Diese Funktion wollen wir nun nach Geschlecht getrennt anwenden. Das können wir in R auf viele verschiedene Weisen machen. Ich schlage hier jetzt einfach mal die Funktion aggregate vor:

Code: Alles auswählen
aggregate(daten$T1, by = list(daten$gender), FUN = anteil_ohne_na)
aggregate(daten$T2, by = list(daten$gender), FUN = anteil_ohne_na)
aggregate(daten$T3, by = list(daten$gender), FUN = anteil_ohne_na)


Wie Du siehst, ist der Beitrag recht lang geworden. Deshalb schlagen wir ja vor, weitere Fragen zur Anwendung von R im forum.r-statistik.de zu bearbeiten und hier die Fragen zur Statistik zu stellen.

Viele Grüße,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5916
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 19 Gäste