Level löschen

Fragen, die sich auf kein spezielles Verfahren beziehen.

Level löschen

Beitragvon zimti » Mo 28. Jan 2013, 14:27

An alle Statistikexperten. ;) Ich hatte bereits vor einigen Wochen ins Forum geschrieben. Es ging um die Auswertung eines Datensatzes mit dem Kommilitonen und ich z.z. beschäftigt sind. Wir sind inzwischen ein ganzes Stück weitergekommen. Allerdings klemmt es nun an einer letzten Stelle. :(

Ich hoffe ihr könnt uns weiterhelfen.
Wir möchten eine einfaktorielle Varianzanalyse durchführen, um herauszufinden, ob sich der Filmkonsum zwischen zwei Gruppen unterscheidet.
Die eine Gruppe beinhaltet: 606 Personen ( Kodierung: "0 NA") und die andere Gruppe beinhaltet: 218 Personen (--> Kodierung "1 NA"). Beide Gruppe stammen aus einer ursprünglichen Stichprobe mit mehr als 2000 Personen. Mithilfe der paste-Funktion haben wir aus den beiden Gruppen quasi einen Faktor gebildet, der die Ausprägungen "O NA" und "1NA" hat und den wir für die Varianzanalyse benötigen.
p<-paste(ip, pt)
Allerdings zeigt der Befehl "describe(p)" auf einmal auch eine Gruppe "NA NA" an und diese beinhaltet auf einmal auch alle weiteren Personen, die wir nicht beachten wollten. Aus uns unerklärlichen Gründen wird auf den großen Datensatz (2400 Personen) zurückgegriffen, so dass "NA NA" folgendermaßen gebildet wird:
2400 - 606 - 218= NA NA. Diese Personen (NA NA - knapp 1600 Pers.) möchten wir allerdings nicht haben. Wir würden gerne dieses Level löschen. Doch wie?? Ich hoffe ihr habt hilfreiche Vorschläge. Wäre supi!

Bis dahin,
zimti
zimti
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 4. Jan 2013, 12:32
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Level löschen

Beitragvon bele » Mo 28. Jan 2013, 17:05

Hallo zimti,

ich mag die Art der Frage nicht (schreibst nicht, welche Software Du verwendest, aus welchem package Du description() genommen hast, wie die Faktoren entstanden sind, unrpäzise Formulierungen, Du willst wahrscheinlich nicht Level löschen sondern Datensätze, etc). Aber weil Du letztes Mal so nett den "Thanks"-Button gedrückt hast, obwohl das Problem da schon gelöst war, habe ich Dir ein Beispiel gebastelt, wie sich so etwas mit der subset()-Funktion lösen lässt: Du nimmst Dir aus Deinem Ursprungsdatensatz nur die Auswahl der gewünschten Datensätze und verwendest dann für Deine Analysen nur die Auswahl:

Code: Alles auswählen
# Beispieldaten erzeugen
beispiel <- data.frame(kennung = as.factor(rep(c("NA NA","0 NA", "NA 0"),10)),
             nummer=1:30, sonstwas=gl(10,3) )
# Beispiel anschauen
head(beispiel)
str(beispiel)

# Auswahl treffen
auswahl <- subset(beispiel, beispiel$kennung != "NA NA")

# Auswahl anschauen
head(auswahl)
str(auswahl)


R kennt für dieses Vorgehen verschiedene Schreibweisen. Eine gleichwertige (ich finde: weniger schöne) Variante wäre
Code: Alles auswählen
auswahl <- beispiel[beispiel$kennung!="NA NA",]


Ich finde den letzteren Code zwar weniger schön, aber Du kannst ihn als Lernüberprüfung verwenden. Versuche herauszufinden, warum ich vor der eckigen Klammer-zu ein Komma gesetzt habe. Wenn Du das verstanden hast, bist Du in R einen großen Schritt weiter; bestimmt!

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5923
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1402 mal in 1388 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 13 Gäste

cron