An alle Statistikexperten. Ich hatte bereits vor einigen Wochen ins Forum geschrieben. Es ging um die Auswertung eines Datensatzes mit dem Kommilitonen und ich z.z. beschäftigt sind. Wir sind inzwischen ein ganzes Stück weitergekommen. Allerdings klemmt es nun an einer letzten Stelle.
Ich hoffe ihr könnt uns weiterhelfen.
Wir möchten eine einfaktorielle Varianzanalyse durchführen, um herauszufinden, ob sich der Filmkonsum zwischen zwei Gruppen unterscheidet.
Die eine Gruppe beinhaltet: 606 Personen ( Kodierung: "0 NA") und die andere Gruppe beinhaltet: 218 Personen (--> Kodierung "1 NA"). Beide Gruppe stammen aus einer ursprünglichen Stichprobe mit mehr als 2000 Personen. Mithilfe der paste-Funktion haben wir aus den beiden Gruppen quasi einen Faktor gebildet, der die Ausprägungen "O NA" und "1NA" hat und den wir für die Varianzanalyse benötigen.
p<-paste(ip, pt)
Allerdings zeigt der Befehl "describe(p)" auf einmal auch eine Gruppe "NA NA" an und diese beinhaltet auf einmal auch alle weiteren Personen, die wir nicht beachten wollten. Aus uns unerklärlichen Gründen wird auf den großen Datensatz (2400 Personen) zurückgegriffen, so dass "NA NA" folgendermaßen gebildet wird:
2400 - 606 - 218= NA NA. Diese Personen (NA NA - knapp 1600 Pers.) möchten wir allerdings nicht haben. Wir würden gerne dieses Level löschen. Doch wie?? Ich hoffe ihr habt hilfreiche Vorschläge. Wäre supi!
Bis dahin,
zimti