Statistikaufgabe für Bachelor; mean, 95% confidence interval

Fragen, die sich auf kein spezielles Verfahren beziehen.

Statistikaufgabe für Bachelor; mean, 95% confidence interval

Beitragvon MaHe » Mi 24. Mai 2023, 09:43

Hallöchen,
ich belege derzeit einen Statistikkurs und muss nun eine Prüfung ablegen. Bei folgender Aufgabe habe ich eine Problem und hoffe, dass mir hier wer weiterhelfen kann:
Ich muss den mean mit einem 95% confidence interval für eine variable Zeit berechnen. Hierfür soll ich ein subset des datasets erstellen und nur auf bestimmte Lokalitäten eingehen (Attard, Birgu, Birkirkara, Marsaskala, Mellieha und Sliema).

Ich nutzte folgende fuctionen:

#Assignment no.8 mean with a 95% confidence interval
install.packages("Publish")
library("Publish")
Locality_Time<-ci.mean(Time_min~Locality, data=CommuteUM)
Locality_Time

Subset_Locality<-CommuteUM[CommuteUM$Locality=="Attard"
|CommuteUM$Locality=="Birgu"
|CommuteUM$Locality=="Birkirkara"
|CommuteUM$Locality=="Marsaskala"
|CommuteUM$Locality=="Mellieha"
|CommuteUM$Locality=="Sliema",]

Subset_Locality<-CommuteUM[CommuteUM$Locality=="Attard"
|CommuteUM$Locality=="Birgu"
|CommuteUM$Locality=="Birkirkara"
|CommuteUM$Locality=="Marsaskala"
|CommuteUM$Locality=="Mellieha"
|CommuteUM$Locality=="Sliema","Locality"]

Subset_Locality<-unlist((CommuteUM[CommuteUM$Locality=="Attard"
|CommuteUM$Locality=="Birgu"
|CommuteUM$Locality=="Birkirkara"
|CommuteUM$Locality=="Marsaskala"
|CommuteUM$Locality=="Mellieha"
|CommuteUM$Locality=="Sliema","Locality"]))


plot(ci.mean(Time_min~Subset_Locality, data=CommuteUM),xlab="Time")


Als Ergebnis erhalte ich folgende Fehlermeldung:
Error in model.frame.default(x, data) :
Variablenlängen sind unterschiedlich (gefunden für 'Subset_Locality')

Leider weiß ich nicht genau, wie ich dieses Problem beheben kann. Vielleicht kann mir jemand von euch helfen - Vielen Dank!!

Liebe Grüße, Maren
MaHe
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mi 24. Mai 2023, 09:33
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Statistikaufgabe für Bachelor; mean, 95% confidence inte

Beitragvon bele » Mi 24. Mai 2023, 11:59

Hallo Maren,

MaHe hat geschrieben:install.packages("Publish")
library("Publish")


Mit den Funktionen dieses Pakets bin ich nicht vertraut.

Code: Alles auswählen
Subset_Locality<-CommuteUM[CommuteUM$Locality=="Attard"
                          |CommuteUM$Locality=="Birgu"
                          |CommuteUM$Locality=="Birkirkara"
                          |CommuteUM$Locality=="Marsaskala"
                          |CommuteUM$Locality=="Mellieha"
                          |CommuteUM$Locality=="Sliema",]

Subset_Locality<-CommuteUM[CommuteUM$Locality=="Attard"
                          |CommuteUM$Locality=="Birgu"
                          |CommuteUM$Locality=="Birkirkara"
                          |CommuteUM$Locality=="Marsaskala"
                          |CommuteUM$Locality=="Mellieha"
                          |CommuteUM$Locality=="Sliema","Locality"]

Subset_Locality<-unlist((CommuteUM[CommuteUM$Locality=="Attard"
                                  |CommuteUM$Locality=="Birgu"
                                  |CommuteUM$Locality=="Birkirkara"
                                  |CommuteUM$Locality=="Marsaskala"
                                  |CommuteUM$Locality=="Mellieha"
                                  |CommuteUM$Locality=="Sliema","Locality"]))


Diese drei Zuweisungen sind schrittweise Erweiterungen - jede überschreibt das Ergebnis der vorherigen. Und das ist nicht in Deinem Sinne. Fangen wir mit der ersten an:

Code: Alles auswählen
Subset_Locality<-CommuteUM[CommuteUM$Locality=="Attard"
                          |CommuteUM$Locality=="Birgu"
                          |CommuteUM$Locality=="Birkirkara"
                          |CommuteUM$Locality=="Marsaskala"
                          |CommuteUM$Locality=="Mellieha"
                          |CommuteUM$Locality=="Sliema",]


Danach hast Du in Subset_Locality einen Dataframe/eine Tabelle in der nur die gewünschten Orte enthalten sind und bestimmt gibt es da auch irgendwo eine Spalte in der die Variable Zeit steht, mit der Du rechnen sollst. Das hier ist also der Ausgangspunkt von dem aus Du versuchen kannst, Zeit zu untersuchen.

STattdessen überschreibst Du Subset_Locality wie folgt:

Code: Alles auswählen
Subset_Locality<-CommuteUM[CommuteUM$Locality=="Attard"
|CommuteUM$Locality=="Birgu"
|CommuteUM$Locality=="Birkirkara"
|CommuteUM$Locality=="Marsaskala"
|CommuteUM$Locality=="Mellieha"
|CommuteUM$Locality=="Sliema","Locality"]


Danach steht in Subset_Locality nur noch ein Dataframe/eine Tabelle mit einer einzigen Spalte. Das ist die Spalte "Locality" und die Spalte mit den Zeitinformationen hast Du damit verworfen. Damit (und auch mit dem nächsten Schritt) kann man die Variable Zeit nicht mehr untersuchen, weil sie in Subset_Locality nicht mehr enthalten ist.
Ich vermute, Du willst sowas hier machen:


Code: Alles auswählen
Subset_Locality<-CommuteUM[CommuteUM$Locality=="Attard"
                          |CommuteUM$Locality=="Birgu"
                          |CommuteUM$Locality=="Birkirkara"
                          |CommuteUM$Locality=="Marsaskala"
                          |CommuteUM$Locality=="Mellieha"
                          |CommuteUM$Locality=="Sliema",]
plot(ci.mean(Time_min ~ Locality, data=Subset_Locality), xlab = "Time")


(Aber so genau weiß ich das nicht, ich bin weder mit dem Paket vertraut noch mit den Daten.)


Du kannst gerne weitere Fragen hier posten. An sich ist das hier aber ein Forum für Statistik-Fragestellungen, nicht für den Umgang mit R. Dekne Frage ist langweilig für alle, die ihre Statistik mit Stata, JASP, SAS, Python oder SPSS rechnen. Wahrscheinlich ist es daher besser, wenn Du solche Fragen, in denen es vorrangig um R und nicht vorrangig um Statistik geht, im R Forum postest: forum.r-statistik.de

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5916
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts

folgende User möchten sich bei bele bedanken:
MaHe

Re: Statistikaufgabe für Bachelor; mean, 95% confidence inte

Beitragvon MaHe » Mi 24. Mai 2023, 13:27

Danke Bernhard, das hat mir sehr weitergeholfen! Für die Zukunft weiß ich dann bescheid, dass ich die Fragen R Forum poste. Ganz lieben Dank!
MaHe
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mi 24. Mai 2023, 09:33
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 11 Gäste

cron