Ok, jetzt wird es etwas komplizierter. Ich mache eine starke Annahme, die falsch aber hilfreich ist: Ich gehe davon aus, dass die 64 Personen zwischen 18 und 24 Jahren alle ganzzahligen Alter zwischen 18 und 24 mit gleicher Wahrscheinlichkeit einnehmen.
Jetzt kann ich einen Computer 64 gleichverteilte Alter zwischen 18 und 24 ziehen lassen und dazu noch 59 mit gleichverteilten Altern zwischen 25 und 34 und 3 Altersangaben zwischen 34 und 44 und so weiter und daraus den Mittelwert berechnen. So erhalte ich einen möglichen Mittelwert zu diesen Angaben. Das mache ich jetzt 100.000 Mal und untersuche, welche Altersmittelwerte dabei vorkommen.
R Skript, um 100.000 mögliche Mittelwerte zu dieser Verteilung zu ziehen:
- Code: Alles auswählen
lotto <- function(){
alter <- c(sample(18:24, 64, replace=TRUE),
sample(25:34, 59, replace=TRUE),
sample(35:44, 3, replace=TRUE),
sample(45:54, 4, replace=TRUE),
sample(55:64, 4, replace=TRUE))
return(mean(alter))
}
summary(replicate(100000, lotto()))
Dann erhalte ich als Zusammenfassung der möglichen Alterswerte:
- Code: Alles auswählen
> summary(replicate(100000, lotto()))
Min. 1st Qu. Median Mean 3rd Qu. Max.
26.28 27.01 27.16 27.16 27.30 28.16
Wenn ich jetzt anstelle der Mittelwerte der Alter die Standardabweichung des Alters vereichnen lasse, dann erhalte ich folgende Zusammenstellung:
- Code: Alles auswählen
Min. 1st Qu. Median Mean 3rd Qu. Max.
7.816 8.609 8.764 8.762 8.916 9.665
Man kann also unter o. g. Gleichverteilungsannahme davon ausgehen, dass das durchschnittliche Alter um 27 Jahre mit einer Standardabweichung zwischen 7,5 und 10 gelegen haben wird. Wenn Du willst, darfst Du das gerne benutzen. Ich hoffe nicht, dass es das ist, was Dein Prof. von Dir erwartet.
LG,
Bernhard