in 2 statistisch sinnvolle klassen
"statistisch sinnvolle Klassen" klingt merkwürdig. Wozu soll denn die Einteilung erfolgen, was wird mit den Klassen weiter gemacht?
Dichotomisieren ist fast durchweg sinnlos, u.a. weil damit Fälle, die einander sehr ähnlich sind (in der Nähe der Klassengrenze liegen) als verschieden behandelt werden, während Fälle, die de facto sehr verschieden sind (z.B. einer knapp unter der Klassengrenze, der andere mit einem ganz niedrigen Wert) als "gleich" geführt werden. Zudem führt diese Dichotomisiererei zur willkürlichen Vernichtung von Informationen, die in den Intervalldaten steck(t)en.
http://biostat.mc.vanderbilt.edu/wiki/M ... Continuoushttp://citeseerx.ist.psu.edu/viewdoc/do ... 1&type=pdfWenn es absolut nottut, wäre eher eine Einteilung in 3 statt 2 Klassen sinnvoll, dann kann man sicher sein, dass sich die die Fälle beiden 'äußeren" Klassen unterscheiden.
Einige Vorgehensweisen beim Dichotomisieren sind hier enthalten
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1458573/ - Dichotomisieren könnte man am Stichproben-Median, das ergäbe 2 gleich große Klassen, wäre aber nicht übertragbar (weil der Stichproben-Median bei einer anderen Stichprobe ziemlich sicher ein anderer wäre). Man könnte sich auch ein Histogramm ansehen und beurteilen, ob eine 2gipflige Verteilung vorliegt (hier vermutlich nicht). Man könnte Vorwissen/Vorannahmen heranziehen und anhand dessen eine inhaltlich begründete Einteilung vornehmen. Man könnte den Populations-Median nehmen, sofern man Informationen darüber hat.
gibt es da irgendeine formel bzw. regel bei welchem alter ich da die grenze ziehe?
Wie gesagt, die Regel lautet eigentlich: "lass es bleiben". Wenn nicht, dann wäre wichtig zu wissen, wozu das eigentlich gut sein soll.
Mit freundlichen Grüßen
PonderStibbons