Eine kontinuierliche Variable zum Zweck weiterer Analysen in Kategorien einzuteilen, ist oft unzweckmäßig und in der Regel irreführend und schädlich.
Es vernichtet die Informationen, die in der Ausgangsvariable stecken. Es kann zu irreführenden Resultaten führen. Es ist inhaltlich fragwürdig.
Als ein absolutes no-go gilt die Dichotomisierung am Stichprobenmedian.
In den meisten Fällen ist es überflüssig, Gruppen zu bilden, weil statistische Verfahren existieren, welche die Ausgangsvariable verwenden können.
Wir werden dies bei Gelegenheit weiter ausführen.
Einige Referenzen zum dem Thema:
* Cohen, Jacob (1983). The Cost of Dichotomization. Applied Psychological Measurement, 7: 249–253
* Altman, D. (1991). Categorising Continuous Variables. British Journal of Cancer, 64: 975.
* Fernandes A et al. (2019) Why Quantitative Variables Should Not Be Recoded as Categorical. Journal of Applied Mathematics and Physics, 7: 1519-1530
* Maxwell, S.E. & Delaney, H.D. (1993). Bivariate-Median-Splits-and-Spurious-Statistical-Significance.pdf.Psychological Bulletin, 113: 181-190.
* Kuss, Oliver (2013). The Danger of Dichotomizing Continuous Variables: A Visualization. Teaching Statistics, 35: 78-79
* Taylor, J.M.G. & Yu, M. (2002). Bias and Efficiency Loss Due to Categorizing an Explanatory Variable. Journal of Multivariate Analysis, 83: 248-263.
* Irwin, J.R. & McClelland, G.H. (2003). Negative Consequences of Dichotomizing Continuous Predictor Variables. Journal of Marketing Research, 40: 366-371