von daniel » Sa 22. Jun 2013, 14:22
Der Beitrag hat viel Potential zur Verwirrung beizutragen. Hier einige Vorschläge etwas Licht ins Dunkel zu bringen.
1. Ersetze "Daten" im gesamten Post durch "Variablen"
2. Statistische Verfahren sind ausnahmslos mit "numerischen" Variablen möglich. Das hat den Grund, dass man mit string (i.e. Text) Variablen nicht rechnen kann. Kategoriale (nicht: kategorische) Variablen sind numerische Variablen. Relevanter als dieser Untersched ist das Skalenniveau der Variablen. Diese können nach Auffassung Vieler grob qualitativ (nominal, ordinal) oder quantitativ (auch metrsich, i.e. intervall, Ratio) sein.
3. Was sind "normale" Verfahren oder eine "normale" Regresion? Mit letzterem meinst Du vermutlich eine lineare Regression.
4. Im Rahmen jeglicher Regressionsanalyse ist eine weitere Unterscheidung der Variablen in outcome (endogene Variable, abhängige Variable o.ä.) und Prädikator (Kovariate, unabhängige Variable o.ä.) sinnvoll. Die Art des Regressionsmodells (z.B. linear, binär logistisch, multinomisch, ordinal, poisson, negativ-binomial etc.) wird i.d.R. vom Skalenniveau des outcomes bestimmt. Als Prädikatoren können in jeder Regressionsanalyse Varialen jedes Skalenniveaus verwendet werden, wobei qualitative Variablen meist als Indiaktorvariablen (auch Dummies) umgesetzt werden.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.