Hallo,
ich bin neu in diesem Forum und es tut mir Leid, dass ich gleich mit einem Problem zu euch komme. Im Vorfeld habe ich bereits versucht eine Lösung über Google und die forumsinterne Suchfunktion zu finden, aber vergebens...
Zur Zeit schreibe ich an meiner BA und bin bei der Auswertung der Daten. Diese erfolgt mit Stata. Der Datensatz umfasst 1.127 Beobachtungen und Ziel ist es, eine multiple Regressionsanayse durchzuführen.
Bei einem Teil der unabhängigen Variablen handelt es sich um von mir geschaffene Dummy-Variablen. Da ich vermute, dass diese einen signifikanten Einfluss auf meine Zielgröße haben, würde ich diese -wenn möglich- in die Regressionsgleichung aufnehmen. Allerdings habe ich bei manchen Dummy-Variablen das Problem, dass die Anzahl der jeweiligen Ausprägung unterschiedlich häufig vorkommt. Beispielsweise die absoluten Häufigkeiten des jeweiligen Geschlechts: 1(männlich)=20 und 0(weiblich)=1.107.
Nun zu meinen Fragen:
Ist die Anzahl an männlichen Beobachtungen viel zu gering oder noch vertretbar? Gibt es vielleicht einen Richtwert (z.B. ab 30 (männlichen) Beobachtungen) oder spielt die relative Häufigkeit eine Rolle?
In diesem Zusammenhang habe ich auch gelesen, dass bei geringen Fallzahlen die größere Ausprägung als Referenzgröße dienen soll. Bei mir sollte es passen, da meine Referenzgröße weiblich ist oder täusche ich mich hier?
Liebe Community, es wäre sehr schön, wenn ihr mir bei meinen Fragen weiterherlfen könntet. Irgendwie stehe ich da auf dem Schlauch
Vielen Dank
LG
Olaf