Hallo zusammen,
in meiner Dissertation untersuche ich unter anderem den Einfluss mehrer Variablen auf Arbeitszufriedenheit (N=124). Das Modell schreibt insgesamt 21 Prädiktoren vor. Die Items, Likert-skaliert auf einer Range von 0-100, werden durch Mittelwerte zu Skalen zusammengefasst. Ich habe zur Untersuchung des Einflusses die multiple Regression genutzt. Mein Betreuer hat mir nun dazu geraten, diesen Ansatz sowohl mit einer best subset regression (AIC Kriterium) als auch mit einer LASSO-Regularisierung/Elastic net (via CATREG) zu vergleichen. Da mir weder LASSO noch Elastic net bisher bekannt war, habe ich versucht, mich darüber schlau zu machen, bin bei der Anwendung in SPSS aber gerade etwas Folgende Punkte habe ich bis jetzt dazu herausgearbeitet:
(1) Da die Funktion Werte <= 0 als fehlend erkennt, habe ich den Wertebereich der Variablen von 0-100 auf 10-110 umgewandelt.
(2) Die Skalierung "numerisch" entspricht intervall-saklierten Daten, die in eine lineare Beziehung gesetzt werden, weshalb ich diese Option auswählen muss.
(3) Als Diskretisierung muss hier entweder "Ränge" oder "Multiplizieren" gewählt werden. "Ränge" entspricht nicht-parametrischen Prozeduren, weshalb "Multiplizieren" gewählt wird (entspricht der linearen Regression).
(4) Der Inkrement kann bei 0,02 belassen werden.
Meine erste Frage ist: Ist das so korrekt?
Meine zweite Frage betrifft eine (Fehler?)Meldung die ich bekomme:
BOOTSTRAP-Beispiele enthalten u. U. eine oder mehrere Zusatzkategorien (nur für Fälle verwendet, die im Beispiel nicht vorkommen).
Was genau bedeutet das?
Schon mal herzlichen Dank. Für Literatur-Tipps bin ich ebenfalls dankbar.
Grüße