Ein gutes Modell bei vielen uV

Fragen, die sich auf kein spezielles Verfahren beziehen.

Ein gutes Modell bei vielen uV

Beitragvon integral » Do 19. Jan 2012, 17:25

Hallo zusammen,
ich habe eine sehr allgemeine Frage zu Modellen. Und zwar ist es so, dass ich eine Arbeit über Kriminalitätsfurcht (KF) schreiben sollte.
Nun gibt es extrem viele Theorien, die KF-Unterschiede erklären können und entsprechend habe ich auch extrem viele uV, die erwiesenermassen
mit KF bivariat in einem Zusammenhang stehen (Geschlecht, Vulnerabilität, Alter, etc.).

Das Problem liegt nun aber darin, dass meine uV praktisch alle selbst untereinander korreliert sind (typisch Sozialforschung!). Nun stellt sich mir die Frage,
wie ich zu einem "guten" Modell komme? Ich kann ja schlecht eine Regression mit 20, 30 uV durchführen?

Zunächst hatte ich ja mal daran gedacht, ein Strukturgleichungsmodell aufzustellen, aber weil - wie gesagt - es theoretisch so viele kausale Zusammenhänge
der uV gibt, wäre mein Modell ziemlich gesättigt. Wie ist da das allgemeine Vorgehen? (ich hoffe, ich habe mich einigermassen verständlich ausgedrückt)

Vielen Dank für eure Antworten!
integral
Power-User
Power-User
 
Beiträge: 57
Registriert: Fr 17. Jun 2011, 10:08
Danke gegeben: 4
Danke bekommen: 2 mal in 2 Posts

Re: Ein gutes Modell bei vielen uV

Beitragvon PonderStibbons » Do 19. Jan 2012, 19:59

(typisch Sozialforschung!).

Dann müsste es doch passende Verfahrensweisen in dem Bereich geben,
wie mit dem Problem umzugehen ist. Man sieht sowas zum Beispiel in
ähnlich gelagerten Studien und kann sich dann da was abschauen.
Nun stellt sich mir die Frage, wie ich zu einem "guten" Modell komme?

Was ist für Dich "gut", was soll das Modell leisten? Kriterien für "gute"
Modelle variieren je nach Ziel der Modellbildung. Offensichtlich geht
es ja nicht Testung einer bestehenden Theorie bzw. Hypothese.
Ich kann ja schlecht eine Regression mit 20, 30 uV durchführen?

Eher nicht. Das wäre meist ein Beispiel für schlechte theoretische Vorarbeit
bzw. unklare Ziele. Wenn je Prädiktor 20-30 Fälle vorliegen, kann man aber
schon eine Studie mit vielen Prädiktoren in Betracht ziehen, ggfls. mit einer
Vorauswahl-Stufe.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Ein gutes Modell bei vielen uV

Beitragvon integral » Di 24. Jan 2012, 14:33

Eher nicht. Das wäre meist ein Beispiel für schlechte theoretische Vorarbeit
bzw. unklare Ziele. Wenn je Prädiktor 20-30 Fälle vorliegen, kann man aber
schon eine Studie mit vielen Prädiktoren in Betracht ziehen, ggfls. mit einer
Vorauswahl-Stufe.


Da liegt genau mein Problem. Je länger ich mich theoretisch damit befasse, desto mehr Theorien
finde ich, die auch noch weitere erklärende Variablen untersuchen. Letztlich habe ich nun dutzende
Theorien, die meine aV erklären, aber die uVs sind zahlreich und meist auch noch miteinander
korreliert.

Unter einem "guten" Modell verstehe ich eines, das mir (auf zulässige Art und Weise) möglichst viel Varianz
der uV erklären kann.
integral
Power-User
Power-User
 
Beiträge: 57
Registriert: Fr 17. Jun 2011, 10:08
Danke gegeben: 4
Danke bekommen: 2 mal in 2 Posts

Re: Ein gutes Modell bei vielen uV

Beitragvon PonderStibbons » Di 24. Jan 2012, 15:23

"Möglichst viel Varianz aufklären" ist kein wissenschaftliches Ziel.

Wie groß ist überhaupt die Stichprobe und wie viele Prädiktoren kommen in Frage für die Studie?



Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Ein gutes Modell bei vielen uV

Beitragvon integral » Mi 25. Jan 2012, 11:22

Also insgesamt sind es etwa 380 Variablen. Wobei ich mal schätzen würde, dass ich ca. 40 zur Erklärung meiner aV verwenden könnte (weil sie in Theorien erwähnt werden). Aus einigen dieser Items werden aber noch Skalen gebildet. Das n ist 2'000.
integral
Power-User
Power-User
 
Beiträge: 57
Registriert: Fr 17. Jun 2011, 10:08
Danke gegeben: 4
Danke bekommen: 2 mal in 2 Posts

Re: Ein gutes Modell bei vielen uV

Beitragvon PonderStibbons » Mi 25. Jan 2012, 16:39

Wenn überhaupt keine theoretischen Annahmen einfließen sollen und auch keine
etwas komplexeren Beziehungen mit getestet werden (wie z.B. Moderator-Effekte
oder Mediatorwirkungen), dann kann man
1. einen Teil der Stichprobe (z.B. 1/3) als Validierungsstichprobe beiseite nehmen,
2. mit dem übrigen Teil (Trainigsdatensatz) eine -> schrittweise multiple Regression
mit -> Vorwärts-Selektion oder mit -> Rückwärts-Selektion der 40 Kandidatenvariablen
rechnen, und
3. das resultierende Modell anhand der Validierungsstichprobe -> kreuzvalidieren
(cross validation), d.h. die ermittelte Regressionsgleichung hernehmen, in diese
die Prädiktor-Daten der Validierungsstichprobe einsetzen, und Vorhersagequalität
des Regressionsmodells in diesem Validierungsdatensatz mit derjenigen im
Trainingsdatensatz vergleichen.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Ein gutes Modell bei vielen uV

Beitragvon integral » Sa 11. Feb 2012, 23:41

Hallo PonderStibbons,

Ich habe das mit der Kreuzvalidierung einmal ausprobiert (allerdings noch nicht mit dem richtigen Modell) und man muss noch dazu sagen, dass ich erst Pretest-Daten habe (n=120). Das Modell (multiple lineare Regression) mit vier Prädiktoren ergibt ein R2 von knapp 20%.

Für die Kreuzvalidierung (2 Gruppen) bekomme ich folgende Werte:

Fold 1: Sum of squares = 74 Mean square = 1.2 n = 60
Fold 2: Sum of squares = 92 Mean square = 1.5 n = 60
Overall ms
1.38

Aber was sagt mir das denn nun? Fold 1 scheint ja besser zu sein...
integral
Power-User
Power-User
 
Beiträge: 57
Registriert: Fr 17. Jun 2011, 10:08
Danke gegeben: 4
Danke bekommen: 2 mal in 2 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 6 Gäste