beste Item-Kombination finden

Fragen, die sich auf kein spezielles Verfahren beziehen.

beste Item-Kombination finden

Beitragvon KaktusStatistik » Do 29. Apr 2021, 16:59

Hallo zusammen!

Ich habe folgendes Problem:

Es geht um einen Fragebogen mit 49 Items (nominal Skaliert ja/nein). Durch das Ausfüllen des Fragebogens soll man vorhersagen können, ob die Person, die man beobachtet, unter Alkoholeinfluss steht oder nicht. Ein Item ist z.B. "gerötete Augen" oder "verwirrter Eindruck".

In 217 Fällen sagten die Personen, die den Fragebogen ausgefüllt hatten, dass die jeweils beobachtete Person betrunken sei. Ich habe nun diese 217 ausgefüllten Fragebögen und die Resultate, ob die beobachtete Person wirklich betrunken war oder nicht (es wurden Alkoholtests durchgeführt). 80% waren wirklich betrunken, 20% nicht.

Wir fragen uns nun, ob es vielleicht eine Item-Kombination gibt, die am ehesten auf Alkoholeinfluss hinweist. Eine Idee war, dass wir in SPSS ein neuronales Netwerk generieren und so die Wichtigkeit der Items herausbekommen...

Hat jemand eine bessere Idee, wie ich da vorgehen kann?

Vielen Dank!! :)
KaktusStatistik
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 29. Apr 2021, 16:37
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: beste Item-Kombination finden

Beitragvon PonderStibbons » Do 29. Apr 2021, 18:18

In 217 Fällen sagten die Personen, die den Fragebogen ausgefüllt hatten, dass die jeweils beobachtete Person betrunken sei.

Die haben die 49 Items beantwortet und dann nochmal einen generellen Eindruck geschildert ("ist betrunken ja/nein")?
Und wo sind diejenigen, die den Eindruck hatten, die Person sei nüchtern? Der Datensatz wirkt unvollständig.

Vielleicht schilderst Du einmal das Erhebungsdesign, wer hat was wann bei wem beobachtet und ausgefüllt.
Ich habe nun diese 217 ausgefüllten Fragebögen und die Resultate, ob die beobachtete Person wirklich betrunken war oder nicht (es wurden Alkoholtests durchgeführt). 80% waren wirklich betrunken, 20% nicht.

Alle der 80% gleich stark alkoholisiert?
Wir fragen uns nun, ob es vielleicht eine Item-Kombination gibt, die am ehesten auf Alkoholeinfluss hinweist. Eine Idee war, dass wir in SPSS ein neuronales Netwerk generieren und so die Wichtigkeit der Items herausbekommen...

Könnt Ihr denn das, ein neuronales Netzwerk generieren?

Hat jemand eine bessere Idee, wie ich da vorgehen kann?

Mir ist der unmittelbare Zweck "die Wichtiigkeit der Items herausbekommen" und das dahinter stehende Anliegen nicht so
recht klar. Wie lautet die Forschungsfrage, wie gsagt das Erhebungsdesign, und was soll mit den Ergebnissen geschehen?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: beste Item-Kombination finden

Beitragvon KaktusStatistik » Fr 30. Apr 2021, 07:51

Hallo PonderStibbons!

PonderStibbons hat geschrieben:Die haben die 49 Items beantwortet und dann nochmal einen generellen Eindruck geschildert ("ist betrunken ja/nein")?
Und wo sind diejenigen, die den Eindruck hatten, die Person sei nüchtern? Der Datensatz wirkt unvollständig.

Vielleicht schilderst Du einmal das Erhebungsdesign, wer hat was wann bei wem beobachtet und ausgefüllt.


Es ist eine retrospektive Datenanalyse. Ganz grob erklärt, hatten Pflegefachleute Personen, die ins Spital kamen, beobachtet. Es machte immer nur eine Person die Beobachtung. Der Datensatz besteht also aus Daten von unterschiedlichen Beobachtern/Beobachteten zu verschiedenen Zeitpunkten. Nun ist es so, dass die Beobachter die 49 Items nur dann ausfüllten, wenn sie den Verdacht hatten, dass die Person unter Alkoholeinfluss stand. Es existieren somit keine Daten von denjenigen, die den Eindruck hatten, die Person sei nüchtern.

PonderStibbons hat geschrieben:Alle der 80% gleich stark alkoholisiert?


Nein es waren nicht alle gleich stark alkoholisiert. Alle mit >= 0.5 Promille wurden als betrunken definiert.

PonderStibbons hat geschrieben:Könnt Ihr denn das, ein neuronales Netzwerk generieren?


In SPSS ja. Aber es gibt zu viele Punkte, in denen ich unsicher bin. Deshalb möchte ich eher eine andere Methode anwenden.

PonderStibbons hat geschrieben:Mir ist der unmittelbare Zweck "die Wichtiigkeit der Items herausbekommen" und das dahinter stehende Anliegen nicht so
recht klar. Wie lautet die Forschungsfrage, wie gsagt das Erhebungsdesign, und was soll mit den Ergebnissen geschehen?


Wir wollen untersuchen, ob es eine Kombination von Items gibt, mit der man mit hoher Wahrscheinlichkeit sagen kann, dass die Person betrunken (>= 0.5 Promille) ist. Für das vergleichen wir die ausgefüllten Fragebogen der Gruppe 1 (beobachtete Personen waren wirklich betrunken) mit der Gruppe 2 (beobachtete Personen waren nicht betrunken).
KaktusStatistik
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 29. Apr 2021, 16:37
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: beste Item-Kombination finden

Beitragvon strukturmarionette » Fr 30. Apr 2021, 08:26

Hi,

- dann bringt die Items zunächst durch Auszählen in die gewünschte Reihenfolge
- welche Merkmale wollt ihr vergleichen?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: beste Item-Kombination finden

Beitragvon bele » Fr 30. Apr 2021, 08:30

Hallo Kaktus,

ich finde ein Neuronales Netz auch nicht so prall. Weder sind 217 Personen eine so erschlagende Anzahl von Fällen, noch ist mit komplizierten Interaktionen zwischen den Items zu rechnen.
Ich würde wahrscheinlich mit einer ganz einfachen logistischen Regression beginnen, hätte dabei aber schon im Hinterkopf, später auf eine logistische LASSO-Regression überzugehen. Das ist im Prinzip das gleiche, aber die LASSO-Regression versucht, Koeffizienten auf Null zu setzen und damit überflüssige Prädiktoren auszuschalten. Dafür gibt es einen Steuerungsparameter Lambda, mit dem man festlegt, wie entschlossen LASSO versucht, Parameter herauszukicken. Du willst ja Deinen Beobachtungsbogen eindampfen, um später mit einer kürzeren Version weiter zu machen. Über lambda könntest Du steuern, wie klein der Bogen werden soll.

Wenn Du unbedingt ein Blackbox-Verfahren anwenden möchtest, dann würde ich Dir einen RandomForest empfehlen. Im Gegensatz zum Neuronalen Netz neigen RandomForests nicht zum Overfitting und Du musst weniger Hyperparameter tunen als beim eXtreme Gradiend Boosting. RandomForest sind deshalb einfach anzuwenden. Außerdem gibt es sehr ausgefeilte Methoden, eine "Variable Importance", also ein Maß für die Wichtigkeit der verschiedenen Items, zu berechnen.

Ich habe keine Ahnung, wie gut beides in SPSS vertreten ist. Ich habe gelesen, dass SPSS inzwischen eine Schnittstelle zu R hat und wie man in R LASSO-Regressionen und mehr noch RandomForests berechnet, davon läuft Youtube über.

LG,
Bernhard



PS: Zur künstlichen Dichotomisierung von Alkoholisiertheit wird PonderStibbons bestimmt noch was schreiben.
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5917
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts

folgende User möchten sich bei bele bedanken:
KaktusStatistik

Re: beste Item-Kombination finden

Beitragvon PonderStibbons » Fr 30. Apr 2021, 09:40

Ein ja/nein-Kriterium mit 0,5 Promille leuchtet mir nicht recht ein, auch wenn es im klinischen Alltag
so gehandhabt werden mag. Habt Ihr nicht Zugriff auf die Messwerte vor der Dichotomisierung?

Als Ausgangspunkt werden mit 49 Variablen de facto ca. 44 Fälle vorhergesagt (die kleinere Gruppe
ist maßgeblich), wenn auch mit dem Ziel, die Zahl Prädiktoren zu verringern. Das ist ein Missverhältnis.
LASSO wie von bele vorgeschlagen wäre denkbar. Ich würde dem Ergebnis aber nicht gerne vertrauen,
es sei denn, die Zusammenhänge sind sehr markant (aber dann würde sich die Frage stellen, wozu
überhaupt so eine Studie).

Wieso gleich 49 Kriterien, wo stammen die her? Checklisten haben meist weitaus weniger Kriterien
(10 bis 12), mit zusätzlichen Erläuterungen (sowas wie: Kriterium "auffallender Geruch" (z.B. Schweiß,
Alkohol, Urin)". Kann man die Zahl nicht von vornherein durch Ausschluss von Items verringern,
d.h. ohne Ansehen der Daten, sondern auf Basis von Referenzstudien? Man könnte, statt das
Rad neu erfinden zu wollen, an eine Validierungsstudie denken, in der ermittelt wird, wie
gut eine bestehende Checkliste (in den Items quasi enthalten) im klinischen Alltag zwischen
tatsächlich und nur mutmaßlich Alkoholisierten unterscheidet.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
KaktusStatistik

Re: beste Item-Kombination finden

Beitragvon strukturmarionette » Fr 30. Apr 2021, 10:25

Hi,

- gewiss ist immer das fachliche erstrangig relevant
- dann ist deskriptives interessant
- die Möglichkeiten von Computerprogrammierung ist dann ein (zu einem großen Teil sinnloses) Unendlichkeitsuniversum

- auch wenn es hier kein C oder R oder SPSS Forum ist:
https://www.ibm.com/docs/de/spss-statis ... perceptron

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

folgende User möchten sich bei strukturmarionette bedanken:
KaktusStatistik

Re: beste Item-Kombination finden

Beitragvon KaktusStatistik » Fr 30. Apr 2021, 18:29

Danke euch allen für die schnellen und ausführlichen Antworten!! Ich werde mir eure Ideen/Tipps in Ruhe anschauen und mir alles noch einmal durch den Kopf gehen lassen.
KaktusStatistik
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 29. Apr 2021, 16:37
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 11 Gäste

cron