Welches Verfahren bei mehreren Kategorien?

Fragen, die sich auf kein spezielles Verfahren beziehen.

Welches Verfahren bei mehreren Kategorien?

Beitragvon biene2 » Di 16. Dez 2014, 13:54

Hallo!
Ich stelle mir die Frage welches Testverfahren für mein Problem geeignet ist. Ich habe Daten von 1500 Patienten und möchte einen Zusammenhang zwischen ihrer Diagnose (eine Variable mit Kategorien 0-4) und insgesamt 12 unterschiedlichen Befunden (die meisten aus Blutabnahme, alles Variablen mit 0 oder 1) untersuchen.
Soweit ich das verstehe kommt eine logistische Regression nicht infrage, weil Diagnose mehr als zwei Kategorien hat. Sonst dachte ich an Chiquadrat Tests, für jeden Befund einen. Wäre das sinnvoll oder gibt es andere Verfahren, die für diese Art von Daten besser geeignet sind?
Ich bedanke mich schon einmal für eure Hilfe!
biene2
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 16. Dez 2014, 13:44
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Welches Verfahren bei mehreren Kategorien?

Beitragvon PonderStibbons » Di 16. Dez 2014, 14:08

Wäre das sinnvoll oder gibt es andere Verfahren, die für diese Art von Daten besser geeignet sind?

Ob das sinnvoll wäre, hängt von Deiner Fragestellung ab
und was Du mit den Ergebnissen anfangen willst. "Einen
Zusammenhang zwischen Diagnose und 12 unterschiedlichen
Befunden untersuchen" ist da noch etwas sehr diffus.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Welches Verfahren bei mehreren Kategorien?

Beitragvon DoctorD » Di 16. Dez 2014, 17:06

Du musst genauer festlegen, welchen Zusammenhang du bei den Daten untersuchen möchtest, um daraus auf die Verfahren zu schließen.
DoctorD
Mitglied
Mitglied
 
Beiträge: 20
Registriert: Do 20. Nov 2014, 14:55
Danke gegeben: 1
Danke bekommen: 1 mal in 1 Post

Re: Welches Verfahren bei mehreren Kategorien?

Beitragvon biene2 » Mo 12. Jan 2015, 12:21

Danke für eure Antworten!
Also im Grunde möchten wir herausfinden ob man durch das Vorhandensein eines bestimmten Blutbildes auf die endgültige Diagnose schließen kann. Also Patienten mit Blutbild XY bekommen eher Diagnose AB als Patienten mit Blutbild YZ.
Ich hoffe das ist etwas verständlicher!

Mit lieben Grüßen,
biene
biene2
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 16. Dez 2014, 13:44
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Welches Verfahren bei mehreren Kategorien?

Beitragvon PonderStibbons » Mo 12. Jan 2015, 12:46

Also Patienten mit Blutbild XY bekommen eher Diagnose AB als Patienten mit Blutbild YZ.

Was ist "Blutbild XY" konkret? Eine Konstellation aus 12 Einzelbefunden?
Oder sollen alle 12 Merkmale jeweils separat auf ihren Zusammenhang
mit Diagnose untersucht werden?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Welches Verfahren bei mehreren Kategorien?

Beitragvon biene2 » Mi 14. Jan 2015, 14:35

Blutbild XY bedeutet die positive Ausprägung von einem der 12 Merkmale. Ich denke alle 12 Merkmale separat zu untersuchen wäre anfangs nicht sinnvoll.
Deshalb würden wir sinnvollerweise die 12 Merkmale in zwei Gruppen unterteilen (1-6 und 7-12). Und dann die Patienten in vier Gruppen teilen:

mind eins positiv in 1-6 und mind eins positiv in 7-12,
positiv in 1-6 und negativ in 7-12,
negativ in 1-6 und negativ in 7-12 sowie
negativ in beiden Merkmalgruppen.

Und dann würden wir die Häuigkeiten der Todesdiagnosen in diesen vier Gruppen darstellen und berechnen ob es Gruppenunterschiede gibt. Welches Verfahren wäre da geeignet?
biene2
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 16. Dez 2014, 13:44
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Welches Verfahren bei mehreren Kategorien?

Beitragvon PonderStibbons » Mi 14. Jan 2015, 15:05

Kreuztabellen mit Chi² Test.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Welches Verfahren bei mehreren Kategorien?

Beitragvon bele » Mi 14. Jan 2015, 16:49

Tut Euch das nicht in der Seele weh? 1500 Datensätze und nachher kommt nicht mehr heraus als eine Analyse von vier Gruppen? Und das Anfangsproblem war, dass man bei mehrstufiger Antwort keine logistische Regression rechnen könne?

@biene2: Sind die Diagnosekategorien nominal oder ordinal? Wenn es nun Verfahren gäbe, mehrstufige Antworten mit logistischer Regression anzugehen, wäre das dann interessant? Oder ist die Vereinfachung auf Vier Gruppen von Befunden medizinisch tatsächlich ausreichend?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

Re: Welches Verfahren bei mehreren Kategorien?

Beitragvon biene2 » Di 20. Jan 2015, 11:09

Die Diagnosekategorien sind nominal. Die Einteilung in die 4 Gruppen erfolgte nicht willkürlich, sondern ist grundsätzlich schon interessant für uns. Das Ergebnis des Chiquadrat Tests ist allerdings nicht signifkant. Es wäre schon interessant, ob es sowas wie eine logistische Regression für dieses Problem gibt.

LG, biene
biene2
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 16. Dez 2014, 13:44
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Welches Verfahren bei mehreren Kategorien?

Beitragvon bele » Di 20. Jan 2015, 11:23

Hallo biene,

ja, es gibt die logistische Regression auch für mehr als nur ein binäres Outcome. Ein geeigneter Suchbegriff für die Suchmaschine Deiner Wahl wäre "multinomiale logistische Regression". Damit könntest Du "je-desto" Zusammenhänge finden.
Denkbar wären ja aber auch deutlich komplexere Zusammenhänge und man könnte überlegen, ob man nicht auf Verfahren des maschinellen Lernens zurückgreift. Ein Klassifikationsbaum oder ein random forest oder ein Neuronales Netz könnte man mit Deinen Daten ohne weiters erstellen und schauen, ob die zu guten Vorhersagen führen. Die Zusammenhänge sind dann nicht so einfach zu erkennen/erläutern, aber dafür werden eben auch U-förmigere oder komplexere oder wenn-dann-Zusammenhänge abbildbar, die dem allgemeinen linearen Modell entgehen können.

Ich weiß, das ist ein großes Feld, aber das Sammeln all der Daten war ja bestimmt auch nicht einfach.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

Nächste

Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 14 Gäste