STATISTIK-FORUM.de

Souvite · von **Souvite** » Mo 3. Mär 2014, 17:26

Hallo zusammen,

ich schreibe gerade an meiner Masterarbeit und habe ein Problem mit der Berechnung von Wahrscheinlichkeiten. Ich habe leider keine Ahnung, in welches spezielle Forum diese Frage gehört, daher stelle ich sie hier unter Allgemeine Fragen.

Genauer geht es bei meiner Arbeit darum, dass ich einen Algorithmus zur Unterscheidung von produktivem und trockenen Husten entwickle. Dafür habe ich verschiedene Merkmale (5 Stück) extrahiert. Für jedes Merkmal habe ich anhand von bewerteten Daten eine Häufigkeitsverteilung erstellt, aus der ich je nach Merkmalsausprägung eine Wahrscheinlichkeit für das Vorliegen von produktivem bzw. trockenem Husten ermittelt habe. Jetzt weiß ich allerdings nicht, wie ich diese fünf Wahrscheinlichkeiten zusammenrechnen kann. Bzw. ob ich vorher auch noch einen Test auf Unabhängigkeit der Merkmale machen muss und falls dem so ist, was ich da für einen Test anwenden kann.

Vielen Dank!

Souvite · von **Souvite** » Mi 5. Mär 2014, 16:13

Hallo,

da ich bisher keine Antwort bekommen habe, versuche ich mein Problem noch mal genauer zu beschreiben, in der Hoffnung, dass mir dann jemand weiterhelfen kann!

Ich habe Hustenereignisse aufgenommen, sowohl trockene als auch produktive. Daraus habe ich ein Lernset erstellt, in dem 230 trockene und 28 produktive Ereignisse sind und die ich manuell entsprechend eingeteilt habe. Mein Algorithmus soll diese Einteilung nun automatisch durchführen. Dafür habe ich fünf verschiedene Eigenschaften des Signals analysiert. Die Ergebnisse, die sich daraus ergeben, habe ich klassifiziert und in Form von Häufigkeitsverteilungen in Diagrammen dargestellt (siehe angehängte Datei: Bsp für zwei Eigenschaften). Die aufgetragenen Häufigkeiten sind dabei keine Absolut- sondern Relativwerte, um trockene und produktive Ereignisse vergleichbar zu machen (wegen der geringen Anzahl an produktiven Ereignissen im Vergleich zu den trockenen). Aus diesen Verteilungen habe ich für jede Klasse eine Wahrscheinlichkeit für produktiven Husten errechnet, indem ich die Relativhäufigkeit des produktiven Hustens durch die Summe beider Relativhäufigkeiten geteilt habe.

Wenn ich nun für ein neues Hustenereignis automatisch berechnen will, mit welcher Wahrscheinlichkeit es sich um produktiven (bzw. trockenen) Husten handelt, kann ich für jede Eigenschaft eine Klassifizierung durchführen, habe dann aber fünf Wahrscheinlichkeiten.

Wenn ich das auf die angehängten Diagramme beziehe, dann habe ich bspw. ein Husten, das nach Eigenschaft 1 in die mittlere Klasse fällt und damit eine Wahrscheinlichkeit von 0,89 für produktiven Husten hat. Eigenschaft 2 ergibt eine Wahrscheinlichkeit von 0,84, da das Ereignis in die erste Klasse fällt. Diese Wahrscheinlichkeiten möchte ich nun zusammenrechnen. Da beide Wahrscheinlichkeiten recht hoch sind, gehe ich davon aus, dass ich schon recht sicher sagen kann, dass es sich um produktiven Husten handelt und die durchschnittliche Wahrscheinlichkeit einen zu geringen Wert darstellen würde. Von bedingter Wahrscheinlichkeit kann man hier denke ich auch nicht sprechen, da das ja zu noch geringeren Wahrscheinlichkeitswerten führen würde.

Vielleicht ist die Lösung dieses Problems total simpel, vielleicht ist mein Ansatz aber auch schon total falsch??
Ich wäre auf jeden Fall sehr dankbar, wenn mir jemand einen Tipp geben könnte, ob das was ich bisher gemacht habe statistisch in Ordnung ist und wie ich an dieser Stelle weiter machen kann!

Viele Grüße

PonderStibbons · von **PonderStibbons** » Do 6. Mär 2014, 20:02

Vermutlich kann ich selber da nicht helfen, aber der Kontext ist
sehr unklar. Was für ein Fach ist das denn, in dem die Magister
Arbeit stattfindet, und welches theroetisches/praktisches
Problem soll hier gelöst werden?

Mit freundlichen Grüßen

P.

Souvite · von **Souvite** » Sa 8. Mär 2014, 17:55

Zunächst vielen Dank für die Rückmeldung!

Ich bin selbst schon etwas weitergekommen, aber das Kernproblem, dass ich nicht weiß, wie ich die Wahrscheinlichkeiten am besten verrechnen kann ist nach wie vor vorhanden. Ich habe mir noch mal Gedanken darüber gemacht, wie ich das am Besten erläutern kann. Runtergebrochen auf ein Beispiel würde ich es anders so erklären:

Ich habe zwei Testverfahren für eine Erkrankung. Das Ergebnis ist jeweils, erkrankt oder nicht erkrankt. Der eine Test hat eine maximal mögliche Wahrscheinlichkeit von 90%, dass die Person erkrankt ist. Genauer ist dieser Test nicht. Für den zweiten Test liegt diese maximale Wahrscheinlichkeit bei 75%. Um ein möglichst sicheres Ergebnis zu erhalten, führe ich beide Tests durch.
Das Ergebnis des ersten Tests besagt, dass meine Person zu 70% erkrankt ist, der zweite Test ergibt eine Wahrscheinlichkeit von 65%. Kann ich diese beiden Wahrscheinlichkeiten zu einer Gesamtwahrscheinlichkeit zusammenrechnen und wenn ja, wie mache ich das?

Viele Grüße

STATISTIK-FORUM.de

Berechnung von Wahrscheinlichkeiten

Berechnung von Wahrscheinlichkeiten

Re: Berechnung von Wahrscheinlichkeiten

Re: Berechnung von Wahrscheinlichkeiten

Re: Berechnung von Wahrscheinlichkeiten

Wer ist online?