STATISTIK-FORUM.de

Mikkel · von **Mikkel** » Mo 23. Okt 2023, 11:53

Hallo zusammen,

ich bin einer der vermutlich auch in diesem Forum geliebten Unwissenden mit einem für mich selbst nicht lösbaren Problem.

Das letzte Mal mit Statistik zu tun hatte ich im Studium und nun sitze ich vor einer vermeintlich einfache Fragestellung und komme schlichtweg auf keinen Ansatz.

Folgender Sachverhalt: Ich habe eine Liste mit ermittelten Zeichenzahlen von Texten und zwei möglichen Textarten (Titel und Beschreibung). Titel haben entsprechend im Durchschnitt weniger Zeichen, Beschreibungen mehr.
Ich würde nun gerne berechnen, ab welcher Zeichenzahl es wahrscheinlicher ist, dass es sich um eine Beschreibung handelt, als um einen Titel bzw. ab welcher Zeichenanzahl ich mit z.B. 60/70/80% Sicherheit davon ausgehen kann, dass es sich um eine Beschreibung und keinen Titel handelt.

Die Verteilung sieht dabei wie folgt aus:
Titel - Zeichenanzahl:
<10 1,8%
10-20 22,9%
21-40 47,7%
41-60 22,0%
61-80 4,6%
>80 0,9%

Beschreibung - Zeichenanzahl:
<10 0,0%
10-20 0,5%
21-40 6,0%
41-60 14,6%
61-80 12,1%
>80 66,8%

Gesamt - Zeichenanzahl:
<10 1,0%
10-20 13,1%
21-40 32,2%
41-60 26,6%
61-80 14,6%
>80 67,3%

Ist mein Anliegen anhand diese Angaben überhaupt berechenbar? Falls ja, welches Verfahren bzw. welche Formel ist hierbei anzuwenden?

Ich bedanke mich vielmals und sehr herzlich im Voraus, sollte sich hier eine Lösung finden. Es würde mir sehr weiterhelfen!

Viele Grüße

Mikkel

PonderStibbons · von **PonderStibbons** » Mo 23. Okt 2023, 12:11

Ist davon auszugehen, dass bei den zukünftigen Entscheidungen die Zahl der Titel = Zahl der Beschreibungen ist,
oder ist das Verhältnis ungleich?

Mit freundlichen Grüßen

PonderStibbons

Mikkel · von **Mikkel** » Mo 23. Okt 2023, 12:16

PonderStibbons hat geschrieben:Ist davon auszugehen, dass bei den zukünftigen Entscheidungen die Zahl der Titel = Zahl der Beschreibungen ist,
oder ist das Verhältnis ungleich?

Mit freundlichen Grüßen

PonderStibbons

Genau, richtig. Zu jedem Titel gehört eine Beschreibung.

PonderStibbons · von **PonderStibbons** » Mo 23. Okt 2023, 13:01

Damit kannst Du die Werte der ersten Tabelle durch die Summenwerte der ersten + zweiten Tabelle dividieren.
Beispielsweise für "21-40" hieße dies 47,7 / (47,7 + 6,0)= 0.888 . Die Wahrscheinlichkeit, dass ein Text der Länge "21-40"
ein Titel ist, beträgt 0,888 oder 88,8%. Entsprechend für die anderen Textlängen.

HTH

PonderStibbons

STATISTIK-FORUM.de

Verfahrens- bzw. Formelsuche

Verfahrens- bzw. Formelsuche

Re: Verfahrens- bzw. Formelsuche

Re: Verfahrens- bzw. Formelsuche

Re: Verfahrens- bzw. Formelsuche

Wer ist online?