Hallo zusammen,
ich bin einer der vermutlich auch in diesem Forum geliebten Unwissenden mit einem für mich selbst nicht lösbaren Problem.
Das letzte Mal mit Statistik zu tun hatte ich im Studium und nun sitze ich vor einer vermeintlich einfache Fragestellung und komme schlichtweg auf keinen Ansatz.
Folgender Sachverhalt: Ich habe eine Liste mit ermittelten Zeichenzahlen von Texten und zwei möglichen Textarten (Titel und Beschreibung). Titel haben entsprechend im Durchschnitt weniger Zeichen, Beschreibungen mehr.
Ich würde nun gerne berechnen, ab welcher Zeichenzahl es wahrscheinlicher ist, dass es sich um eine Beschreibung handelt, als um einen Titel bzw. ab welcher Zeichenanzahl ich mit z.B. 60/70/80% Sicherheit davon ausgehen kann, dass es sich um eine Beschreibung und keinen Titel handelt.
Die Verteilung sieht dabei wie folgt aus:
Titel - Zeichenanzahl:
<10 1,8%
10-20 22,9%
21-40 47,7%
41-60 22,0%
61-80 4,6%
>80 0,9%
Beschreibung - Zeichenanzahl:
<10 0,0%
10-20 0,5%
21-40 6,0%
41-60 14,6%
61-80 12,1%
>80 66,8%
Gesamt - Zeichenanzahl:
<10 1,0%
10-20 13,1%
21-40 32,2%
41-60 26,6%
61-80 14,6%
>80 67,3%
Ist mein Anliegen anhand diese Angaben überhaupt berechenbar? Falls ja, welches Verfahren bzw. welche Formel ist hierbei anzuwenden?
Ich bedanke mich vielmals und sehr herzlich im Voraus, sollte sich hier eine Lösung finden. Es würde mir sehr weiterhelfen!
Viele Grüße
Mikkel