Hallo in die Runde!
Ich will Preise in Cluster fassen und finde mit meinem schon etwas älterem Mathewissen nicht den richtigen Algorithmus. Ich habe es mit dem Average Linkage probiert, habe aber das Problem der fehlenden (und deshalb fest codierten) Abbruchbedingung.
Problem:
Gruppiere unten stehende Preise zu möglichst engen Clustern, wobei die Clusterbreite trotzdem dynamisch bleibt. Bisher sage ich in etwa "nimm den nächsten Punkt auf, solange der Abstand (Cluster-Durschnitt zu nächstem Punkt) < 6 ist. Diese festen x Punkte stören mich aber. Ich brauch etwas, was einen an der Clustergrenze liegenden Punkt mit rein nimmt, aber auch mal einen Punkt einzeln stehen lässt. Theoretisch kann ich mir auch was mit Zuordnungswahrscheinlichkeiten vorstellen (Punkt gehört zu 0,6 in Cluster a und zu 0,4 in Cluster b).
Vielleicht habe ich ja Glück und mir kann jemand einen kleinen Denkanstoß oder Hinweise mit Beispielen geben (b.t.w. Implementierung mache ich in Java).
Vielen Dank!
Beispiel der zu clusternden Preise:
6600.0
6556.656666666668
6527.879999999998
6500.0
6499.784550202477
6465.953333333334
6414.656666666668
6407.709999999999
6400.0
6384.996185995188
6369.07891660741
6364.69994459493
6362.309393932588
6329.402943977973
6328.632141813127
6323.953333333334
6318.559999999999
6300.0
6298.876658937814
6281.147128909148
6272.656666666668
6249.768989886802
6234.210326168327
6221.308366961625
6200.0
6198.389999999999
6181.953333333334
6130.656666666668
6109.239999999999
6100.0
6000.0
5989.07
5900.0
5899.919999999999