Hallo zusammen, ich kenne zwar die Grundlagen der Clusteranalyse, jedoch habe ich ein Problem mit folgender Abwandlung. Könntet ihr mir helfen?
Die Punkte der Stichprobe n besitzen zwei Eigenschaften a und b. Während a genau bestimmbar sind, ist b lediglich statistisch zuordbar. Das heißt mal ist es bspw. 0, mal 1, mal 2 und der Unterschied untereinander wird sich erst in einem Cluster mit mehreren Proben auswirken. Wenn ich nun die "klassische" Clusteranalyse durchführe, würden sich alle 0, 1 und 2 Werte zusammen finden. Ich möchte aber vorgeben, dass in einem Cluster nur Punkte vorkommen, wenn Sie mit einem anderem Punkt in der anderen Eigenschaften angrenzen.
Bspw.: Es gibt 100 Punkte. Eigenschaft a ist: 1,2,3,4 ...100. Eigenschaft b ist mal 0, mal 1, mal 2. Ich möchte die 100 Punkte nun in bspw. drei Cluster einteilen, sodass die Varianz von Eigenschaft b minimiert wird. Die Cluster sind aber nicht frei wählbar sondern sind ein Kontinuum von Eigenschaft a.
Denkbares Ergebnis: Cluster (1): Punkt 1-30 Cluster (2): Punkt 31-50 Cluster (3): Punkt 50-100
Am Ende soll die Varianz in jedem Cluster in Bezug auf Eigenschaft b minimiert werden. Ich würde später neben a noch weitere diskrete Eigenschaften hinzufügen wollen.
Ich habe das mal versucht aufzuzeichnen: https://picload.org/view/dldlogiw/clust ... m.png.html
Kann mir jemand helfen?
Viele Grüße und vielen Dank im Voraus!
Jan