Ich soll eine Hausarbeit über die k-Means-Cluster-Methode schreiben. Es soll ein einfaches Fallbeispiele in R implementiert werden und die entsprechenden Funktionsaufrufe genannt werden. Ich wollte es mit dem Iris Datensatz mittels des stats Pakets demonstrieren. Wie soll ich am besten den Code und die Ergebnisse des Codes bzw. der Befehle einfügen? Als Screenshots aus R oder anders? Dann müsste ich auch ein Bildverzeichnis machen mit den Quellen (also R) oder?
Zudem hatte ich vor ein Streudiagramm mit den Längen und Breiten der Blütenblätter zu erstellen, da man ja schon visuell recht gut 3 Bereiche bzw. Gruppen erkennt, sodass k=3 sinnvoll wäre. Würdet ihr es auch so machen?
Sollte ich trotzdem noch die Ellbogenmethode (sinkende Varianz mit steigendem k) in den Hauptteil einbauen? Ist es da sinnvoll die Formeln selbständig in R zu schreiben oder reicht z.B. der Befehl aus dem factoex Paket, der die sinkende Varianz mit steigendem k darstellt. Leider bin ich mir nicht genau sicher was für die Hausarbeit wirklich relevant ist und ob es eher in den Hauptteil oder den Anhang gehört. Insgesamt soll die Hausarbeit um die 10 Seiten groß sein. Ich bin dankbar für jede Antwort