Hallo zusammen,
ich habe eine Frage:
Ich analysiere gerade eine Datenbank, welche wie folgt aufgebaut ist.
Indexnummer, Art des Standorts und 15 verschiedene Pflanzenarten, prozentuale Werte.
Sprich
1 - Urban - 2% 0% 0% 0% 30% ...
2 - Wald - 2% ...
Jetzt möchte ich überprüfen, ob die Einteilung der Gruppen nach Urban, Wald, ... (5 versch. Gruppen) sich mit Hilfe der Daten bestätigt.
Sprich in den Wäldern die Verteilung der Pflanzen relativ ähnlich ist. Da dachte ich an eine Clusteranalyse, welche mir die Daten gruppiert und ich im Nachhinein überprüfen kann ob die Datensätze in den Gruppen einheitliche Standorttypen haben.
Ich habe 32 Datensätze. Darunter befinden sich einige Ausreißer, welche womöglich nicht gut in eine Gruppe passen (Beispiel Nadelwald, 100% Bäume) wobei ein Laub- und Mischwald mitunter besser und breiter diversifiziert ist. Oder macht es Sinn die Gruppe "Bäume" zusammenzufassen und erst bei einer Detailanalyse aufzuschlüsseln?
Ist hier die Clusteranalyse überhaupt sinnvoll und angebracht? Oder könnt ihr den Blick eines Freshman vielleicht in eine eher geeignete Richtung lenken?
Viele liebe Grüße und Danke im Vorraus
Lukas