Hallo zusammen,
gibt es ein Verfahren, mit dem sich auf Basis von Paneldaten Individuen clustern lassen?
Ich habe Paneldaten mit gemischten Variablentypen (ordinale Variablen sowie einige intervallskalierte) und möchte gerne eine Clusteranalyse in R laufen lassen. Dafür würde ich das Gower-Entfernungsmaß nutzen und die Ergebnisse dann mit der Funktion pam() aus dem Paket cluster clustern wie hier beschrieben: http://stackoverflow.com/questions/3122 ... tance-in-r
Die Schwierigkeit ist jetzt, die Panelstruktur irgendwie zu berücksichtigen. Die pragmatische Variante wäre natürlich, sich einfach das arithmetische Mittel plus evtl. noch ein Maß für die intraindividuelle Schwankung der Variablen berechnen zu lassen und damit Querschnittdaten zu generieren. Das ist aber einerseits keine gute Lösung für die ordinalen Daten. Ich könnte hier natürlich den Median oder den Modalwert verwenden aber würde damit eine Menge Informationen verlieren. Andererseits stecken in den Paneldaten so oder so zusätzliche Informationen, die mit einfachen aggregierten Werten nur unzureichend wiedergegeben sind. Bestimmte Messzeitpunkte spielen für mich keine Rolle, eher die personenspezifische Charakteristik der zeitabhängigen Schwankungen.
Beide Vorbehalte sprechen dafür, die Panelstruktur beizubehalten und nach einem Verfahren zu suchen, dass mir die Daten in dieser Form auf Individuenebene clustern kann. Aber gibt es sowas überhaupt?