Lineare Diskriminanzanalyse - Daten standardisieren?

Distanzmaße, Diskriminanzanalyse, graphische Analysen etc.

Lineare Diskriminanzanalyse - Daten standardisieren?

Beitragvon beatem » Mi 17. Aug 2011, 11:42

Hallo liebe Forumgemeinde,
Ich habe einen großen Datensatz mit biologischen Daten (2000 Proben, 30 Parameter), die 2 verschiedenen Gruppen angehören. Nun habe ich eine LDA (lineare Diskriminanzanalyse) mit der Software R durchgeführt (package MASS, function "lda").
Dazu habe ich meinen Datensatz in 60% Trainingsgruppe und den Rest (=40%) als Testgruppe geteilt.
Die Ergebnisse sind zufriedenstellend, das heißt die Klassifzierung meiner Testgruppe klappt sehr gut (hohe "Spezifität" und "Sensitivität").

Dann habe ich meine Datensatz standardisiert (function "scale" in R verwendet), die gleiche Trainingsgruppe und die gleiche Testgruppe ausgewählt. Anschließend habe ich erneut eine LDA in R gemacht. Nun sind diese Ergebnisse noch besser! (bezüglich Spezifität, Sensitivität)
Das erscheint mir insofern logisch, da LDA besonders gut bei multivariat normalverteilten Datensätzen funktioniert, wo die Kovarianz-Matrizen in beiden Gruppen gleich sind. Allerdings habe ich nirgendwo in der Literatur Hinweise gefunden, dass man die Daten standardisieren soll, bevor man eine LDA durchführt.

Daher meine Fragen:
1. Ist es immer von Vorteil die Daten vor der LDA zu standardisieren?
2. Welche Nachteile kann das haben?

Vielen Dank für eure Hilfe!

Gruß,
Beate
beatem
Einmal-Poster
Einmal-Poster
 
Beiträge: 1
Registriert: Mi 17. Aug 2011, 11:29
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Lineare Diskriminanzanalyse - Daten standardisieren?

Beitragvon STATWORX » So 21. Aug 2011, 19:30

Eine Standardisierung (ich gehe mal davon aus, dass die Daten z-standardisiert wurden) hat keine Auswirkung auf das "Aussehen" der Verteilung sondern nur auf die Lage- und Streuungsparameter (M = 0, SD = 1). Standardisierung kann manchmal sinnvoll sein, wenn die Messwerte auf stark unterschiedlichen Skalen gemessen wurden. Nachteile sind mir nicht bekannt.

VG
STATWORX
Foreninhaber
Foreninhaber
 
Beiträge: 85
Registriert: Di 14. Jun 2011, 19:45
Danke gegeben: 0
Danke bekommen: 18 mal in 18 Posts


Zurück zu weitere Verfahren

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron