Hallo,
ich vergleiche im Rahmen meiner Diplomarbeit
zwei Modelle (logistische Regressionsanalyse versus
Entscheidungsbaumverfahren), die für prognostische
Zwecke eingesetzt werden sollen.
Als Kennwerte der prognostische Güte berechne ich
unter anderem die AUC-Werte aus der ROC-Analyse
und biseriale Rangkorrelationen.
Ich habe mich für die Durchführung einer 10-fachen
Kreuzvalidierung entschieden und beim bearbeiten
festgestellt, dass die am Trainingssatz mitunter
noch auf dem 5\% Signifikanzniveau sigifikanten
Korrelationen auf dem Testset deutlich schlechter
wurden und mitunter der p-Wert bis zu 0,3 stieg.
(Für möglicherweise unsaubere Formulierung wird um
Entschuldigung gebeten..).
Lange Rede; meine Frage ist folgende:
Kann es sinnvoll sein, den Mittelwert der Korrelationen
aus den 10 Testsets mittels t-test für eine Stichprobe
auf Signifikanz zu prüfen oder ist das völliger Unsinn
und wenig aussagekräftig?
Für Kritik, Fragen und Anmerkungen stehen ich immer zur Verfügung;
über Antwort würde ich mich sehr freuen.