k-fache Kreuzvalidierung

Fragen, die sich auf kein spezielles Verfahren beziehen.

k-fache Kreuzvalidierung

Beitragvon tharuani » Fr 15. Jul 2011, 19:09

Hallo,

ich vergleiche im Rahmen meiner Diplomarbeit
zwei Modelle (logistische Regressionsanalyse versus
Entscheidungsbaumverfahren), die für prognostische
Zwecke eingesetzt werden sollen.
Als Kennwerte der prognostische Güte berechne ich
unter anderem die AUC-Werte aus der ROC-Analyse
und biseriale Rangkorrelationen.
Ich habe mich für die Durchführung einer 10-fachen
Kreuzvalidierung entschieden und beim bearbeiten
festgestellt, dass die am Trainingssatz mitunter
noch auf dem 5\% Signifikanzniveau sigifikanten
Korrelationen auf dem Testset deutlich schlechter
wurden und mitunter der p-Wert bis zu 0,3 stieg.
(Für möglicherweise unsaubere Formulierung wird um
Entschuldigung gebeten..).
Lange Rede; meine Frage ist folgende:

Kann es sinnvoll sein, den Mittelwert der Korrelationen
aus den 10 Testsets mittels t-test für eine Stichprobe
auf Signifikanz zu prüfen oder ist das völliger Unsinn
und wenig aussagekräftig?

Für Kritik, Fragen und Anmerkungen stehen ich immer zur Verfügung;
über Antwort würde ich mich sehr freuen.
tharuani
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Mo 4. Jul 2011, 15:06
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: k-fache Kreuzvalidierung

Beitragvon jobu » Mo 18. Jul 2011, 15:45

Hallo tharuani,

Also der Mittelwert (allerdings korrigiert nach Fisher-Transformation; http://de.wikipedia.org/wiki/Korrelatio ... sformation) der Korrelationen kannst Du als Schätzer für den "wahren Zusammenhang" durchaus verwenden. Was Du mit Deinen Testsets ja eigentlich machst, ist das empirische Austesten eines Konfidenzintervals der Korrelationen (Du schätzst also nicht anhand einer hypothetischen Verteilung, sondern ziehst Zufallsstichproben aus der Population).
Zu Deiner Frage: Korrelationen folgen einer t-Statistik, den Mittelwert kannst Du also prüfen mit t = r*sqr(n-2) / sqr(1-r^2), mit df=n-2.

Übrigens, da habe ich mal recht lange nach Informationen dazu gesucht: AUC-Werte kannst Du mittels Mann-Whitney-U Statistik miteinander vergleichen...

Gruss,
jobu
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 29. Jun 2011, 15:29
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron