Cuando se realiza una validación cruzada de 5 veces (por ejemplo), es típico calcular una curva ROC separada para cada uno de los 5 pliegues y, a menudo, una curva ROC media con std. dev. se muestra como grosor de curva.
Sin embargo, para la validación cruzada de LOO, donde solo hay un único punto de datos de prueba en cada pliegue, no parece lógico calcular una "curva" ROC para este único punto de datos.
He estado tomando todos mis puntos de datos de prueba (junto con sus valores p calculados por separado) y los he agrupado en un conjunto grande para calcular una curva ROC única, pero ¿es esto lo que es estadísticamente kosher?
¿Cuál es la forma correcta de aplicar el análisis ROC cuando el número de puntos de datos en cada pliegue es uno (como en el caso de la validación cruzada LOO)?
fuente
Respuestas:
Si el clasificador genera probabilidades, entonces es apropiado combinar todas las salidas de puntos de prueba para una sola curva ROC. De lo contrario, escale la salida del clasificador de una manera que lo haga directamente comparable entre los clasificadores. Por ejemplo, supongamos que está utilizando el análisis discriminante lineal. Entrene al clasificador y luego ponga los datos de entrenamiento a través del clasificador. Aprenda dos pesos: un parámetro de escala (la desviación estándar de las salidas del clasificador, después de restar las medias de la clase), y un parámetro de desplazamiento (la media de la primera clase). Utilice estos parámetros para normalizar la salida procesar de cada clasificador LDA a través deμ r n = ( r - μ ) / σσ μ r n=(r−μ)/σ , y luego puede crear una curva ROC a partir del conjunto de salidas normalizadas. Esto tiene la advertencia de que está estimando más parámetros y, por lo tanto, los resultados pueden diferir levemente de si hubiera construido una curva ROC basada en un conjunto de pruebas separado.
Si no es posible normalizar las salidas del clasificador o transformarlas en probabilidades, entonces un análisis ROC basado en LOO-CV no es apropiado.
fuente