Punto de corte en una curva ROC. ¿Hay una función simple?

10

Quiero encontrar el punto de corte para el género basado en una medición antropológica. Puedo dibujar las curvas y sé que en caso de que la sensibilidad y la especificidad sean igualmente importantes, se debe determinar el punto más cercano a la esquina superior izquierda del cuadro (o si la curva es negativa, el punto más cercano a la esquina inferior derecha) como punto de corte.

Sin embargo, no sé si hay alguna función ya implementada en R o algún otro programa para determinar esto, ¿simplemente? Solo sé que SPSS no tiene esa función. ¿Conoces algún programa o R que pueda hacerlo a través de una función ya implementada?

Vic
fuente
3
Hola @Vic. Hay un excelente Rpaquete llamado ROCRpara este tipo de cálculos. Encuéntralo aquí . Consulte también el sitio correspondiente con una documentación completa. También hay un documento sobre el paquete .
COOLSerdash

Respuestas:

12

Desea calcular el índice de Youden y encontrar el más alto en su curva ROC.

Eche un vistazo a los paquetes OptimalCutpoints y cutpointr para R. Si está haciendo análisis ROC, también puede usar la coordsfunción de pROC (un poco de autopublicidad aquí):

library(pROC)
data(aSAH)
rocobj <- roc(aSAH$outcome, aSAH$s100b)
coords(rocobj, "best")
coords(rocobj, x="best", input="threshold", best.method="youden") # Same than last line
Calimo
fuente
4

Como @COOLSerdash mencionó, hay un buen paquete ROCR R para hacer este tipo de análisis.

Pero mi respuesta es que no es posible tomar una decisión de corte únicamente con base en alguna métrica de información.

Debe especificar una verdadera función de pérdida que tenga sus parámetros basados ​​en algún valor relativo de varias clasificaciones erróneas. Entonces es fácil seleccionar un punto de corte que maximice las ganancias o minimice las pérdidas.

Analista
fuente
1
Bien dicho. También debe preguntarse cuál es el valor de tener un límite cuando solo puede usar el riesgo previsto en un continuo.
Frank Harrell
1
Vic escribe que "la sensibilidad y la especificidad son igualmente importantes", lo que interpreto como el costo de las diferentes clasificaciones erróneas son idénticas. En este caso, una función de costo simple como el índice de Youden es apropiada (pero no es el caso en general, de hecho).
Calimo