Cómo evaluar la bondad del ajuste para las funciones de supervivencia

9

Soy un recién llegado al análisis de supervivencia, aunque tengo algunos conocimientos en clasificación y regresión.

Para la regresión, tenemos estadísticas de MSE y R cuadrado. Pero, ¿cómo podemos decir que el modelo de supervivencia A es superior al modelo de supervivencia B además de algún tipo de gráficos (curva KM)?

Si es posible, explique la diferencia con un ejemplo (por ejemplo, paquete rpart en R). ¿Cómo puede demostrar que un árbol de supervivencia CART es mejor que otro árbol de supervivencia CART? ¿Qué métricas se pueden usar?

inundaciones
fuente
3
Hay una variedad de tipos de análisis de supervivencia. Algunos de ellos se basan en la regresión. Algunos de ellos, como el KM, podrían considerarse más fácilmente como estimadores de estadísticas relacionadas con la supervivencia.
Alexis
Gracias por sus continuos esfuerzos para mejorar su pregunta. Sospecho que es responsable / apropiado para CV ahora. Lo he nominado para reabrir. Ya veremos si otros están de acuerdo. Podría ayudar si pudiera publicar dos modelos de supervivencia tipo CART para que las personas los usen para explicar estos problemas.
gung - Restablecer Monica
1
Ben, ¿básicamente estás diciendo que en una regresión de riesgo proporcional de Cox, no hay (hasta ahora) una buena manera de evaluar la bondad del ajuste? R-Square no conduce a buenos resultados porque no puede manejar observaciones censuradas y observaciones sin censura correctamente? Estás hablando de Harrells c, ¿entendí bien que el método no es aplicable a una regresión de Cox-PH?
Kosta S.

Respuestas:

9

El principal problema con estadísticas como el modelo CoxR2(descrito en otra respuesta) es que depende mucho de la distribución de censura de sus datos. Otras cosas naturales que puede observar, como la relación de probabilidad con el modelo nulo, también tienen este problema. (Esto se debe básicamente a que la contribución de un punto de datos censurado a la probabilidad es muy diferente de la contribución de un punto de datos donde se observa el evento, porque uno de ellos proviene de un PDF y uno de ellos proviene de un CDF). Varios investigadores han propuso formas de evitar esto, pero las que he visto generalmente requieren que tenga un modelo de distribución de censura o algo igualmente poco práctico. No he investigado qué tan grave es esta dependencia en la práctica, por lo que si su censura es bastante leve, aún podría analizar estadísticas basadas en la razón de probabilidad. Para los modelos CART de supervivencia,

Para los modelos de supervivencia genéricos, una estadística de uso frecuente es el índice c de Harrell , un análogo de Kendall's o el ROC AUC para los modelos de supervivencia. Esencialmente, c es la proporción, de todas las instancias donde sabe que una instancia experimentó un evento más tarde que la otra, que el modelo se clasifica correctamente. (En otras palabras, para que se incluyan un par de instancias en el denominador aquí, como máximo una puede ser censurada, y debe censurarse después de que la otra experimente un evento). El índice c también depende de la distribución de censura, pero Según Harrell, la dependencia es más leve que para las otras estadísticas que mencioné anteriormente. Desafortunadamente, Harrell's cτtambién es menos sensible que las estadísticas anteriores, por lo que es posible que no desee elegir entre modelos basados ​​en él si la diferencia entre ellos es pequeña; Es más útil como índice interpretable de rendimiento general que como una forma de comparar diferentes modelos.

(Por último, por supuesto, si tiene un propósito específico en mente para los modelos, es decir, si sabe cuál es su función de pérdida de predicción, ¡siempre puede evaluarlos de acuerdo con la función de pérdida! Pero supongo que ' no eres tan afortunado ...)

Para una discusión más profunda tanto de las estadísticas de razón de probabilidad como de la c de Harrell , debe consultar el excelente libro de texto de Harrell Estrategias de modelado de regresión . La sección sobre evaluación de modelos de supervivencia es §19.10, pp. 492-493. Lo siento, no puedo darte una sola respuesta definitiva, ¡pero no creo que este sea un problema resuelto!

Ben Kuhn
fuente
5

Las regresiones de riesgos proporcionales de Cox para los datos de supervivencia pueden considerarse correspondientes a las regresiones estándar en muchos aspectos. Por ejemplo, las regresiones de Cox también proporcionan errores estándar residuales y estadísticas de R cuadrado. Vea la coxphfunción en el survivalpaquete R. (Puede pensar en las curvas KM como correspondientes a análisis no paramétricos en estadísticas estándar. ¿Cómo incorporaría una prueba no paramétrica en CART?) En la práctica con datos clínicos, los errores estándar residuales tienden a ser altos y los valores de R-cuadrado bajos en regresión de Cox.

Por lo tanto, las regresiones estándar y las regresiones de Cox tienen requisitos y limitaciones similares. Debe verificar que los datos se ajustan a los supuestos subyacentes, lo que en el análisis de Cox incluye además el supuesto de que los riesgos que se comparan son proporcionales a lo largo del tiempo. Aún deberá evitar el sobreajuste y deberá validar su modelo. Y como entiendo CART, aunque no lo uso yo mismo, aún enfrentarás las dificultades que se presentan al comparar modelos no anidados.

EdM
fuente
Gracias por su respuesta sobre la diferencia y las relaciones entre la regresión de Cox y la regresión. Pero sí quiero saber cómo comparar dos modelos de supervivencia de árbol de decisión de rpart (CART).
inundación
El documento de acceso abierto vinculado a projecteuclid.org/euclid.ssu/1315833185 es una revisión y comparación bastante reciente de métodos para construir y elegir árboles de supervivencia, basados ​​en rparty otros paquetes y códigos R.
EdM
Gracias por señalar el periódico. Leeré el periódico ahora mismo.
inundación