Soy un recién llegado al análisis de supervivencia, aunque tengo algunos conocimientos en clasificación y regresión.
Para la regresión, tenemos estadísticas de MSE y R cuadrado. Pero, ¿cómo podemos decir que el modelo de supervivencia A es superior al modelo de supervivencia B además de algún tipo de gráficos (curva KM)?
Si es posible, explique la diferencia con un ejemplo (por ejemplo, paquete rpart en R). ¿Cómo puede demostrar que un árbol de supervivencia CART es mejor que otro árbol de supervivencia CART? ¿Qué métricas se pueden usar?
regression
survival
goodness-of-fit
cart
rpart
inundaciones
fuente
fuente
Respuestas:
El principal problema con estadísticas como el modelo CoxR2 (descrito en otra respuesta) es que depende mucho de la distribución de censura de sus datos. Otras cosas naturales que puede observar, como la relación de probabilidad con el modelo nulo, también tienen este problema. (Esto se debe básicamente a que la contribución de un punto de datos censurado a la probabilidad es muy diferente de la contribución de un punto de datos donde se observa el evento, porque uno de ellos proviene de un PDF y uno de ellos proviene de un CDF). Varios investigadores han propuso formas de evitar esto, pero las que he visto generalmente requieren que tenga un modelo de distribución de censura o algo igualmente poco práctico. No he investigado qué tan grave es esta dependencia en la práctica, por lo que si su censura es bastante leve, aún podría analizar estadísticas basadas en la razón de probabilidad. Para los modelos CART de supervivencia,
Para los modelos de supervivencia genéricos, una estadística de uso frecuente es el índice c de Harrell , un análogo de Kendall's o el ROC AUC para los modelos de supervivencia. Esencialmente, c es la proporción, de todas las instancias donde sabe que una instancia experimentó un evento más tarde que la otra, que el modelo se clasifica correctamente. (En otras palabras, para que se incluyan un par de instancias en el denominador aquí, como máximo una puede ser censurada, y debe censurarse después de que la otra experimente un evento). El índice c también depende de la distribución de censura, pero Según Harrell, la dependencia es más leve que para las otras estadísticas que mencioné anteriormente. Desafortunadamente, Harrell's cτ también es menos sensible que las estadísticas anteriores, por lo que es posible que no desee elegir entre modelos basados en él si la diferencia entre ellos es pequeña; Es más útil como índice interpretable de rendimiento general que como una forma de comparar diferentes modelos.
(Por último, por supuesto, si tiene un propósito específico en mente para los modelos, es decir, si sabe cuál es su función de pérdida de predicción, ¡siempre puede evaluarlos de acuerdo con la función de pérdida! Pero supongo que ' no eres tan afortunado ...)
Para una discusión más profunda tanto de las estadísticas de razón de probabilidad como de la c de Harrell , debe consultar el excelente libro de texto de Harrell Estrategias de modelado de regresión . La sección sobre evaluación de modelos de supervivencia es §19.10, pp. 492-493. Lo siento, no puedo darte una sola respuesta definitiva, ¡pero no creo que este sea un problema resuelto!
fuente
Las regresiones de riesgos proporcionales de Cox para los datos de supervivencia pueden considerarse correspondientes a las regresiones estándar en muchos aspectos. Por ejemplo, las regresiones de Cox también proporcionan errores estándar residuales y estadísticas de R cuadrado. Vea la
coxph
función en elsurvival
paquete R. (Puede pensar en las curvas KM como correspondientes a análisis no paramétricos en estadísticas estándar. ¿Cómo incorporaría una prueba no paramétrica en CART?) En la práctica con datos clínicos, los errores estándar residuales tienden a ser altos y los valores de R-cuadrado bajos en regresión de Cox.Por lo tanto, las regresiones estándar y las regresiones de Cox tienen requisitos y limitaciones similares. Debe verificar que los datos se ajustan a los supuestos subyacentes, lo que en el análisis de Cox incluye además el supuesto de que los riesgos que se comparan son proporcionales a lo largo del tiempo. Aún deberá evitar el sobreajuste y deberá validar su modelo. Y como entiendo CART, aunque no lo uso yo mismo, aún enfrentarás las dificultades que se presentan al comparar modelos no anidados.
fuente
rpart
y otros paquetes y códigos R.