Comparación de CPH, modelo de tiempo de falla acelerado o redes neuronales para análisis de supervivencia

10

Soy nuevo en el análisis de supervivencia y recientemente aprendí que hay diferentes maneras de hacerlo dado un determinado objetivo. Estoy interesado en la implementación real y la adecuación de estos métodos.

Se me presentaron los modelos tradicionales de riesgo proporcional de Cox , tiempo de falla acelerado y redes neuronales (perceptrón multicapa) como métodos para obtener la supervivencia de un paciente dado su tiempo, estado y otros datos médicos. Se dice que el estudio se determinará en cinco años y el objetivo es dar riesgos de supervivencia cada año para que se den nuevos registros.

Encontré dos instancias donde se eligieron otros métodos sobre el Cox PH:

  1. Encontré " Cómo obtener predicciones en términos de tiempo de supervivencia de un modelo Cox PH " y se mencionó que:

    Si está particularmente interesado en obtener estimaciones de la probabilidad de supervivencia en puntos de tiempo particulares, le recomendaría modelos de supervivencia paramétricos (también conocidos como modelos de tiempo de falla acelerada) . Estos se implementan en el paquete de supervivencia para R y le proporcionarán distribuciones de tiempo de supervivencia paramétricas, en las que simplemente puede conectar el tiempo que le interesa y obtener una probabilidad de supervivencia.

    Fui al sitio recomendado y encontré uno en el survivalpaquete : la función survreg.

  2. Las redes neuronales se sugirieron en este comentario :

    ... Una ventaja de los enfoques de redes neuronales para el análisis de supervivencia es que no se basan en los supuestos que subyacen en el análisis de Cox ...

    Otra persona con la pregunta " Modelo de red neuronal R con vector objetivo como salida que contiene predicciones de supervivencia " dio una forma exhaustiva de determinar la supervivencia tanto en redes neuronales como en Cox PH.

    El código R para obtener la supervivencia sería así:

    mymodel <- neuralnet(T1+T2+T3+T4+T5~covar1+covar2+covar3+..., data=mydata, hidden=1)
    compute(mymodel,data=mydata)
    
  3. Fui a los foros de R y encontré esta respuesta en la pregunta " predic.coxph y predic.survreg " :

    De hecho, desde la predict()función del coxphno se pueden obtener predicciones directas del "tiempo", sino solo puntajes de riesgo lineales y exponenciales. Esto se debe a que, para obtener el tiempo, se debe calcular un riesgo de referencia y no es sencillo, ya que está implícito en el modelo de Cox.

Me preguntaba si cuál de los tres (o dos considerando los argumentos sobre Cox PH) es el mejor para obtener porcentajes de supervivencia para períodos de interés. Estoy confundido sobre cuál de ellos usar en el análisis de supervivencia.

Litiu final
fuente

Respuestas:

9

Depende de por qué estás haciendo modelos. Dos razones principales para construir modelos de supervivencia son (1) hacer predicciones o (2) modelar tamaños de efecto de covariables.

Si desea usarlos en un entorno predictivo en el que desea obtener un tiempo de supervivencia esperado dado un conjunto de covariables, es probable que las redes neuronales sean la mejor opción porque son aproximadores universales y hacen menos suposiciones que las habituales (semi) paramétricas modelos. Otra opción que es menos popular pero no menos potente son las máquinas de vectores de soporte .

Si está modelando para cuantificar los tamaños de los efectos, las redes neuronales no serán de mucha utilidad. Para este objetivo se pueden usar tanto los modelos de riesgos proporcionales de Cox como los de tiempo de falla acelerado. Los modelos Cox PH son, con mucho, los más utilizados en entornos clínicos, en los que la razón de riesgo proporciona una medida del tamaño del efecto para cada covariable / interacción. Sin embargo, en entornos de ingeniería, los modelos AFT son el arma de elección.

Marc Claesen
fuente
1
¡gracias por la respuesta! Lo ha dicho exactamente: " para obtener un tiempo de supervivencia esperado dado un conjunto de covariables ". Tendré que ir con las redes neuronales y SVM en mi estudio.
Final Litiu
@Marc Claesen: El modelo Cox PH proporciona P (tiempo de supervivencia> t). ¿No es posible obtener el pdf del tiempo de supervivencia a partir de ahí y una muestra del pdf?
statBeginner
@Marc Claesen Supongo que las redes neuronales no pueden aplicarse directamente al problema del análisis de supervivencia, pero el problema del análisis de supervivencia debe convertirse primero en un problema de clasificación o regresión. Entonces, ¿puede explicar cómo el problema del análisis de supervivencia puede convertirse en un problema de clasificación o regresión para que las redes neuronales puedan aplicarse? Responda aquí si es posible stats.stackexchange.com/questions/199549/…
GeorgeOfTheRF