Para cada registro en mis conjuntos de datos tengo la siguiente información
donde son características, δ es 1 si ocurre el evento objetivo y 0 en caso contrario, y T es la marca de tiempo del evento ocurrido. En particular, T podría faltar si no hubo un evento o se estableció a la hora en que terminó el seguimiento.
Quiero calcular un índice de riesgo para cada registro en mi conjunto de datos.
Estaba pensando en un modelo de clasificación que usara las características para predecir la clase δ . Sin embargo, T es importante: si el evento δ es probable que ocurra pronto, el riesgo debería ser mayor.
Es por eso que un análisis de supervivencia debe ser adecuado para este problema. No necesito la estimación completa de sino solo un índice único que represente el riesgo para un solo registro.
El tiempo medio de supervivencia, que se puede calcular para cada registro, parece un buen índice de riesgo: cuanto menor es el riesgo.
Mi pregunta es:
- ¿El análisis de supervivencia es adecuado para mis propósitos?
- ¿Cómo puedo evaluar el rendimiento de mi modelo?
fuente