Modelos de riesgo de tiempo discreto (obstrucción) en R

10

El survivalpaquete en Rparece centrarse en modelos de supervivencia en tiempo continuo. Estoy interesado en estimar una versión de tiempo discreto de un modelo de riesgo proporcional, el modelo complementario log-log. Tengo un modelo de supervivencia bastante sencillo, con simple censura a la derecha.

Sé que una forma de estimar este modelo es crear un conjunto de datos que tenga una fila separada para cada observación para cada período en el que no esté "muerto". Luego, se puede usar un glmmodelo con el cloglogenlace.

Este enfoque parece muy ineficiente en la memoria; de hecho, probablemente produciría un conjunto de datos que es demasiado grande para la memoria de mi máquina.

Un segundo enfoque sería codificar el MLE yo mismo. Eso sería bastante simple, pero espero que haya un paquete que tenga este modelo de supervivencia enlatado. Sería más fácil para la colaboración y evitar errores de codificación al usar un paquete.

¿Alguien sabe de tal paquete?

Charlie
fuente
2
Si es un tiempo discreto, debes tener muchos lazos, ¿verdad? Tengo la impresión de que coxph(ties="exact"), en el survivalpaquete estándar , hace del modelo "un modelo logístico condicional, y es apropiado cuando los tiempos son un pequeño conjunto de valores discretos". ¿Esto no funcionaría para ti? ¿Es b / c que no estaría usando el cloglogenlace?
gung - Restablece a Monica
1
@gung, gracias por el puntero; No sabía sobre esa característica. Sin embargo, preferiría usar el cloglogenlace.
Charlie

Respuestas:

8

Tener varias filas para cada observación puede parecer redundante, pero, probablemente, no lo es. Si hay covariables que varían en el tiempo en el modelo, entonces cada mes de observación necesitará su propia fila. Un ejemplo particular de una covariable variable en el tiempo es el tiempo transcurrido. Dado que esta variable seguramente debería incluirse en el modelo, tiene sentido tener una fila separada para cada período de observación. Por lo tanto, el primer enfoque sugerido es probablemente el mejor.

Tenga en cuenta que esto es diferente de un modelo de riesgos proporcionales de tiempo continuo con una distribución de Weibull. Allí, el modelo de supervivencia se puede simplificar a una sola línea para cada observación si el tiempo transcurrido es la única covariable que varía con el tiempo (ver aquí , por ejemplo). Un resultado similar es válido para el modelo de riesgo proporcional de Cox.

Charlie
fuente