Estoy confundido acerca de cómo decidir si tratar el tiempo como continuo o discreto en el análisis de supervivencia. Específicamente, quiero usar el análisis de supervivencia para identificar las variables a nivel del hogar y del niño que tienen la mayor discrepancia en su impacto en la supervivencia de los niños frente a las niñas (hasta los 5 años). Tengo un conjunto de datos de edades de los niños (en meses) junto con un indicador de si el niño está vivo, la edad de la muerte (en meses) y otras variables a nivel del hogar y del niño.
Como el tiempo se registra en meses y todos los niños son menores de 5 años, hay muchos tiempos de supervivencia vinculados (a menudo a intervalos de medio año: 0mos, 6mos, 12mos, etc.). Según lo que he leído sobre el análisis de supervivencia, tener muchos tiempos de supervivencia vinculados me hace pensar que debería tratar el tiempo como algo discreto. Sin embargo, he leído varios otros estudios en los que el tiempo de supervivencia es, por ejemplo, años-persona (y seguramente hay tiempos de supervivencia vinculados) y se utilizan métodos de tiempo continuo como los riesgos proporcionales de Cox.
¿Cuáles son los criterios que debo usar para decidir si tratar el tiempo como continuo o discreto? Para mis datos y preguntas, usar algún modelo de tiempo continuo (Cox, Weibull, etc.) tiene un sentido intuitivo para mí, pero la naturaleza discreta de mis datos y la cantidad de tiempos de supervivencia vinculados parecen sugerir lo contrario.
Sospecho que si usa modelos de tiempo continuo, querrá usar la censura de intervalos, lo que refleja el hecho de que no conoce el tiempo exacto de falla, solo un intervalo en el que ocurrió la falla. Si se ajustan los modelos de regresión paramétrica con censura de intervalo usando la máxima probabilidad, los tiempos de supervivencia vinculados no son un problema IIRC.
fuente
Habrá tiempos de supervivencia atados en la mayoría de los análisis, pero grandes y claros trozos de lazos en eventos particulares son preocupantes. Pensaría mucho sobre el estudio en sí mismo, cómo está recopilando datos, etc.
Porque, fuera de algunas necesidades metodológicas para usar un tipo de tiempo u otro, la forma de modelar la supervivencia dependerá de si el proceso subyacente es o no discreto o continuo en el mundo.
fuente
Si tiene covariables que varían con el tiempo para algunas personas (por ejemplo, el ingreso familiar puede variar en su ejemplo a lo largo de la vida de un niño), los modelos de supervivencia (paramétrico y modelo cox) requieren que divida los datos en intervalos discretos definidos por Las covariables variables.
Encontré este pdf de notas de clase de German Rodriguez útil.
fuente