Predicción en regresión de Cox

38

Estoy haciendo una regresión multivariada de Cox, tengo mis variables independientes significativas y valores beta. El modelo se ajusta muy bien a mis datos.

Ahora, me gustaría usar mi modelo y predecir la supervivencia de una nueva observación. No tengo claro cómo hacer esto con un modelo de Cox. En una regresión lineal o logística, sería fácil, simplemente ponga los valores de la nueva observación en la regresión y multiplíquelos con betas y así tendré la predicción de mi resultado.

¿Cómo puedo determinar mi riesgo de referencia? Lo necesito además de calcular la predicción.

¿Cómo se hace esto en un modelo de Cox?

regression survival prediction cox-model Marja
fuente

30

Siguiendo el modelo de Cox, el peligro estimado para el individuo con el vector covariable tiene la forma donde se encuentra maximizando la probabilidad parcial, mientras que deduce del estimador de Nelson-Aalen, con , los distintos tiempos de evento y el número de muertes en (ver, por ejemplo, Sección 3.6 ). $i$ $x_i$

{\hat{h}}_{yo} (t) = {\hat{h}}_{0 0} (t) \exp (X_{yo}^{'} \hat{β}),

$\hat{h}_i(t) = \hat{h}_0(t) \exp(x_i' \hat{\beta}),$

\hat{β}

$\hat{\beta}$

{\hat{h}}_{0}

$\hat{h}_0$

{\hat{h}}_{0 0} (t_{yo}) = \frac{{re}_{yo}}{\sum_{j : t_{j} \geq t_{yo}} \exp (X_{j}^{'} \hat{β})}

$\hat{h}_0(t_i) = \frac{d_i}{\sum_{j:t_j \geq t_i} \exp(x_j' \hat{\beta})}$

t_{1}

$t_1$

t_{2}, \dots

$t_2, \dotsc$

d_{i}

$d_i$

t_{i}

$t_i$

Del mismo modo, con y

{\hat{S}}_{yo} (t) = {\hat{S}}_{0 0} (t)^{\exp (X_{yo}^{'} \hat{β})}

$\hat{S}_i(t) = \hat{S}_0(t)^{\exp(x_i' \hat{\beta})}$

{\hat{S}}_{0} (t) = \exp (- {\hat{Λ}}_{0} (t))

$\hat{S}_0(t) = \exp(- \hat{\Lambda}_0(t))$

{\hat{Λ}}_{0 0} (t) = \sum_{j : t_{j} \leq t} {\hat{h}}_{0 0} (t_{j}) .

$\hat{\Lambda}_0(t) = \sum_{j:t_j \leq t} \hat{h}_0(t_j).$

EDITAR: Esto también podría ser de interés :-)

ocram
fuente

1

Esa es exactamente mi pregunta ... Necesito una estimación de la función de riesgo de referencia para poder tener la predicción, ¿correcto? ¿Conoces algún método para estimarlo?

Marja

2

@Marjan, la navaja puede no reflejar adecuadamente la incertidumbre causada por la selección de variables. La rutina de carga muestra correctamente más variabilidad en la que las variables están etiquetadas como "significativas". Si desea hacer una "validación relativa", puede demostrar que la discriminación predictiva es buena después de corregir el sobreajuste. Esto no requiere tratar con el peligro de línea de base, pero está validando las estimaciones relativas de peligro de registro. La validatefunción en el rmspaquete R junto con la cphfunción hará eso. El único algoritmo paso a paso implementado validatees el retroceso descendente.

Frank Harrell

1

Obtener riesgos relativos predichos (es decir, el predictor lineal) es bastante simple. Pero dejé de usar SAS en 1991.

Frank Harrell

8

El enlace se ha bloqueado :-(.

gung - Restablecer Monica

2

¿Hay alguna manera de predecir el tiempo de supervivencia T para un individuo específico? Quiero decir que dada una lista de valores para las covariables, ¿cuál es la forma de averiguar el tiempo después del cual es más probable que el individuo muera?

statBeginner

14

La función predictSurvProben el pecpaquete puede darle estimados de riesgo absoluto para nuevos datos basados en un modelo cox existente si usa R.

Los detalles matemáticos que no puedo explicar.

EDITAR: La función proporciona probabilidades de supervivencia, que hasta ahora he tomado como 1- (Probabilidad de evento).

EDITAR 2:

Uno puede prescindir del paquete pec. Usando solo el paquete de supervivencia, la siguiente función devuelve el riesgo absoluto basado en un modelo de Cox

risk = function(model, newdata, time) {
  as.numeric(1-summary(survfit(model, newdata = newdata, se.fit = F, conf.int = F), times = time)$surv)
}

miura
fuente

1-La probabilidad de supervivencia es el peligro acumulado. Creo que el OP solicita la función de riesgo instantáneo (de la línea de base) o algún tipo de estimación suavizada ( muhazpaquetes en R).

ECII

1

1-La probabilidad de supervivencia no es el peligro acumulativo. En ausencia de riesgos competitivos, los dos están conectados como se detalla en en.wikipedia.org/wiki/… .

miura

1-Probabilidad de supervivencia = Tasa de falla (suponiendo solo 1x método de falla). La relación entre la probabilidad de supervivencia y el riesgo acumulativo se describe en la respuesta aceptada: ¿ S(t)=exp(−Λ(t))dónde Λ(t)está el riesgo acumulativo?

NickBraunagel

11

¿Quizás también te gustaría probar algo como esto? Ajuste un modelo de riesgos proporcionales de Cox y úselo para obtener la curva de supervivencia prevista para una nueva instancia.

Tomado del archivo de ayuda para survfit.coxph en R (acabo de agregar la parte de líneas)

# fit a Cox proportional hazards model and plot the  
# predicted survival for a 60 year old 
fit <- coxph(Surv(futime, fustat) ~ age, data=ovarian) 
plot(survfit(fit, newdata=data.frame(age=60)),
     xscale=365.25, xlab="Years", ylab="Survival", conf.int=F) 
# also plot the predicted survival for a 70 year old
lines(survfit(fit, newdata=data.frame(age=70)),
     xscale=365.25, xlab="Years", ylab="Survival")

Sin embargo, debe tener en cuenta que para el supuesto de riesgos proporcionales que aún se cumple para su predicción, el paciente para el que predice debe pertenecer a un grupo que sea cualitativamente el mismo que el derivado del modelo de riesgos proporcionales de Cox que utilizó para el pronóstico. predicción.

Slak
fuente

6

La basehazfunción de los survivalpaquetes proporciona el riesgo de referencia en los puntos de tiempo del evento. A partir de eso, puede subir las matemáticas que proporciona el ocram e incluir los OR de sus estimaciones de coxph.

ECII
fuente

2

Todo el punto del modelo de Cox es la suposición del peligro proporcional y el uso de la probabilidad parcial. La probabilidad parcial tiene la función de riesgo de referencia eliminada. Por lo tanto, no necesita especificar uno. Esa es la belleza de esto!

Michael R. Chernick
fuente

2

Sin embargo, si desea obtener una estimación del peligro o la supervivencia para un valor particular del vector covariable, entonces necesita una estimación del peligro o la supervivencia de referencia. La estimación de Nelson-Aalen generalmente hace el trabajo ...

ocram

1

A menudo, con el modelo de Cox, está comparando dos funciones de supervivencia y la clave es la razón de riesgo en lugar de la función de riesgo. El peligro de la línea de base es como un parámetro molesto que Cox eliminó tan hábilmente del problema utilizando el supuesto de riesgos proporcionales. Cualquiera que sea el método que le gustaría usar para estimar la función de peligro y / o el peligro de referencia en el contexto del modelo, requeriría usar la forma Cox del modelo que fuerza la proporcionalidad.

Michael R. Chernick

Muchas gracias, sería genial si ves mi comentario sobre la respuesta de ocram. ¿Quizás podrías ayudarme también?

Marja

3

También puede estratificar en factores que no están en riesgos proporcionales. Pero, en cualquier caso, el modelo de Cox y su estimador posterior al ajuste del riesgo inicial se pueden usar para obtener cuantiles pronosticados del tiempo de supervivencia, varias probabilidades de supervivencia y el tiempo de supervivencia medio pronosticado si tiene un seguimiento a largo plazo. Todas estas cantidades son fáciles de conseguir en el paquete R rms.

Frank Harrell

No necesita especificarlo, pero se estima.

DWin

Predicción en regresión de Cox

Respuestas: