Modelo de riesgo proporcional de Cox e interpretación de coeficientes cuando se trata de una interacción de mayúsculas y minúsculas

9

Aquí está el resultado resumido del modelo Coxph que utilicé (utilicé R y el resultado se basa en el mejor modelo final, es decir, se incluyen todas las variables explicativas significativas y sus interacciones):

 coxph(formula = Y ~ LT + Food + Temp2 + LT:Food + LT:Temp2 + 
Food:Temp2 + LT:Food:Temp2) # Y<-Surv(Time,Status==1)

n = 555

               coef         exp(coef)          se(coef)      z           Pr(>|z|)     
LT             9.302e+02      Inf             2.822e+02    3.297        0.000979 *** 
Food           3.397e+03      Inf             1.023e+03    3.321        0.000896 *** 
Temp2          5.016e+03      Inf             1.522e+03    3.296        0.000979 *** 
LT:Food        -2.250e+02    1.950e-98        6.807e+01    -3.305       0.000949 *** 
LT:Temp2       -3.327e+02    3.352e-145       1.013e+02    -3.284       0.001022 ** 
Food:Temp2     -1.212e+03    0.000e+00        3.666e+02    -3.307       0.000942 *** 
LT:Food:Temp2   8.046e+01    8.815e+34        2.442e+01     3.295       0.000986 *** 
--- 
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Rsquare= 0.123   (max possible= 0.858 ) 
Likelihood ratio test= 72.91  on 7 df,   p=3.811e-13 
Wald test            = 55.79  on 7 df,   p=1.042e-09 
Score (logrank) test = 78.57  on 7 df,   p=2.687e-14 

La pregunta es:

¿Cómo interpretar los valores de coeficiente y exp (coef) en este caso, ya que son valores muy grandes? También está involucrada la interacción de 3 casos, lo que confunde más la interpretación.

Todos los ejemplos relacionados con el modelo de Coxph que he encontrado hasta ahora en línea han sido realmente simples con respecto a los términos de intercalación (que siempre han resultado ser poco significativos) y también los valores de coeficientes (= tasas de riesgo) y exponenciales de estos (= razones de riesgo) han sido números bastante pequeños y "fáciles de manejar", por ejemplo, coeficiente = 1.73 -> exp (coef) = 5.64. PERO los míos son números mucho más grandes, como se puede ver en el resultado resumido (arriba). Y debido a que son valores tan grandes, casi no parecen tener ningún sentido.

Parece un poco ridículo pensar que la supervivencia es, por ejemplo, 8.815e + 34 (razón de riesgo tomada de la interacción LT: Comida: Temp2) veces menor cuando la interacción aumenta en una unidad (?).

En realidad, tampoco sé cómo interpretar esta interacción de 3 casos. ¿Significa que cuando todas las variables en interacción aumentan en una unidad, la supervivencia disminuye en cierta cantidad (indicada por el valor exp (coef))?

Sería genial si alguien me puede ayudar aquí. :)

A continuación se muestra la parte de mi hoja de datos que utilicé para el análisis cox. Aquí puede ver que he usado muchas veces el mismo valor explicativo de variabe (es decir, LT, Comida y Temp2) para varias "Tiempo, variable de respuesta de estado". Estos valores variables explicativos ya son los valores medios de estas variables (debido a la configuración del trabajo de campo en la naturaleza, no fue posible obtener un valor variable variable explicativo para cada respuesta individual observada, por lo tanto, los valores medios utilizados ya en esta fase ), y esto respondería a la sugerencia 1 (?) (vea la primera respuesta).

Sugerencia 2 (ver la primera respuesta): Estoy usando R, y todavía no soy un súper dios. :) Por lo tanto, si uso la función predic (cox.model, tipo = "esperado"), obtengo una gran cantidad de valores diferentes y no tengo idea de a qué variable explicativa se refieren y en qué orden. ¿O es posible resaltar cierto término de interacción en la función de predicción? No estoy seguro si me estoy haciendo muy claro aquí.

Sugerencia 3 (ver primera respuesta): en la parte de la hoja de datos a continuación, se pueden ver las unidades de diferentes variables explicativas. Todos son diferentes e incluyen decimales. ¿Puede esto tener algo que ver con el resultado de Cox?

Parte de la hoja de datos:

Time (days)     Status      LT(h) Food (portions per day) Temp2 C)
28                0         14.42        4.46             3.049
22                0         14.42        4.46             3.049
9                 1         14.42        4.46             3.049
24                0         15.33        4.45             2.595
24                0         15.33        4.45             2.595
19                1         15.33        4.45             2.595

Saludos, Unna

Unna
fuente
@MansT: Me alegro de que haya editado la pregunta ;-)
ocram

Respuestas:

7

Un par de sugerencias, no directamente relacionadas con CoxPH sino con interacciones y colinealidad

1) Cuando obtienes valores "locos" como estos, una posibilidad es la colinealidad. Esto suele ser un problema cuando tienes interacciones. ¿Ha centrado todas sus variables (restando la media de cada una)?

2) No puedes interpretar una interacción entre muchas tan fácilmente. LT, food y temp2 están involucrados en muchas interacciones. Entonces, mire los valores pronosticados de diferentes combinaciones.

3) Verifique las unidades de las diferentes variables. Cuando obtienes parámetros locos, a veces es un problema de unidades (por ejemplo, medir una altura humana en milímetros o kilómetros)

4) Una vez que hayas aclarado todo eso, creo que la forma más fácil de pensar en los efectos de las diferentes interacciones (especialmente las de nivel superior) es graficar los valores pronosticados con diferentes combinaciones de los valores independientes.

Peter Flom - Restablece a Monica
fuente
Hei, a continuación está la parte de mi hoja de datos que utilicé para el análisis cox. Aquí puede ver que he usado muchas veces el mismo valor explicativo de variabe (es decir, LT, Food y Temp2) para varias variables de respuesta de tiempo y estado. Estos valores variables explicativos ya son los valores medios de estas variables (debido a la configuración del trabajo de campo en la naturaleza, no fue posible obtener un valor variable variable explicativo para cada respuesta individual observada, por lo tanto, los valores medios utilizados ya en esta fase ), y esto respondería a la sugerencia 1 (?).
Unna
Sugerencia 2: Estoy usando R, y todavía no soy un súper dios. :) Por lo tanto, si uso la función predic (cox.model, tipo = "esperado"), obtengo una gran cantidad de valores diferentes y no tengo idea de a qué variable explicativa se refieren y en qué orden. ¿O es posible resaltar cierto término de interacción en la función de predicción? No estoy seguro si me estoy haciendo muy claro aquí.
Unna
Sugerencia 3: en la parte de la hoja de datos a continuación, se pueden ver las unidades de diferentes variables explicativas. Todos son diferentes e incluyen decimales. ¿Puede esto tener algo que ver con el resultado de Cox?
Unna
Tiempo (días) Estado LT (h) Alimentos (porciones por día) Temp2 (ºC) 28 0 14.42 4.46 3.049 22 0 14.42 4.46 3.049 9 1 14.42 4.46 3.049 24 0 15.33 4.45 2.595 24 0 15.33 4.45 2.595 19 1 15.33 4.45 2.595
Unna
El comentario anterior sobre el ejemplo de hoja de datos que utilicé no se muestra en forma de tabla, pero espero que sea posible que tenga sentido. :)
Unna