¿El ajuste del modelo de Cox con estratos y la interacción entre estratos y covariables difiere del ajuste de dos modelos de Cox?

13

En Regression Modeling Strategies de Harrell (segunda edición) hay una sección (S. 20.1.7) que discute los modelos de Cox, incluida una interacción entre una covariable cuyo principal efecto sobre la supervivencia queremos estimar también (edad en el ejemplo a continuación) y un covariable cuyo efecto principal no queremos estimar (género en el ejemplo a continuación).

Concretamente: suponga que en una población el peligro (desconocido, verdadero) h(t) sigue el modelo

h(t)={hf(t)exp(β1age),for female patienshm(t)exp((β1+β2)age),for male patiens
dondehf ,hm son desconocidos, verdadero, no debe estimarse las funciones de riesgo basales yβ1 ,β2 son desconocidos, los parámetros verdaderos se estiman a partir de los datos.

(Este ejemplo está tomado casi literalmente del libro).

Ahora Harrell comenta que la situación anterior se puede reescribir como el modelo estratificado de Cox modelo 1 :

h(t)=hgender(t)exp(β1age+β2X)
donde el 'término de interacción'X es igual a cero para las mujeres y edad para los hombres. Esto es conveniente porque significa que podemos usar la técnica estándar para estimarβ1 yβ2 .

Ahora para la pregunta. Supongamos que dos investigadores A y B reciben la misma muestra de pacientes extraídos de la población descrita anteriormente. Investigador se ajusta a un modelo 1, las estimaciones de la obtención de ß 1 , β 2 para los parámetros verdaderos beta 1 , β 2 junto con intervalos de confianza.β^1β^2β1,β2

El investigador B adopta el enfoque más ingenuo de ajustar dos modelos Cox ordinarios (es decir, no estratificados): modelo 2a:

h(t)=hf(t)exp(γ1age)
en las pacientes de la muestra solamente y el modelo 2b:
h(t)=hm(t)exp(γ2age)
en los pacientes varones de la muestra solamente. Obteniendo así estimaciones γ1^ , γ2^de los parámetros verdaderos β1,β1+β2 respectivamente, junto con intervalos de confianza.

Pregunta:

  • Son estas estimaciones necesariamente la misma (en el sentido de que β 1 = γ 1 , beta 2 = γ 2 - γ 1 )? (Recuerde que ambos investigadores miran los mismos datos).β^1=γ^1β^2=γ^2γ^1
  • ¿Los intervalos de confianza son necesariamente los mismos?
  • ¿Tiene algún sentido decir que el investigador A tiene una ventaja psicológica sobre el investigador B en el caso de que β2=0 , porque es más probable que el investigador A sospeche eso y cambie a estimar el modelo más parsimonioso h(t)=hgender(t)exp(β1age) ?
Vincent
fuente

Respuestas:

4

Con modelos donde cada parámetro tiene que ser estimado (como Mínimos Cuadrados Ordinarios), es posible crear una situación en la que dos modelos separados tengan las mismas estimaciones de uno solo con un término de interacción. Por ejemplo, podríamos tener: , Y F = α F + β Fa g e resumido por: Y = λ + λ FF + γ a g e + γYM=αM+βMageYF=αF+βFage , para que pueda estimar directamente la diferencia de género tanto en intercepción como en pendiente. De hecho: α M = λ , β M = γ , α F - α M = λ F , β F - β M = γ F . En ese caso, estoy de acuerdo con usted en que el modelo único permitiría tener una idea inmediata sobre la diferencia de género (dada por los parámetros de interacción, λ FY=λ+λFF+γage+γFFageαM=λ,βM=γ,αFαM=λF,βFβM=γFλFhgender(t)

Véase, por ejemplo, el Capítulo "Análisis de supervivencia" de Kleinbaum y Klein, 2012, Parte de la serie Estadísticas de biología y salud.

Federico Tedeschi
fuente