Ponderación del puntaje de propensión en el análisis de Cox PH y la selección de covariables

11

Con respecto a la ponderación de puntaje de propensión (IPTW) al realizar el modelado de riesgo proporcional de Cox de los datos de supervivencia del tiempo hasta el evento:

Tengo datos de registro prospectivos en los que estamos interesados ​​en observar el efecto del tratamiento de un medicamento que en la mayoría de los casos los pacientes ya estaban tomando al inicio del estudio. Por lo tanto, no estoy seguro de cómo analizar mejor los datos. Potencialmente, algunas de las variables de referencia están influenciadas en gran medida por el tratamiento y no al revés (por ejemplo, ciertos biomarcadores). Estoy un poco perdido en cuanto a qué covariables debería incluir en el modelo de puntaje de propensión para estimar los pesos y qué covariables debería incluir como covariables en el coxphmodelo (si las hubiera). ¡Cualquier sugerencia en la dirección correcta sería útil! Hasta el momento no he podido encontrar ninguna literatura sobre esto en el modelado de CoxPh.

Estoy pensando que las covariables que representan tratamientos instituidos al inicio del estudio que (podrían) influir en el resultado deberían incluirse como covariables de Cox PH, pero no estoy seguro de esto.

¿Cómo determino qué variables deben incluirse como covariables en el modelo de Cox en lugar de usarse para calcular los pesos del puntaje de propensión?


Siguiente pregunta:

Entiendo el problema heredado de evaluar el efecto del tratamiento de una determinada intervención que ya ha comenzado, es decir, prevalece entre los pacientes, antes del inicio de la observación. Tanto en lo que respecta a la introducción de sesgos relacionados con la variación en el tiempo del riesgo (por ejemplo, los efectos secundarios adversos más comunes el primer año de tratamiento) y las covariables que se ven afectadas por el tratamiento. Si no me equivoco, esto se ha propuesto como una causa de discrepancia entre la observación y la aleatorización en lo que respecta a los puntos finales cardiovasculares y la terapia de reemplazo hormonal. Por otro lado, en mi conjunto de datos, estamos interesados ​​en observar un posible efecto adverso del tratamiento.

Si uso el ajuste de puntaje de propensión para investigar el efecto del tratamiento entre los usuarios frecuentes, es decir, si ya estoy usando el medicamento antes de que comience la observación, en los datos de cohortes y observamos un efecto adverso de una terapia farmacológica (y esto es lo que estábamos buscando). ¿Puedo descartar la posibilidad de sobreestimar el riesgo asociado con el tratamiento? Es decir, siempre y cuando el riesgo sea significativamente elevado, ¿es "definitivamente" no protector?

No puedo imaginar un ejemplo en el que este tipo de sesgo pueda introducir una sobreestimación del riesgo de asociación de riesgo falso en este contexto.

Kjetil Loland
fuente

Respuestas:

9

En teoría, no es necesario incluir todas las variables que seleccione como parte del peso del puntaje de propensión como covariables en el modelo, porque la ponderación ya ha controlado su posible confusión. Con un modelo de ponderación adecuado, puede, literalmente, simplemente modelar el efecto de la exposición.

Dicho esto, hay razones por las que es posible que desee incluir términos en el modelo:

  • Estimaciones "doblemente robustas". No hay ninguna razón, salvo una pérdida de precisión, que no pueda usar variables tanto en el modelo de ponderación como en covariables. En teoría, te estás protegiendo de dos formas de confusión (de ahí que esta técnica se denomine "doblemente robusta"). Tenga en cuenta que esto solo lo protege contra el modelo PS o el modelo covariable que está mal especificado al darle una "segunda oportunidad" para especificar el modelo correcto, no es una solución mágica.
  • Múltiples estimaciones de interés. La ponderación hace que las estimaciones del efecto de las covariables desaparezcan: si desea un coeficiente de regresión para la variable, querrá incluirlo como una covariable en el paso CoxPH y no en el modelo PS.

Intente buscar términos "doblemente robustos" y similares en revistas como Epidemiology o The American Journal of Epidemiology , así como en la literatura bioestadística, y debería descubrir algunas fuentes útiles.

Fomite
fuente
¡Gracias por una respuesta (rápida) y clara! He visto que se menciona doblemente robusto, pero examiné demasiado. Definitivamente lo haré ahora. ¿Diría que se justifica el uso de estimaciones doblemente robustas cuando las covariables no se ajustan adecuadamente después de la ponderación (por ejemplo) aún diferencias significativas entre los grupos de tratamiento?
Kjetil Loland
1
@KjetilLoland Esa puede ser una razón para usar una estimación doblemente robusta; en general, es algo a tener en cuenta cada vez que le preocupa que un método para controlar las variables esté sufriendo una especificación errónea. También verificaría para asegurarme de que su modelo de PS no esté actuando y le esté dando puntajes de propensión agradables y superpuestos entre los dos grupos.
Fomite
1
Debido a la no colapsabilidad de la razón de riesgo, no es adecuado incluir solo las variables en el PS. Es común dejar que el PS incluya el "fregadero de la cocina" y que los predictores más importantes se vuelvan a incluir como covariables. Esto evitará la subestimación de la relación de riesgos de la exposición.
Frank Harrell
Nuevamente, gracias a ambos @EpiGrad y Frank por sus respuestas. No puedo decir exactamente que los grupos de tratamiento tengan puntajes de propensión agradables y superpuestos. Por lo tanto, probablemente terminaría usando un amplio ajuste de covariables. En una nota al margen, noté que escribí IPTW, cuando de hecho estoy usando el paquete twang, que utiliza una regresión aumentada generalizada para estimar los pesos (si tengo razón), pero supongo que eso no cambia el enfoque general mucho.
Kjetil Loland
@KjetilLoland Al menos puede inspeccionar visualmente si sus puntajes de PS se superponen o no al observar los gráficos superpuestos de su distribución por grupo de tratamiento.
Fomite
3

Es importante distinguir "afectados por el tratamiento" y "relacionados con el tratamiento". Este último puede incluir factores de selección de tratamiento como los que estamos tratando de ajustar con propensión y / o ajuste covariable. "Afectados por el tratamiento" implica que las covariables se miden después del tiempo cero (p. Ej., Después de la aleatorización o después del inicio del tratamiento), lo que significa que rara vez se deben usar.

Frank Harrell
fuente
De nuevo, gracias Dr. Harrell. Algunas de nuestras variables definitivamente están "afectadas por el tratamiento". El tratamiento que estamos tratando de investigar se inició antes de la línea de base, lo que por supuesto no es ideal. Si el ajuste del puntaje de propensión es adecuado o no para este tipo de análisis, tal vez sea una mejor pregunta. Sin embargo, no conozco ninguna otra forma de investigar esto.
Kjetil Loland
El diseño del estudio puede no ser adecuado para lo que desea hacer. El estudio será muy difícil de interpretar. Es posible que los expertos en la materia traten de encontrar un subconjunto de variables que es muy probable que no cambien con el tratamiento, pero el ajuste por confusión por implicación puede ser incompleto.
Frank Harrell
Veo. Supongo que esto comienza a parecerse un poco a los viejos estudios observacionales versus aleatorizados de TRH sobre ECV. Corríjame si me equivoco, pero no es todo lo que "arriesgo" a subestimar el riesgo de un posible efecto adverso del tratamiento (que es lo que estamos buscando), es decir, siempre que demostremos que el tratamiento es adverso, ese tipo de factores de confusión solo podrían debilitar el hallazgo? He actualizado la pregunta en consecuencia.
Kjetil Loland
2
Esto es más que un problema observacional versus aleatorio, pero existe una relación con los estudios de TRH. Es posible que tenga razón en que un razonamiento cuidadoso justifique tratar los resultados como un límite inferior.
Frank Harrell