¿Alguien sabe de una implementación (que no sea la macro SAS) del método de estimación doblemente robusto que se encuentra en:
Funk, MJ, Westreich, D. y otros (2011). Estimación doblemente robusta de los efectos causales. American Journal of Epidemiology, 173 (7): 761-767. [DOI] ?
regression
ADB
fuente
fuente
Respuestas:
La estimación doblemente robusta no es particularmente difícil de implementar en el idioma que elija. Todo lo que realmente está haciendo es controlar las variables de dos maneras, en lugar de una, la idea es que, siempre que uno de los dos modelos utilizados para el control sea correcto, haya controlado con éxito la confusión.
La forma más fácil de hacerlo, en mi opinión, es usar ponderaciones de probabilidad de tratamiento inversa (IPTW) para ponderar el conjunto de datos, luego también incluir variables en un modelo de regresión normal. Así es como los autores abordan el problema en el documento vinculado anteriormente. También hay otras opciones, generalmente basadas en puntajes de propensión utilizados para emparejar o como una covariable en el modelo.
Hay muchas introducciones a IPTW en el lenguaje estadístico que prefiera. Proporcionaría fragmentos de código, pero todos los míos están en SAS, y probablemente leerían mucho como los autores.
Brevemente, lo que debe hacer es modelar la probabilidad de exposición en función de sus covariables utilizando algo como la regresión logística y estimar la probabilidad de exposición pronosticada en función de ese modelo. Esto te da un puntaje de propensión. La probabilidad inversa del peso del tratamiento es, como su nombre indica, 1 / puntaje de propensión. Esto a veces produce valores extremos, por lo que algunas personas estabilizan el peso sustituyendo la probabilidad marginal de exposición (obtenida por un modelo de regresión logística del resultado y sin covariables) por 1 en la ecuación anterior.
En lugar de tratar a cada sujeto en su análisis como 1 sujeto, ahora los trata como n copias de un sujeto, donde n es su peso. Si ejecuta su modelo de regresión utilizando esos pesos e incluyendo covariables, se obtiene una estimación doblemente sólida.
Sin embargo, una advertencia: si bien la estimación robusta doble (o triple, etc.) le brinda más posibilidades de especificar el modelo de covariable correcto, no garantiza que lo haga. Y lo que es más importante, no puede salvarte de confusiones no medidas.
fuente
Parece que hubo una implementación en Stata incluso antes de que se publicara el artículo que citó: http://www.stata-journal.com/article.html?article=st0149 .
fuente
El paquete tmle R implementó el Estimador Basado en Pérdida Mínima Dirigida, que es doblemente robusto y eficiente bajo condiciones. Tiene la ventaja adicional de que es un estimador de sustitución, a diferencia del IPTW Aumentado (que es al que supongo que se refiere).
fuente
tmle
paquete, tal vez un enlace a más información y dónde obtenerlo.Tengo el estimador descrito en Funk et al. 2011 (ponderaciones de probabilidad inversa aumentadas), implementado en la
zEpid
biblioteca Python 3 dentro de laAIPTW
clase. Los detalles y la sintaxis están AQUÍ . La biblioteca también incluye TMLE, en caso de que desee utilizar ambos enfoques.fuente
Hay un paquete R que implementa este estimador DR del ATE (así como algunas otras cosas), el
npcausal
paquete: https://github.com/ehkennedy/npcausalLa función que se ajusta a un estimador DR es
ate()
fuente