Intervalo de confianza para el efecto del tratamiento promedio de la ponderación de puntaje de propensión?

9

Estoy tratando de estimar el efecto promedio del tratamiento a partir de datos de observación utilizando la ponderación de puntaje de propensión (específicamente IPTW). Creo que estoy calculando el ATE correctamente, pero no sé cómo calcular el intervalo de confianza del ATE teniendo en cuenta los pesos del puntaje de propensión inversa.

Aquí está la ecuación que estoy usando para calcular el efecto promedio del tratamiento (referencia Stat Med. 10 de septiembre de 2010; 29 (20): 2137–2148.): Donde número total de sujetos, estado del tratamiento, estado del resultado y puntaje de propensión.

ATE=1N1NZiYipi1N1N(1Zi)Yi1pi
N=Zi=Yi=pi=

¿Alguien sabe de un paquete R que calcule el intervalo de confianza del efecto promedio del tratamiento, teniendo en cuenta los pesos? ¿Podría surveyayudar el paquete aquí? Me preguntaba si esto funcionaría:

library(survey)
sampsvy=svydesign(id=~1,weights=~iptw,data=df)
svyby(~surgery=='lump',~treatment,design=sampsvy,svyciprop,vartype='ci',method='beta')

#which produces this result:
  treatment surgery == "lump"      ci_l      ci_u
   No         0.1644043 0.1480568 0.1817876
   Yes         0.2433215 0.2262039 0.2610724

No sé a dónde ir desde aquí para encontrar el intervalo de confianza de la diferencia entre las proporciones (es decir, el efecto promedio del tratamiento).

JJM
fuente
No puedo responder específicamente, pero el libro "Encuestas complejas: una guía para el análisis usando R" del autor del paquete de encuestas cubre IPTW, y puede ser de ayuda. books.google.com/…
kaz_yos

Respuestas:

11

No necesitas el surveypaquete ni nada complicado. Wooldridge (2010, p. 920 en adelante) "Análisis econométrico de datos de sección transversal y panel" tiene un procedimiento simple a partir del cual puede obtener los errores estándar para construir los intervalos de confianza.

Bajo el supuesto de que ha especificado correctamente el puntaje de propensión que denotamos como , defina el puntaje a partir de la estimación del puntaje de propensión (es decir, su primer logit o regresión probit ) como y dejar como lo tienes en tu expresión anterior. Luego tome los análogos de muestra de estas dos expresiones y regrese enp(xi,γ)

di=γp(xi,γ)[Zip(xi,γ)]p(xi,γ)[1p(xi,γ)]
ATEi=[Zip(xi,γ)]Yip(xi,γ)[1p(xi,γ)]
ATE^id^i. Asegúrese de incluir una intersección en esta regresión. Sea el residuo de esa regresión, entonces la varianza asintótica de es simplemente . Entonces, el error estándar asintótico de su ATE es eiN(ATE^ATE)Var(ei)
[1Ni=1Nei2]12N

Luego puede calcular el intervalo de confianza de la manera habitual (consulte, por ejemplo, los comentarios a la respuesta aquí para ver un ejemplo de código). No necesita ajustar el intervalo de confianza nuevamente para los pesos de puntaje de propensión inversa porque este paso ya se incluyó en el cálculo de los errores estándar.

Desafortunadamente, no soy un tipo R, así que no puedo proporcionarle el código específico, pero el procedimiento descrito anteriormente debería ser sencillo de seguir. Como nota al margen, esta es también la forma en que funciona el treatrewcomando en Stata. Este comando fue escrito e introducido en el Stata Journal por Cerulli (2014) . Si no tiene acceso al artículo, puede consultar sus diapositivas que también describen el procedimiento para calcular los errores estándar a partir de la ponderación de puntaje de propensión inversa. Allí también analiza algunas diferencias conceptuales leves entre estimar el puntaje de propensión a través de logit o probit, pero por el bien de esta respuesta no fue demasiado importante, por lo que omití esta parte.

Andy
fuente