En el análisis de puntaje de propensión, ¿cuáles son las opciones para lidiar con propensiones muy pequeñas o grandes?

$\newcommand{\P}{\mathbb{P}}$ Me interesan los datos de observación en los que la asignación del tratamiento puede explicarse extremadamente bien. Por ejemplo, una regresión logística de

P (A = 1 | X) = (1 + \exp (- (X β)))^{- 1}

$\P(A =1 |X) = (1+ \exp(-(X\beta)))^{-1}$

si asignación de tratamiento y covariables se ajustan muy bien con prueba muy alta o incluso . Esta es una buena noticia para la precisión del modelo de propensión, pero conduce a estimaciones de puntaje de propensión cerrar a o . Estos a su vez conducen a grandes pesos de probabilidad inversa y utilizados en estimadores como el estimador de probabilidad inversa ponderado de expectativa de resultado (observación bajo tratamiento): $A$ $X$ $AUC >.80$ $>.90$

\hat{π} = (1 + \exp (- (X \hat{β})))^{- 1}

$\hat{\pi} = (1+ \exp(-(X \hat{\beta})))^{-1}$

0

$0$

1

$1$

{\hat{π}}^{- 1}

$\hat{\pi}^{-1}$

(1 - \hat{π})^{- 1}

$(1-\hat{\pi})^{-1}$

Y_{1}

$Y_1$

n^{- 1} \sum_{i} {\hat{π_{i}}}^{- 1} A_{i} Y_{1 i} .

$n^{-1} \sum_i \hat{\pi_i}^{-1} A_i Y_{1i}.$

Sospecho que esto hace que las variaciones de las estimaciones sean muy grandes.

Parece un círculo vicioso que los modelos de puntuación de propensión muy discriminativos conducen a pesos extremos.

Mi pregunta : ¿cuáles son las opciones disponibles para hacer este análisis más robusto? ¿Existen alternativas para ajustarse al modelo de puntaje de propensión o cómo lidiar con grandes pesos después de que el modelo se haya ajustado?

missing-data causality propensity-scores survey-weights tomka
fuente

Es posible que desee echar un vistazo a las covariables con cuidado. Debe incluir todas las variables que afectan tanto la participación como los resultados (no ambos). Incluir a los afectados por el tratamiento, ya sea ex post o ex ante en anticipación del tratamiento, es malo. En particular, la inclusión de instrumentos (variables que afectan la participación y no los resultados) también es una idea particularmente mala. No ayudarán con el sesgo de selección y pueden empeorar drásticamente el problema de soporte. Por ejemplo, si se alienta a algunas personas a tomar el tratamiento, no debe condicionarlo.

Dimitriy V. Masterov

@ DimitriyV.Masterov Gracias; Sus últimos puntos parecen interesantes / relevantes para mi situación. Entonces, ¿está diciendo que es mejor no encontrar el mejor modelo de asignación de tratamiento (sino el que incluye los predictores de resultado y asignación)? Pensé que cuanto más precisamente podamos predecir la asignación, mejor.

tomka

Creo que es un error común. Por ejemplo, vea el artículo de Battacharya y Vogt (2012) en International Journal of Statistics and Economics sobre el punto de los instrumentos.

Dimitriy V. Masterov

@ DimitriyV.Masterov mientras que su respuesta puede resolver el problema de las pequeñas inclinaciones en algunas situaciones, todavía puede ser el caso de que el conjunto de respecto tanto a las y es muy discriminativo en . Todavía estoy interesado en opciones para lidiar con este problema.

X

$X$

Y

$Y$

A

$A$

A

$A$

tomka

Esta es una buena detección. Te refieres a la suposición de positividad. Requiere que haya participantes expuestos y no expuestos en cada combinación de los valores de los factores de confusión observados en la población en estudio. Las violaciones de positividad ocurren cuando ciertos subgrupos en una muestra rara vez o nunca reciben algunos tratamientos de interés. Hay muchos documentos sobre este tema, como Austin y Stuart (2015) y Peterson et al. (2012) . Puede buscar más en línea.

usuario36400
fuente

Gracias pero estas seguro? Me refiero a pesos muy pequeños o grandes. Lo que usted describe parece más una superposición entre las distribuciones de propensión de las unidades tratadas frente a las no tratadas (lo que aparentemente se llama positividad, no lo sabía). Sin embargo, parece que puede haber superposición (positividad) sin dejar de tener pesos extremos, ¿no?

tomka

Además, creo que no puede haber superposición (positividad) sin tener pesos extremos.

tomka

Ese artículo de Austin y Stuart discute el uso de pesas estabilizadas, lo que puede ser útil para su situación.

Noah

@Noah lo vio. Es un buen punto de partida. Lamentablemente, no documentan muy bien esta afirmación y no se conoce el efecto que tiene sobre las estimaciones cuando las propensiones son extremas.

tomka

En el análisis de puntaje de propensión, ¿cuáles son las opciones para lidiar con propensiones muy pequeñas o grandes?

Respuestas: