Coincidencia de puntaje de propensión después de imputación múltiple

Me refiero a este artículo: Hayes JR, Groner JI. "Utilizando puntajes de imputación y propensión múltiples para evaluar el efecto de los asientos de automóvil y el uso del cinturón de seguridad en la gravedad de las lesiones a partir de los datos del registro de traumatismos". J Pediatr Surg. Mayo de 2008; 43 (5): 924-7.

En este estudio, se realizó una imputación múltiple para obtener 15 conjuntos de datos completos. Los puntajes de propensión se calcularon para cada conjunto de datos. Luego, para cada unidad de observación, se eligió un registro al azar de uno de los 15 conjuntos de datos completados (incluida la puntuación de propensión relacionada), creando así un único conjunto de datos final para el que luego se analizó por coincidencia de puntuación de propensión.

Mis preguntas son: ¿Es esta forma válida de realizar una coincidencia de puntaje de propensión después de una imputación múltiple? ¿Hay formas alternativas de hacerlo?

Para el contexto: en mi nuevo proyecto, mi objetivo es comparar los efectos de 2 métodos de tratamiento utilizando la coincidencia de puntaje de propensión. Faltan datos y tengo la intención de usar el MICEpaquete en R para imputar los valores faltantes, luego twanghacer la coincidencia de puntaje de propensión y luego lme4analizar los datos coincidentes.

Actualización1:

He encontrado este documento que adopta un enfoque diferente: Mitra, Robin y Reiter, Jerome P. (2011) Coincidencia de puntaje de propensión con covariables faltantes a través de imputación múltiple secuencial iterada [Documento de trabajo]

En este artículo, los autores calculan los puntajes de propensión en todos los conjuntos de datos imputados y luego los agrupan promediando, lo que está en el espíritu de la imputación múltiple usando la regla de Rubin para una estimación puntual, pero ¿es realmente aplicable para un puntaje de propensión?

Sería realmente bueno si alguien en CV pudiera proporcionar una respuesta con comentarios sobre estos 2 enfoques diferentes, y / o cualquier otro ...

missing-data propensity-scores Joe King
fuente

Respuestas:

Lo primero que debo decir es que, para mí, el método 1 (muestreo) parece no tener mucho mérito: descarta los beneficios de la imputación múltiple y se reduce a una sola imputación para cada observación, como lo menciona Stas. No veo ninguna ventaja en usarlo.

Hay una excelente discusión sobre los problemas relacionados con el análisis de puntaje de propensión con datos faltantes en Hill (2004): Hill, J. "Reducción del sesgo en la estimación del efecto del tratamiento en estudios observacionales que sufren datos faltantes" Documentos de trabajo de ISERP, 2004. Se puede descargar desde aquí .

El documento considera dos enfoques para usar la imputación múltiple (y también otros métodos para tratar con datos faltantes) y puntajes de propensión:

promedio de puntajes de propensión después de la imputación múltiple, seguido de inferencia causal (método 2 en su publicación anterior)
inferencia causal utilizando cada conjunto de puntajes de propensión de las imputaciones múltiples seguido de un promedio de las estimaciones causales.

Además, el documento considera si el resultado debe incluirse como un predictor en el modelo de imputación.

Hill afirma que, si bien se prefiere la imputación múltiple a otros métodos para tratar con datos faltantes, en general, no existe a priorirazón para preferir una de estas técnicas sobre la otra. Sin embargo, puede haber razones para preferir promediar los puntajes de propensión, particularmente cuando se utilizan ciertos algoritmos de coincidencia. Hill realizó un estudio de simulación en el mismo artículo y descubrió que promediar los puntajes de propensión antes de la inferencia causal, cuando se incluía el resultado en el modelo de imputación, se obtenían los mejores resultados en términos de error cuadrático medio y se promediaban los puntajes primero, pero sin el resultado En el modelo de imputación, se obtuvieron los mejores resultados en términos de sesgo promedio (diferencia absoluta entre el efecto del tratamiento estimado y el verdadero). En general, es recomendable incluir el resultado en el modelo de imputación (por ejemplo, ver aquí ).

Entonces parece que su método 2 es el camino a seguir.

Robert Long
fuente

Entiendo el método número 2, pero no sé cómo implementarlo en R. ¿Alguien tiene alguna referencia para señalarme?

Sam

El código R para ambos métodos se proporciona en la viñeta del cobaltpaquete titulado "Uso de cobalto con datos complicados". Puede acceder aquí: CRAN.R-project.org/package=cobalt

Noah

Puede haber un choque de dos paradigmas. La imputación múltiple es una solución bayesiana fuertemente basada en el modelo: el concepto de la imputación adecuada esencialmente establece que necesita muestrear a partir de la distribución posterior bien definida de los datos, de lo contrario está jodido. La coincidencia de puntaje de propensión, por otro lado, es un procedimiento semiparamétrico: una vez que haya calculado su puntaje de propensión (no importa cómo, podría haber utilizado una estimación de densidad del núcleo, no necesariamente un modelo logit), puede hacer el resto simplemente tomando las diferencias entre las observaciones tratadas y no tratadas con el mismo puntaje de propensión, que ahora es un poco no paramétrico, ya que no queda ningún modelo que controle otras covariables. Yo no'Abadie e Imbens (2008) discutieron que hace que sea imposible acertar con los errores estándar en algunas de las situaciones coincidentes). Daría más confianza a los enfoques más suaves como la ponderación por la propensión inversa. Mi referencia favorita sobre esto es "Econometría en su mayoría inofensiva" , subtitulada "Un compañero empirista" y dirigida a economistas, pero creo que este libro debería ser una lectura obligatoria para otros científicos sociales, la mayoría de los bioestadísticos y estadísticos no bio así que saben cómo otras disciplinas abordan el análisis de datos.

En cualquier caso, usar solo una de las 15 líneas de datos completas simuladas por observación es equivalente a una sola imputación. Como resultado, pierde eficiencia en comparación con los 15 conjuntos de datos completados, y no puede estimar los errores estándar correctamente. A mí me parece un procedimiento deficiente, desde cualquier ángulo.

Por supuesto, felizmente barremos bajo la alfombra la suposición de que tanto el modelo de imputación múltiple como el modelo de propensión son correctos en el sentido de tener todas las variables correctas en todas las formas funcionales correctas. Hay poca forma de verificar eso (aunque me alegraría saber lo contrario sobre las medidas de diagnóstico para ambos métodos).

Stask
fuente

(+1) En particular porque no me siento bien acerca de las discontinuidades introducidas por la implementación literal de la correspondencia (encuentre el control con el valor más cercano posible del puntaje de propensión e ignore el resto) . El puntaje de propensión siempre me ha parecido un procedimiento bastante duro de todos modos.

Cardenal

@ cardinal, ver actualización.

StasK

De hecho, he visto más críticas de IPTW que las que he hecho con otros métodos (necesitaré leer más). Ver regresiones de ponderación por puntajes de propensión ( Freedman y Berk, 2008 ), y para un ejemplo aplicado, ver Bjerk, 2009 . No estoy muy seguro de por qué recomienda la Econometría inofensiva en respuesta aquí, pero es una buena recomendación para cualquier persona interesada en estudios observacionales.

Andy W

@ Andy, la pieza de Freedman & Berk parece lidiar con una situación mucho más simple cuando puedes modelar todo en una regresión logística. Tengo entendido que los métodos como PSM se aplican en situaciones mucho más desordenadas cuando tienes muchas más covariables, y no confías en el modelo lo suficientemente bien como para asumir que está especificado correctamente. Notaron que la situación era favorable para la ponderación, pero creo que fue favorable para el modelo en comparación con otros métodos posibles.

StasK

Debido a que sus datos no son iid, y el gran teorema de máxima verosimilitud sobre la igualdad de la arpillera inversa y el producto externo del gradiente ya no es válido, y ninguno de ellos es una estimación consistente de las variaciones. Uno necesita usar el estimador de varianza sandwich, también conocido como estimador de linealización en las estadísticas de la encuesta, también conocido como estimador robusto blanco en econometría.

StasK

Realmente no puedo hablar sobre los aspectos teóricos de la pregunta, pero daré mi experiencia usando modelos PS / IPTW e imputación múltiple.

Nunca he oído hablar de alguien que use conjuntos de datos con imputación múltiple y muestreo aleatorio para crear un solo conjunto de datos. Eso no significa necesariamente que esté mal, pero es un enfoque extraño de usar. El conjunto de datos tampoco es lo suficientemente grande como para necesitar ser creativo para moverse ejecutando 3-5 modelos en lugar de solo uno para ahorrar tiempo y cómputo.
La regla de Rubin y el método de agrupación es una herramienta bastante general. Dado el resultado agrupado, el resultado imputado múltiple se puede calcular utilizando solo la varianza y las estimaciones, no hay razón para que pueda ver que no se puede usar para su proyecto: crear los datos imputados, realizar el análisis en cada conjunto y luego agruparlos. Es lo que he hecho, es lo que he visto hacer, y a menos que tenga una justificación específica para no hacerlo, realmente no puedo ver una razón para ir con algo más exótico, especialmente si no entiende lo que hay continuando con el método.

Fomite
fuente

+1 Esta es una pregunta a la que es difícil dar una buena respuesta, ya que parece ser un artículo tan altamente especializado. Pero además de afirmar que perdió la recompensa por una pregunta similar anterior, el OP agregó una pregunta pidiendo soluciones que se migraron a meta. Hice comentarios similares a los suyos en mi respuesta allí. Tengo dudas sobre la muestra del conjunto de datos imputados de forma múltiple.

Michael R. Chernick

Gracias ! ¿Tiene alguna referencia de dónde se ha utilizado el método 2?

Joe King

@JoeKing Lamentablemente, no fuera de mi cabeza.

Fomite