He llevado a cabo el emparejamiento de puntaje de prospensión (en R usando el paquete R "Matchit"). Utilicé el método de coincidencia "vecino más cercano". Después de la comparación, comparé el tratamiento y el grupo de control en términos de su variable de resultado. Para esta comparación, utilicé la prueba t. Descubrí que después de cada procedimiento de coincidencia, los resultados de la prueba t cambiaron. Para probar mi suposición de que este cambio en los resultados se debió a la selección aleatoria de los puntajes de propensión (que se usan para la coincidencia de vecinos más cercanos) configuré el generador de números aleatorios en una semilla específica y realicé el procedimiento de coincidencia varias veces. Al configurar el RNG, los resultados ya no diferían.
- Enfrentado con resultados diferentes después de cada procedimiento de correspondencia: ¿cómo decido qué solución de correspondencia uso para un análisis más detallado? ¿Es un método válido para llevar a cabo el procedimiento de coincidencia varias veces (digamos 10'000) e informar la mediana de los valores p y t de los resultados que obtengo de las diversas pruebas t?
Respuestas:
Esto sucede cuando tiene (al menos) dos personas que tienen el mismo puntaje de propensión. MatchIt selecciona aleatoriamente uno para incluir en el conjunto coincidente. Mi recomendación sería seleccionar un conjunto coincidente y llevar a cabo su análisis con él. Estoy de acuerdo en que probar otros métodos de acondicionamiento como la coincidencia completa y IPW sería una buena idea. Puede informar los resultados de varios análisis en una sección de análisis de sensibilidad.
Editar : Esta es probablemente la respuesta incorrecta. Vea la respuesta de Viktor para lo que probablemente sea la causa real.
fuente
set.seed()
antes de la coincidencia.Este es un comportamiento estándar del paquete MatchIt. Mezcla las observaciones antes de la coincidencia, es decir, selecciona aleatoriamente el orden de coincidencia para las observaciones tratadas. Puede usar la
set.seed()
función para corregir los resultados. Por ejemplo, llameset.seed(100)
antes de llamarmatchit()
. Diferentes argumentos deset.seed()
corresponderán a diferentes coincidencias.fuente
Esta es una pregunta muy interesante. La primera explicación que puedo sugerir es que su estudio es bastante pequeño y, por lo tanto, pocas diferencias coincidentes son impactantes. Más en general, la coincidencia de vecinos más cercanos no es muy precisa. La calibración del calibrador es más confiable, y posiblemente las diferencias que informe disminuyan o desaparezcan al usarlo (como con el uso de la ponderación de tratamiento de probabilidad inversa). Finalmente, no estoy seguro de si usó la prueba t para comparar las diferencias de la línea de base (lo cual es inapropiado, ya que esto debería hacerse calculando las diferencias estandarizadas), o para la prueba de hipótesis (en cuyo caso se debe usar una prueba emparejada). En cualquier caso, el enfoque de informe típico es simplemente informar los resultados de un solo procedimiento de coincidencia, siempre y cuando se realice correctamente (por ejemplo, con la comparación de calibre).
fuente