¿Ajustar para todo lo que tienes en puntaje de propensión?

9

Tengo una pregunta metodológica y, por lo tanto, no se adjunta ningún conjunto de datos de muestra.

Estoy planeando hacer una regresión de Cox ajustada por puntaje de propensión que tenga como objetivo examinar si un determinado medicamento reducirá el riesgo de un resultado. El estudio es observacional y comprende 10,000 individuos.

El conjunto de datos contiene 60 variables. Considero que 25 de estos podrían afectar la asignación del tratamiento. Nunca me ajustaría para los 25 de estos en una regresión de Cox, pero he oído que puede incluir tantas variables como predictores en un puntaje de propensión y luego solo incluir la subclase de puntaje de propensión y la variable de tratamiento en la regresión de Cox.

(las covariables que no serán iguales después del ajuste de puntaje de apoyo, por supuesto, tendrían que incluirse en la regresión de Cox).

En pocas palabras, ¿es realmente inteligente incluir tantos predictores en el puntaje de apoyo?


@Dimitriy V. Masterov Gracias por compartir estos hechos importantes. Al contrario de los libros y artículos que consideran otros marcos de regresión, no veo ninguna guía (lectura del libro de Rosenbaums) sobre la selección de modelos en los análisis de puntaje de propensión. Si bien los libros de texto estándar / artículos de revisión parecen recomendar siempre una selección de variables estrictas y mantener bajo el número de predictores, no he visto mucha de esta discusión en los análisis de puntaje de apoyo. Usted escribe: (1) "El conocimiento teórico, el conocimiento institucional y una buena investigación deberían guiar la selección de X". Estoy de acuerdo, pero hay circunstancias en las que tenemos una variable a mano y realmente no sabemos (pero podría ser posible) si la variable afecta la asignación al tratamiento o el resultado. Por ejemplo: ¿debería incluir la función renal, como medida por la tasa de filtración, en una puntuación de apoyo con el objetivo de ajustar el tratamiento con estatinas? El tratamiento con estatinas no tiene nada que ver con la función renal y ya he incluido una serie de variables que afectarán el tratamiento con estatinas. Pero aún es tentador incluir la función renal; podría ajustarse aún más. Ahora, algunos dirían que debería incluirse porque afecta el resultado, pero podría darles otro ejemplo (como la variable binaria de vida urbana / rural) de una variable que no afecta el tratamiento ni el resultado, hasta donde sabemos. Pero me gustaría incluirlo, siempre y cuando no t efectúa la precisión del puntaje de apoyo. (2)"La inclusión de X afectadas por el tratamiento, ya sea ex post o ex ante en anticipación del tratamiento, invalidará el supuesto". No estoy seguro de lo que quieres decir aquí. Pero si estudio el efecto de las estatinas en el resultado cardiovascular, incluiré varias mediciones de lípidos en la sangre en el puntaje de propensión. Los lípidos en la sangre se ven afectados por el tratamiento. Creo que entendí mal esta declaración.

@statsRus gracias por compartir los hechos, particularmente lo que llama "una nota sobre la selección de entradas". Creo que razoné de la misma manera que tú.

Desafortunadamente, los métodos de puntaje de apoyo discuten varias estrategias de ajuste en lugar de estrategias de selección de modelos. Quizás el ajuste del modelo no sea importante. Si ese es el caso, me ajustaría para cada variable disponible que pudiera afectar el resultado y la asignación del tratamiento lo más mínimo. No soy un estático, pero si el ajuste del modelo no tiene importancia, me gustaría ajustar todas las variables que podrían afectar la asignación y el resultado del tratamiento. En muchos casos, esto significaría incluir variables que se verán afectadas por el tratamiento.

Además, algunas personas sugieren que la regresión posterior de Cox solo debe incluir la variable de tratamiento y la subclase de puntaje de apoyo. Mientras que otros sugieren que el ajuste de Cox debe incluir el puntaje de apoyo adicionalmente a todas las demás variables para las que se ajustaría.

Adam Robinsson
fuente

Respuestas:

8

Personalmente, he estado haciendo esta pregunta durante al menos 5 años, ya que para mí es la "práctica" gran pregunta para usar la coincidencia de puntaje de propensión en los datos de observación para estimar los efectos causales. Esta es una pregunta excelente y hay un desacuerdo sutil que se extiende profundamente en las comunidades de estadísticas versus informática.

Desde mi experiencia, los estadísticos tienden a abogar por "tirar el fregadero de la cocina" de entradas observables en la estimación del puntaje de propensión, mientras que los informáticos tienden a abogar por una razón teórica para las entradas (aunque los estadísticos pueden mencionar ocasionalmente la importancia de la teoría para justificar la selección de entradas en el modelo de puntaje de propensión). Creo que la diferencia radica en el hecho de que los informáticos (en particular Judea Pearl) tienden a pensar en causal en términos de gráficos acíclicos dirigidos. Al ver la causalidad a través de gráficos acíclicos dirigidos, es bastante fácil ver que puede condicionar una variable denominada "colisionador", que puede "desbloquear" las rutas de la puerta trasera e inducir sesgo en su estimación de un efecto causal.

¿Mi conclusion? Si tiene una teoría sólida sobre lo que afecta la selección en el tratamiento, úsela en la estimación del puntaje de propensión. Luego realice un análisis de sensibilidad para determinar qué tan sensible es su estimación a las variables de confusión no observadas. Si no tiene casi ninguna teoría que lo guíe, tire el "fregadero de la cocina" y luego realice un análisis de sensibilidad.

Una nota sobre la selección de entradas para el modelo de puntaje de propensión (esto puede ser obvio, pero vale la pena señalar para otros que no están familiarizados con la estimación de los efectos causales de los datos de observación): No controle las variables posteriores al tratamiento. Es decir, desea que sus entradas en el modelo de puntaje de propensión se midan antes del tratamiento y que su resultado se mida después del tratamiento. En los datos de observación, esto prácticamente significa que necesita tres ondas de datos, con un conjunto detallado de líneas de base de covariables, el tratamiento medido en la segunda onda y el resultado medido en la onda final.

statsRus
fuente
Este es un artículo reciente que aborda el tema del condicionamiento en una variable colisionadora (su artículo sugiere que el sesgo M es probablemente pequeño, lo que da crédito al enfoque de "sumidero de la cocina" de arrojar entradas al modelo de puntaje de propensión: arxiv.org/abs /1408.0324
statsRus
7

En ausencia de conocimiento de la materia, la inclusión excesiva de variables es generalmente mejor que la inclusión insuficiente, y hay pocas razones para hacer la selección del modelo para construir un PS. Lo más importante es construir un modelo flexible. Mi enfoque predeterminado es spline cada variable continua y no mirarP-valores para variables en el PS, es decir, utilizo un modelo de regresión logística aditivo flexible.

Existen muchas ventajas del ajuste de covariables utilizando el logit PS. Por lo general, utilizo el logit de PS para incluirlo como una variable de ajuste de múltiples grados de libertad, después de realizar la debida diligencia con respecto a las regiones sin superposición. Ver http://www.citeulike.org/user/harrelfe/article/13340175 y http://www.citeulike.org/user/harrelfe/article/13265389 y más artículos en http://www.citeulike.org/ user / harrelfe / tag / propensity-score .

Debe asegurarse de incluir también como covariables separadas los posibles predictores fuertes de Y como PS es solo para el ajuste de sesgo, no para capturar la heterogeneidad de los resultados.

Dudo de cualquier método de coincidencia que resulte en descartar observaciones coincidentes o que sea altamente dependiente del orden del conjunto de datos. Las observaciones descartadas tienen mucho que decir sobre cómo deben estimarse los efectos covariables.

Frank Harrell
fuente
Los enlaces están rotos. ¿Puede explicar cuáles son las ventajas de usar logit de PS en lugar de PS sin procesar para la coincidencia?
DS_Enthusiast
Para que coincida no importa. Pero recomiendo no usar el emparejamiento.
Frank Harrell
3

El conocimiento teórico, el conocimiento institucional y la buena investigación en el campo deberían ser su guía sobre qué Xs para que coincida. No existe un procedimiento de selección de variables determinista que le diga qué variables elegir.

Aquí hay algunas pautas generales. El Supuesto de Independencia Condicional (CIA) se cumplirá siXincluye todas las variables que afectan tanto la participación como los resultados (no ambos, sino ambos). InclusoXs afectados por el tratamiento, ya sea ex post o ex anteen previsión del tratamiento, invalidará el supuesto. Por ejemplo, si un agente sabe que está llegando la vacuna, puede ajustar su comportamiento previo a la inyección. Incluir instrumentos (variables que afectan la participación y no los resultados) también es una mala idea. No ayudarán con el sesgo de selección y pueden empeorar drásticamente el problema de soporte. Por ejemplo, si se alienta a algunas personas a tomar el tratamiento, no debe condicionarlo. La inclusión de variables irrelevantes en la especificación del puntaje de propensión puede aumentar la varianza ya que algunos de los tratados deben descartarse del análisis o las unidades de control deben usarse más de una vez o porque el ancho de banda tiene que aumentar. En resumen, definitivamente no se recomienda el enfoque del fregadero de la cocina.

La CIA no se puede evaluar sin datos experimentales o suposiciones de "sobreidentificación" (como en el caso de la prueba previa al programa u otras pruebas falsas de placebo). Si tiene suficientes datos históricos, definitivamente probaría este último en su conjunto cuidadosamente seleccionado.


Respuesta a la edición:
no puedo comentar sobre los riñones ya que está demasiado lejos de mi área (aparte de los pasteles, de los que sé algo). Urban parece una variable que afecta tanto la participación como el resultado a través de los costos asociados con el viaje al hospital para recibir tratamiento y examen. Podría recoger algunos de los inobservables que nos mantienen despiertos por la noche. La historia de anticipación que tengo en mente es que las personas pueden ajustar su comportamiento si saben que serán tratadas en el futuro, por ejemplo, cambiando sus dietas.

Dimitriy V. Masterov
fuente
2

Debido a que el modelo de puntaje de propensión es puramente predictivo (no le interesan los coeficientes), siempre he entendido que puede arrojar todas las variables que afectan tanto la entrada de cohorte como el resultado. Puede torcer estas variables como lo desee: encuadrarlas, enraizarlas, todo tipo de interacciones, etc., etc., siempre que aumente la calidad predictiva de su modelo.

En teoría, ni siquiera debería tener que preocuparse por los datos retenidos para su modelo predictivo, ya que no desea generalizar estos resultados más allá de su muestra (básicamente, el riesgo de 'sobreajuste' no es un problema). Finalmente, no tiene que limitarse a la regresión logística; a medida que está modelando una salida binaria, incluso puede usar un modelo GAM, básicamente, cualquier cosa para mejorar las tasas de predicción.

(Debo agregar como una nota contraria al punto de uso de @statsRus: en mi experiencia, son los informáticos quienes usan todas las variables, mientras que los estadísticos que consideran cuidadosamente cada una. Supongo que diferentes antecedentes de trabajo producen diferentes hábitos de trabajo).

En cuanto al uso del puntaje, generalmente se desaconseja usarlo como una covariable, tiene menos impacto, y ciertamente no junto con las variables utilizadas para hacer la variable de puntaje. Se podría argumentar si, en el puntaje de propensión, clasificó una variable continua, por ejemplo, la edad, donde luego podría incluir la versión continua en el modelo pero, en realidad, no categoriza la variable en primer lugar ...

El uso de la puntuación para el emparejamiento (con calibradores, especialmente el emparejamiento variable 1: N) es popular, pero creo que la técnica más impactante es como Pesos de tratamiento proporcional inverso (IPTW), aunque no he usado este método y no puedo recordar cómo funciona.

Intente ver el trabajo de Peter C. Austin en la Universidad de Toronto: ha escrito muchos artículos sobre puntajes de propensión. Aquí hay uno sobre coincidencia, por ejemplo.

divaga
fuente