¿Qué tan bien puede la regresión múltiple realmente "controlar para" las covariables?

45

Todos estamos familiarizados con los estudios observacionales que intentan establecer un vínculo causal entre un predictor X no aleatorio y un resultado al incluir todos los posibles factores de confusión imaginables en un modelo de regresión múltiple. Al "controlar" todos los factores de confusión, dice el argumento, aislamos el efecto del predictor de interés.

Estoy desarrollando una incomodidad cada vez mayor con esta idea, basada principalmente en comentarios extraños hechos por varios profesores de mis clases de estadística. Se dividen en algunas categorías principales:

1. Solo puede controlar las covariables que piensa y mide.
Esto es obvio, pero me pregunto si en realidad es el más pernicioso e insuperable de todos.

2. El enfoque ha llevado a errores feos en el pasado.

Por ejemplo, Petitti y Freedman (2005) analizan cómo el valor de décadas de estudios observacionales ajustados estadísticamente llegó a conclusiones desastrosamente incorrectas sobre el efecto de la terapia de reemplazo hormonal en el riesgo de enfermedad cardíaca. Los ECA posteriores encontraron efectos casi opuestos.

3. La relación predictor-resultado puede comportarse de manera extraña cuando controlas las covariables.

Yu-Kang Tu, Gunnell y Gilthorpe (2008) analizan algunas manifestaciones diferentes, incluidas la Paradoja de Lord, la Paradoja de Simpson y las variables supresoras.

4. Es difícil para un modelo único (regresión múltiple) ajustar adecuadamente las covariables y modelar simultáneamente la relación predictor-resultado.

He escuchado esto dado como una razón para la superioridad de métodos como los puntajes de propensión y la estratificación en los factores de confusión, pero no estoy seguro de entenderlo realmente.

5. El modelo ANCOVA requiere que la covariable y el predictor de interés sean independientes.

Por supuesto, nos ajustamos a los factores de confusión precisamente PORQUE están correlacionados con el predictor de interés, por lo que parece que el modelo no tendrá éxito en los casos exactos cuando más lo queremos. El argumento dice que el ajuste solo es apropiado para la reducción de ruido en ensayos aleatorios. Miller y Chapman, 2001 dan una gran crítica.

Entonces mis preguntas son:

  1. ¿Qué tan graves son estos problemas y otros que quizás no conozca?
  2. ¿Cuánto miedo debería tener cuando veo un estudio que "controla todo"?

(Espero que esta pregunta no se adentre demasiado en el territorio de discusión e invito con gusto cualquier sugerencia para mejorarla).

EDITAR : agregué el punto 5 después de encontrar una nueva referencia.

medio paso
fuente
1
Para la pregunta 2, creo que 'controles para todo' es un tema de especificación más general. Tengo problemas para pensar en una situación en la que un modelo paramétrico se especifica correctamente. Dicho esto, un modelo simplifica la realidad, y ahí es donde radica el arte de este tipo de estudio. El investigador tiene que decidir qué es y qué no es importante en el modelo.
Kirk
44
Con esta pregunta me has hecho fan.
rolando2
1
Creo que esto plantea algunos puntos muy buenos; pero creo que las respuestas están fuera del campo estrictamente estadístico. Por lo tanto, cualquier resultado estadístico es más valioso si 1) se replica 2) es sustancialmente viable, etc. También vea los criterios MAGIC y el argumento general que hace Abelson.
Peter Flom - Restablece a Monica
1
El punto 5 es absolutamente falso. El artículo de Miller & Chapman está completamente equivocado, punto final.
Jake Westfall
1
@ medio paso No estoy seguro de qué más decir al respecto, aparte de que la afirmación central del artículo, es decir, que el predictor focal X y la covariable C no deben estar correlacionados, simplemente no es cierto. Tenga en cuenta que ANCOVA es solo un modelo de regresión, por lo que esta misma línea de razonamiento aparentemente invalidaría casi todos los usos del mundo real de la regresión múltiple. Tuve una discusión en Twitter sobre este horrible artículo hace varios meses: twitter.com/CookieSci/status/902298218494644228
Jake Westfall

Respuestas:

4

Hay una respuesta cada vez más aceptada, no estadística, tal vez: ¿qué suposiciones hay que hacer para afirmar que uno realmente ha controlado las covariables?

Eso se puede hacer con los gráficos causales de Judea Pearl y hacer cálculos .

Consulte http://ftp.cs.ucla.edu/pub/stat_ser/r402.pdf , así como otro material en su sitio web.

Ahora, como estadísticos, sabemos que todos los modelos son falsos, y la verdadera pregunta estadística es si los supuestos identificados probablemente no sean demasiado incorrectos, de modo que nuestra respuesta sea aproximadamente correcta. Pearl es consciente de esto y lo discute en su trabajo, pero tal vez no de manera explícita y con la frecuencia suficiente para evitar frustrar a muchos estadísticos con su afirmación de tener una respuesta (lo que creo que hace con respecto a qué suposiciones hay que hacer ).

(Actualmente, la ASA está ofreciendo un premio por material didáctico para incluir estos métodos en cursos estadísticos, ver aquí )

Phaneron
fuente
Gran referencia a una elegante representación gráfica, gracias.
medio pase el
0

Respuesta a la pregunta 1:

  • La magnitud de la seriedad se evalúa mejor de manera contextual (es decir, debe considerar todos los factores que contribuyen a la validez).
  • La magnitud de la seriedad no debe evaluarse de manera categórica. Un ejemplo es la noción de una jerarquía de inferencia para los diseños de estudio (por ejemplo, los informes de casos son más bajos y los ECA son categóricamente más altos). Este tipo de esquema se enseña con frecuencia en las escuelas de medicina como una heurística fácil para identificar rápidamente evidencia de alta calidad. El problema con este tipo de pensamiento es que es algorítmico y demasiado determinista en realidad, la respuesta en sí misma está sobredeterminada. Cuando esto sucede, puede perderse las formas en que los ECA mal diseñados pueden producir peores resultados que un estudio observacional bien diseñado.
  • Vea esta revisión fácil de leer para una discusión completa de los puntos anteriores desde la perspectiva de un epidemiólogo (Rothman, 2014) .

Respuesta a la pregunta 2:

Flaunk
fuente