Cálculo de la razón de riesgo utilizando la razón de probabilidad del coeficiente de regresión logística

8

Tengo una regresión logística binaria con solo un predictor binario de factor fijo. La razón por la que no lo hago como un Chi cuadrado o la prueba exacta de Fisher es que también tengo una serie de factores aleatorios (hay múltiples puntos de datos por individuo y los individuos están en grupos, aunque no me importan los coeficientes o significados para esas variables aleatorias). Hago esto con R glmer.

Me gustaría poder expresar el coeficiente y el intervalo de confianza asociado para el predictor como una razón de riesgo en lugar de una razón de probabilidades. Esto se debe a que (tal vez no para usted sino para mi audiencia) la relación de riesgo es mucho más fácil de entender. La razón de riesgo aquí es el aumento relativo en la posibilidad de que el resultado sea 1 en lugar de 0 si el predictor es 1 en lugar de 0.

La razón de posibilidades es trivial para obtener del coeficiente y el IC asociado usando exp (). Para convertir una razón de probabilidades en una razón de riesgo, puede usar "RR = OR / (1 - p + (px OR)), donde p es el riesgo en el grupo de control" (fuente: http: //www.r- bloggers.com/how-to-convert-odds-ratios-to-relative-risks/) Pero, necesita el riesgo en el grupo de control, que en mi caso significa la posibilidad de que el resultado sea 1 si el predictor es 0. Creo que el coeficiente de intercepción del modelo es, de hecho, las probabilidades de esta posibilidad, por lo que puedo usar prob = odds / (odds + 1) para obtener eso. Soy bastante bueno en esto en lo que respecta a la estimación central de la relación de riesgo. Pero lo que me preocupa es el intervalo de confianza asociado, porque el coeficiente de intercepción también tiene su propio IC asociado. ¿Debo usar la estimación central de la intercepción, o para ser conservador, debo usar cualquier límite del IC de intercepción que amplíe mi IC de riesgo relativo? ¿O estoy ladrando por completo el árbol equivocado?

Amorphia
fuente
Posible duplicado de la regresión logística en R (Odds Ratio)
Minnow
Esto de ninguna manera es un duplicado de esa pregunta. No tengo problemas para obtener odds ratios, son las razones de riesgo las que me preguntan. No se mencionan en esa pregunta.
Amorphia

Respuestas:

5

Zhang 1998 originalmente presentó un método para calcular los IC para las razones de riesgo, lo que sugiere que podría usar los límites inferior y superior de la IC para la razón de probabilidades.

Este método no funciona, está sesgado y generalmente produce estimaciones anticonservadoras (demasiado estrictas) de la razón de riesgo IC del 95%. Esto se debe a la correlación entre el término de intercepción y el término de pendiente al que aludir correctamente. Si la razón de probabilidad tiende a su valor más bajo en el IC, el término de intercepción aumenta para tener en cuenta una prevalencia general más alta en aquellos con un nivel de exposición 0 y, a la inversa, un valor más alto en el IC. Cada uno de estos, respectivamente, conduce a límites inferiores y superiores para el IC.

Para responder a su pregunta directamente, necesita conocer la prevalencia inicial del resultado para obtener intervalos de confianza correctos. Los datos de los estudios de casos y controles se basarían en otros datos para informar esto.

Alternativamente, puede usar el método delta si tiene la estructura de covarianza completa para las estimaciones de los parámetros. Una parametrización equivalente para la transformación OR a RR (que tiene exposición binaria y un único predictor) es:

RR=1+exp(β0)1+exp(β0β1)

Y usando el método delta multivariante, y el teorema del límite central que establece que n([β^0,β^1][β0,β1])DN(0,I1(β)), puede obtener la varianza de la distribución normal aproximada de RR.

Tenga en cuenta que, lógicamente, esto solo funciona para la exposición binaria y la regresión logística univariada. Hay algunos trucos R simples que utilizan el método delta y la estandarización marginal para covariables continuas y otras variables de ajuste. Pero por brevedad no discutiré eso aquí.

Sin embargo, hay varias formas de calcular los riesgos relativos y su error estándar directamente de los modelos en R. Dos ejemplos de esto a continuación:

x <- sample(0:1, 100, replace=T)
y <- rbinom(100, 1, x*.2+.2)
glm(y ~ x, family=binomial(link=log))
library(survival)
coxph(Surv(time=rep(1,100), event=y) ~ x)

http://research.labiomed.org/Biostat/Education/Case%20Studies%202005/Session4/ZhangYu.pdf

AdamO
fuente
AdamO, tu respuesta es lo más cerca que he estado de lo que estoy buscando. ¿Me puede indicar en la dirección de derivar el RR del OR de un modelo multivariable multiestatal?
altfi_SU
@altfi_SU Implementé esto en el paquete de epitools como probratio. Nota: el contacto es lamentablemente desactualizado :( rdrr.io/cran/epitools/man/probratio.html
AdamO
Gracias, @AdamO. Es bueno saber que este paquete existe. Sin embargo, estoy trabajando con los resultados publicados de un modelo multivariable y, por lo tanto, no puedo pasar un glmobjeto como argumento a la probratiofunción. Necesito encontrar el RR en un metanálisis. ¿Alguna ventaja en forma de notación matemática como escribiste anteriormente?
altfi_SU hace