Tengo una regresión logística binaria con solo un predictor binario de factor fijo. La razón por la que no lo hago como un Chi cuadrado o la prueba exacta de Fisher es que también tengo una serie de factores aleatorios (hay múltiples puntos de datos por individuo y los individuos están en grupos, aunque no me importan los coeficientes o significados para esas variables aleatorias). Hago esto con R glmer.
Me gustaría poder expresar el coeficiente y el intervalo de confianza asociado para el predictor como una razón de riesgo en lugar de una razón de probabilidades. Esto se debe a que (tal vez no para usted sino para mi audiencia) la relación de riesgo es mucho más fácil de entender. La razón de riesgo aquí es el aumento relativo en la posibilidad de que el resultado sea 1 en lugar de 0 si el predictor es 1 en lugar de 0.
La razón de posibilidades es trivial para obtener del coeficiente y el IC asociado usando exp (). Para convertir una razón de probabilidades en una razón de riesgo, puede usar "RR = OR / (1 - p + (px OR)), donde p es el riesgo en el grupo de control" (fuente: http: //www.r- bloggers.com/how-to-convert-odds-ratios-to-relative-risks/) Pero, necesita el riesgo en el grupo de control, que en mi caso significa la posibilidad de que el resultado sea 1 si el predictor es 0. Creo que el coeficiente de intercepción del modelo es, de hecho, las probabilidades de esta posibilidad, por lo que puedo usar prob = odds / (odds + 1) para obtener eso. Soy bastante bueno en esto en lo que respecta a la estimación central de la relación de riesgo. Pero lo que me preocupa es el intervalo de confianza asociado, porque el coeficiente de intercepción también tiene su propio IC asociado. ¿Debo usar la estimación central de la intercepción, o para ser conservador, debo usar cualquier límite del IC de intercepción que amplíe mi IC de riesgo relativo? ¿O estoy ladrando por completo el árbol equivocado?
Respuestas:
Zhang 1998 originalmente presentó un método para calcular los IC para las razones de riesgo, lo que sugiere que podría usar los límites inferior y superior de la IC para la razón de probabilidades.
Este método no funciona, está sesgado y generalmente produce estimaciones anticonservadoras (demasiado estrictas) de la razón de riesgo IC del 95%. Esto se debe a la correlación entre el término de intercepción y el término de pendiente al que aludir correctamente. Si la razón de probabilidad tiende a su valor más bajo en el IC, el término de intercepción aumenta para tener en cuenta una prevalencia general más alta en aquellos con un nivel de exposición 0 y, a la inversa, un valor más alto en el IC. Cada uno de estos, respectivamente, conduce a límites inferiores y superiores para el IC.
Para responder a su pregunta directamente, necesita conocer la prevalencia inicial del resultado para obtener intervalos de confianza correctos. Los datos de los estudios de casos y controles se basarían en otros datos para informar esto.
Alternativamente, puede usar el método delta si tiene la estructura de covarianza completa para las estimaciones de los parámetros. Una parametrización equivalente para la transformación OR a RR (que tiene exposición binaria y un único predictor) es:
Y usando el método delta multivariante, y el teorema del límite central que establece quen−−√([β^0,β^1]−[β0,β1])→DN(0,I−1(β)) , puede obtener la varianza de la distribución normal aproximada de RR .
Tenga en cuenta que, lógicamente, esto solo funciona para la exposición binaria y la regresión logística univariada. Hay algunos trucos R simples que utilizan el método delta y la estandarización marginal para covariables continuas y otras variables de ajuste. Pero por brevedad no discutiré eso aquí.
Sin embargo, hay varias formas de calcular los riesgos relativos y su error estándar directamente de los modelos en R. Dos ejemplos de esto a continuación:
http://research.labiomed.org/Biostat/Education/Case%20Studies%202005/Session4/ZhangYu.pdf
fuente
probratio
. Nota: el contacto es lamentablemente desactualizado :( rdrr.io/cran/epitools/man/probratio.htmlglm
objeto como argumento a laprobratio
función. Necesito encontrar el RR en un metanálisis. ¿Alguna ventaja en forma de notación matemática como escribiste anteriormente?