Estoy interesado en estimar una razón de riesgo ajustada, análoga a cómo se estima una razón de probabilidad ajustada usando regresión logística. Parte de la literatura (p. Ej., Esto ) indica que usar la regresión de Poisson con los errores estándar de Huber-White es una forma basada en el modelo para hacer esto.
No he encontrado literatura sobre cómo el ajuste por covariables continuas afecta esto. La siguiente simulación simple demuestra que este problema no es tan sencillo:
arr <- function(BLR,RR,p,n,nr,ce)
{
B = rep(0,nr)
for(i in 1:nr){
b <- runif(n)<p
x <- rnorm(n)
pr <- exp( log(BLR) + log(RR)*b + ce*x)
y <- runif(n)<pr
model <- glm(y ~ b + x, family=poisson)
B[i] <- coef(model)[2]
}
return( mean( exp(B), na.rm=TRUE ) )
}
set.seed(1234)
arr(.3, 2, .5, 200, 100, 0)
[1] 1.992103
arr(.3, 2, .5, 200, 100, .1)
[1] 1.980366
arr(.3, 2, .5, 200, 100, 1)
[1] 1.566326
En este caso, la verdadera razón de riesgo es 2, que se recupera de manera confiable cuando el efecto covariable es pequeño. Pero, cuando el efecto covariable es grande, esto se distorsiona. Supongo que esto surge porque el efecto covariable puede empujar hacia arriba contra el límite superior (1) y esto contamina la estimación.
He buscado pero no he encontrado ninguna literatura sobre el ajuste por covariables continuas en la estimación de la razón de riesgo ajustada. Soy consciente de las siguientes publicaciones en este sitio:
- Regresión de Poisson para estimar el riesgo relativo de resultados binarios.
- Regresión de Poisson para datos binarios.
pero no responden mi pregunta ¿Hay algún documento sobre esto? ¿Hay alguna precaución conocida que deba ejercerse?
fuente
Respuestas:
No sé si aún necesita una respuesta a esta pregunta, pero tengo un problema similar en el que me gustaría usar la regresión de Poisson. Al ejecutar su código, descubrí que si configuro el modelo como
en lugar de su modelo de regresión de Poisson, se produce el mismo resultado: el OR estimado es ~ 1.5 a medida que se aproxima ce 1. Por lo tanto, no estoy seguro de que su ejemplo proporcione información sobre un posible problema con el uso de la regresión de Poisson para resultados binarios.
fuente
binomial(link=log)
que realmente se ajuste a un modelo de riesgo relativo, pero rara vez converge debido a la predicción excesiva de resultados.Encuentro que usar la máxima verosimilitud directa con la función de probabilidad adecuada mejora en gran medida la estimación del riesgo relativo. Puede especificar directamente la función de riesgo truncado como la tasa prevista para el proceso.
Usualmente usamos el Hessian para crear CIs para la estimación. No he explorado la posibilidad de usar eso como la matriz "B" (carne) en el error de Huber White y usar los riesgos ajustados para obtener la matriz "A" (pan) ... ¡pero sospecho que podría funcionar! De manera más factible, puede usar un bootstrap para obtener errores del modelo que sean robustos para una relación de media-varianza mal especificada.
Da:
El coeficiente medio te da lo que quieres.
fuente