¿Cómo puedo interpretar los efectos principales (coeficientes para el factor codificado ficticio) en una regresión de Poisson?
Supongamos el siguiente ejemplo:
treatment <- factor(rep(c(1, 2), c(43, 41)),
levels = c(1, 2),
labels = c("placebo", "treated"))
improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)),
levels = c(1, 2, 3),
labels = c("none", "some", "marked"))
numberofdrugs <- rpois(84, 10) + 1
healthvalue <- rpois(84, 5)
y <- data.frame(healthvalue, numberofdrugs, treatment, improved)
test <- glm(healthvalue~numberofdrugs+treatment+improved, y, family=poisson)
summary(test)
El resultado es:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.88955 0.19243 9.819 <2e-16 ***
numberofdrugs -0.02303 0.01624 -1.418 0.156
treatmenttreated -0.01271 0.10861 -0.117 0.907 MAIN EFFECT
improvedsome -0.13541 0.14674 -0.923 0.356 MAIN EFFECT
improvedmarke -0.10839 0.12212 -0.888 0.375 MAIN EFFECT
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Sé que la tasa de incidentes numberofdrugs
es exp(-0.023)=0.977
. Pero, ¿cómo interpreto los principales efectos de las variables ficticias?
r
generalized-linear-model
interpretation
poisson-distribution
regression-coefficients
gung - Restablece a Monica
fuente
fuente
Respuestas:
El
numberofdrugs
coeficiente exponencial es el término multiplicativo que se utiliza para calcular el estimadohealthvalue
cuandonumberofdrugs
aumenta en 1 unidad. En el caso de variables categóricas (factor), el coeficiente exponencial es el término multiplicativo relativo al nivel base (primer factor) para esa variable (ya que R usa contrastes de tratamiento por defecto). Elexp(Intercept)
es la tasa de referencia, y todas las demás estimaciones serían relativas a ella.En su ejemplo, el estimado
healthvalue
para alguien con2
drogas,"placebo"
yimprovement=="none"
sería (usando la suma dentro de exp como el equivalente de la multiplicación):Mientras que alguien en
4
drogas,"treated"
y la"some"
mejora tendría un estimadohealthvalue
deADENDA: Esto es lo que significa ser "aditivo en la escala logarítmica". "Aditivo en la escala de probabilidades de registro" fue la frase que mi maestra, Barbara McKnight, usó al enfatizar la necesidad de usar todos los coeficientes de término que se aplicaban en la regresión logística al hacer cualquier tipo de predicción. Primero agrega todos los coeficientes multiplicados por valores de covariables y luego expondrá. La forma de devolver los coeficientes de los objetos de regresión en R es generalmente usar la
coef()
función de extracción (realizada con una realización aleatoria diferente a continuación):Entonces, el cálculo de la estimación para un sujeto con
4
drogas"treated"
, con"some"
mejoría sería:Y el predictor lineal para ese caso debería ser la suma de:
Estos principios deberían aplicarse a cualquier paquete de estadísticas que devuelva una tabla de coeficientes al usuario. El método y los principios son más generales de lo que podría parecer de mi uso de R.
Estoy copiando los comentarios aclaradores seleccionados ya que 'desaparecen' en la pantalla predeterminada:
R: Los coeficientes son los natural_logaritmos de las razones. - DWin
A2: No. Si se tratara de una regresión logística, lo serían pero en la regresión de Poisson, donde el LHS es el número de eventos y el denominador implícito es el número en riesgo, entonces los coeficientes exponenciados son "razones de tasa" o "riesgos relativos".
fuente