Tengo una pregunta con respecto a la interpretación de parámetros para un GLM con una variable dependiente distribuida gamma. Esto es lo que R devuelve para mi GLM con un enlace de registro:
Call:
glm(formula = income ~ height + age + educat + married + sex + language + highschool,
family = Gamma(link = log), data = fakesoep)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.47399 -0.31490 -0.05961 0.18374 1.94176
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.2202325 0.2182771 28.497 < 2e-16 ***
height 0.0082530 0.0011930 6.918 5.58e-12 ***
age 0.0001786 0.0009345 0.191 0.848
educat 0.0119425 0.0009816 12.166 < 2e-16 ***
married -0.0178813 0.0173453 -1.031 0.303
sex -0.3179608 0.0216168 -14.709 < 2e-16 ***
language 0.0050755 0.0279452 0.182 0.856
highschool 0.3466434 0.0167621 20.680 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Gamma family taken to be 0.1747557)
Null deviance: 757.46 on 2999 degrees of freedom
Residual deviance: 502.50 on 2992 degrees of freedom
AIC: 49184
¿Cómo interpreto los parámetros? Si calculo exp(coef())
mi modelo, obtengo ~ 500 para la intercepción. Ahora creo que eso no significa el ingreso esperado si todas las demás variables se mantienen constantes, ¿verdad? Dado que el promedio o se mean(age)
encuentra en ~ 2000. Además, no tengo idea de cómo interpretar la dirección y el valor de los coeficientes de las covariables.
r
generalized-linear-model
interpretation
gamma-distribution
gung - Restablece a Monica
fuente
fuente
Respuestas:
La especificación de GLM gamma vinculada al registro es idéntica a la regresión exponencial:
Esto significa queE[y|x=0,z=0]=exp(α)
El tercer método es exponer los coeficientes. Tenga en cuenta que:
fuente
Primero, miraría los residuos para ver qué tan bien se ajusta el modelo. Si está bien, intentaría usar otras funciones de enlace a menos que tuviera razones para creer que realmente proviene de una distribución gamma. Si el gamma aún luciera convincente, concluiría que los términos estadísticamente significativos son intercepción, altura, educación, sexo y escuela secundaria (los marcados con tres estrellas). Entre ellos no se puede decir más a menos que estén estandarizados (tengan el mismo rango).
Respuesta al comentario: ahora entiendo mejor tu pregunta. ¡Absolutamente puedes hacer eso! Un aumento de la unidad en la altura causa una exp (0.0082530) -1 ~ = 0.0082530 (usando la aproximación exp x = 1 + x para x pequeña) relativa del cambio en el ingreso. Muy fácil de interpretar, ¿no?
fuente