Tengo una pregunta con respecto a la interpretación de parámetros para un GLM con una variable dependiente distribuida gamma. Esto es lo que R devuelve para mi GLM con un enlace de registro:
Call:
glm(formula = income ~ height + age + educat + married + sex + language + highschool, 
    family = Gamma(link = log), data = fakesoep)
Deviance Residuals: 
       Min        1Q    Median        3Q       Max  
  -1.47399  -0.31490  -0.05961   0.18374   1.94176  
Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  6.2202325  0.2182771  28.497  < 2e-16 ***
height       0.0082530  0.0011930   6.918 5.58e-12 ***
age          0.0001786  0.0009345   0.191    0.848    
educat       0.0119425  0.0009816  12.166  < 2e-16 ***
married     -0.0178813  0.0173453  -1.031    0.303    
sex         -0.3179608  0.0216168 -14.709  < 2e-16 ***
language     0.0050755  0.0279452   0.182    0.856    
highschool   0.3466434  0.0167621  20.680  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Gamma family taken to be 0.1747557)
Null deviance: 757.46  on 2999  degrees of freedom
Residual deviance: 502.50  on 2992  degrees of freedom
AIC: 49184¿Cómo interpreto los parámetros? Si calculo exp(coef())mi modelo, obtengo ~ 500 para la intercepción. Ahora creo que eso no significa el ingreso esperado si todas las demás variables se mantienen constantes, ¿verdad? Dado que el promedio o se mean(age)encuentra en ~ 2000. Además, no tengo idea de cómo interpretar la dirección y el valor de los coeficientes de las covariables.
                    
                        r
                                generalized-linear-model
                                interpretation
                                gamma-distribution
                                
                    
                    
                        gung - Restablece a Monica
fuente
                
                fuente

Respuestas:
La especificación de GLM gamma vinculada al registro es idéntica a la regresión exponencial:
Esto significa queE[y|x=0,z=0]=exp(α) 
El tercer método es exponer los coeficientes. Tenga en cuenta que:
fuente
Primero, miraría los residuos para ver qué tan bien se ajusta el modelo. Si está bien, intentaría usar otras funciones de enlace a menos que tuviera razones para creer que realmente proviene de una distribución gamma. Si el gamma aún luciera convincente, concluiría que los términos estadísticamente significativos son intercepción, altura, educación, sexo y escuela secundaria (los marcados con tres estrellas). Entre ellos no se puede decir más a menos que estén estandarizados (tengan el mismo rango).
Respuesta al comentario: ahora entiendo mejor tu pregunta. ¡Absolutamente puedes hacer eso! Un aumento de la unidad en la altura causa una exp (0.0082530) -1 ~ = 0.0082530 (usando la aproximación exp x = 1 + x para x pequeña) relativa del cambio en el ingreso. Muy fácil de interpretar, ¿no?
fuente