Cómo interpretar parámetros en GLM con familia = Gamma

21

Tengo una pregunta con respecto a la interpretación de parámetros para un GLM con una variable dependiente distribuida gamma. Esto es lo que R devuelve para mi GLM con un enlace de registro:

Call:
glm(formula = income ~ height + age + educat + married + sex + language + highschool, 
    family = Gamma(link = log), data = fakesoep)

Deviance Residuals: 
       Min        1Q    Median        3Q       Max  
  -1.47399  -0.31490  -0.05961   0.18374   1.94176  

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  6.2202325  0.2182771  28.497  < 2e-16 ***
height       0.0082530  0.0011930   6.918 5.58e-12 ***
age          0.0001786  0.0009345   0.191    0.848    
educat       0.0119425  0.0009816  12.166  < 2e-16 ***
married     -0.0178813  0.0173453  -1.031    0.303    
sex         -0.3179608  0.0216168 -14.709  < 2e-16 ***
language     0.0050755  0.0279452   0.182    0.856    
highschool   0.3466434  0.0167621  20.680  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for Gamma family taken to be 0.1747557)

Null deviance: 757.46  on 2999  degrees of freedom
Residual deviance: 502.50  on 2992  degrees of freedom
AIC: 49184

¿Cómo interpreto los parámetros? Si calculo exp(coef())mi modelo, obtengo ~ 500 para la intercepción. Ahora creo que eso no significa el ingreso esperado si todas las demás variables se mantienen constantes, ¿verdad? Dado que el promedio o se mean(age)encuentra en ~ 2000. Además, no tengo idea de cómo interpretar la dirección y el valor de los coeficientes de las covariables.

r generalized-linear-model interpretation gamma-distribution gung - Restablece a Monica
fuente

66

500 estaría cerca del ingreso esperado si todas las demás variables fueran exactamente cero (no simplemente constantes) --- al igual que en la regresión, en realidad.

Glen_b -Reinstale a Monica

@Glen_b ¿por qué sería un ingreso esperado cuando exponencial de coeficientes es el efecto multiplicativo sobre el ingreso cuando hay un cambio en la variable explicativa?

tatami

El caso en discusión es la media condicional cuando todas las variables explicativas son 0.

Glen_b -Reinstate Monica

25

La especificación de GLM gamma vinculada al registro es idéntica a la regresión exponencial:

E [y | x, z] = \exp (α + β \cdot x + γ \cdot z) = \hat{y}

$E[y \vert x,z] = \exp \left( \alpha + \beta \cdot x +\gamma \cdot z \right)=\hat y$

Esto significa que $E[y \vert x=0,z=0]=\exp(\alpha)$

$y$ $x$ $x$

\frac{\partial E [y | x, z]}{\partial x} = \exp (α + β \cdot x + γ \cdot z) \cdot β = \hat{y} \cdot β

$\frac{\partial E[y \vert x,z]}{\partial x} = \exp \left( \alpha + \beta \cdot x +\gamma \cdot z\right)\cdot \beta=\hat y \cdot \beta$

$x$ $z$ $x$ $z$ $\hat y \cdot \beta$ $x$ $y$

$x$

E [y | z, x = 1] - E [y | z, x = 0] = \exp (α + β + γ \cdot z) - \exp (α + γ \cdot z) = \exp (α + γ \cdot z) \cdot (\exp (β) - 1)

$E[y \vert z,x=1]-E[y \vert z,x=0]=\exp \left( \alpha + \beta +\gamma \cdot z\right) - \exp \left( \alpha +\gamma \cdot z\right)= \exp \left( \alpha +\gamma \cdot z\right) \cdot\left( \exp(\beta)-1 \right)$

$x$

El tercer método es exponer los coeficientes. Tenga en cuenta que:

\begin{matrix} E [y | z, x + 1] & = \exp (α + β \cdot (x + 1) + γ \cdot z) \\ = \exp (α + β \cdot x + β + γ \cdot z) \\ = \exp (α + β \cdot x + γ \cdot z) \cdot \exp (β) \\ = E [y | z, x] \cdot \exp (β) \end{matrix}

$\begin{array} _E[y \vert z,x+1] &= \exp \left( \alpha + \beta \cdot (x+1) +\gamma \cdot z \right) \\ &=\exp \left( \alpha + \beta \cdot x+\beta +\gamma \cdot z \right)\\ &=\exp \left( \alpha + \beta \cdot x +\gamma \cdot z \right)\cdot \exp(\beta) \\ &= E[y \vert z,x]\cdot \exp(\beta) \end{array}$

$x$

Dimitriy V. Masterov
fuente

1

¿Serías capaz de ilustrar la segunda interpretación?

tatami

@tatami Solucioné un error en el caso binario. ¿Tiene más sentido ahora?

Dimitriy V. Masterov

2

Primero, miraría los residuos para ver qué tan bien se ajusta el modelo. Si está bien, intentaría usar otras funciones de enlace a menos que tuviera razones para creer que realmente proviene de una distribución gamma. Si el gamma aún luciera convincente, concluiría que los términos estadísticamente significativos son intercepción, altura, educación, sexo y escuela secundaria (los marcados con tres estrellas). Entre ellos no se puede decir más a menos que estén estandarizados (tengan el mismo rango).

Respuesta al comentario: ahora entiendo mejor tu pregunta. ¡Absolutamente puedes hacer eso! Un aumento de la unidad en la altura causa una exp (0.0082530) -1 ~ = 0.0082530 (usando la aproximación exp x = 1 + x para x pequeña) relativa del cambio en el ingreso. Muy fácil de interpretar, ¿no?

Emre
fuente

1

Entonces, ¿no puedo interpretar los parámetros, por ejemplo, el ingreso aumenta en xy si la altura aumenta en uno?

1

Creo que ahora tengo que interpretarlo multiplicativamente: exp (Intercepción) * exp (altura) sería el ingreso con un aumento de 1 unidad de altura. ¡Gracias de todos modos! :)

Cómo interpretar parámetros en GLM con familia = Gamma

Respuestas: