Call:
glm(formula = darters ~ river + pH + temp, family = poisson, data = darterData)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.7422 -1.0257 0.0027 0.7169 3.5347
Coefficients:
Estimate Std.Error z value Pr(>|z|)
(Intercept) 3.144257 0.218646 14.381 < 2e-16 ***
riverWatauga -0.049016 0.051548 -0.951 0.34166
pH 0.086460 0.029821 2.899 0.00374 **
temp -0.059667 0.009149 -6.522 6.95e-11 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 233.68 on 99 degrees of freedom
Residual deviance: 187.74 on 96 degrees of freedom
AIC: 648.21
Quiero saber cómo interpretar cada estimación de parámetro en la tabla anterior.
Respuestas:
No creo que el título de su pregunta capture con precisión lo que está pidiendo.
La cuestión de cómo interpretar los parámetros en un GLM es muy amplia porque el GLM es una clase muy amplia de modelos. Recuerde que un GLM modela una variable de respuesta que se supone que sigue una distribución conocida de la familia exponencial, y que hemos elegido una función invertible g tal que E [ yy sol
paralas variables predictoras J x . En este modelo, la interpretación de cualquier parámetro particular β j es la tasa de cambio de g ( y ) con respecto a x j . Definir μ ≡ E [ y
Lo que simplemente significa que es el efecto sobre η de un aumento unitario en x j .βj η xj
También puede establecer la relación de esta manera: y E[y
Sin saber nada sobre , eso es lo más lejos que podemos llegar. β j es el efecto sobre η , en la media condicional transformada de y , de una unidad de aumento en x j , y el efecto sobre la media condicional de y de un aumento de una unidad en x j es g - 1 ( β ) .g βj η y xj y xj g−1(β)
Pero parece estar preguntando específicamente sobre la regresión de Poisson usando la función de enlace predeterminada de R, que en este caso es el logaritmo natural. Si ese es el caso, está preguntando acerca de un tipo específico de GLM en el que y g = ln . Entonces podemos obtener algo de tracción con respecto a una interpretación específica.y∼Poisson(λ) g=ln
Por lo que dije anteriormente, sabemos que∂μ∂xj=dg−1dηβj . And since we know g(μ)=ln(μ) , we also know that g−1(η)=eη . We also happen to know that deηdη=eη , so we can say that
which finally means something tangible:
And using the more familiar unit change interpretation, we have:
There are three important pieces to note here:
So in your example, the effect of increasing pH by 1 is to increaselny^ by y^(e0.09−1) ; that is, to multiply y^ by e0.09≈1.09 . It looks like your outcome is the number of darters you observe in some fixed unit of time (say, a week). So if you're observing 100 darters a week at a pH of 6.7, raising the pH of the river to 7.7 means you can now expect to see 109 darters a week.
fuente
My suggestion would be to create a small grid consisting of combinations of the two rivers and two or three values of each of the covariates, then use the
predict
function with your grid asnewdata
. Then graph the results. It is much clearer to look at the values that the model actually predicts. You may or may not want to back-transform the predictions to the original scale of measurement (type = "response"
).fuente