Acabo de ejecutar un GLM binomial negativo y esta es la salida:
Call:
glm.nb(formula = small ~ method + site + depth, data = size.dat,
init.theta = 1.080668549, link = log)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.2452 -0.9973 -0.3028 0.3864 1.8727
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.6954 0.1152 14.720 < 2e-16 ***
method.L -0.6828 0.1637 -4.171 3.04e-05 ***
site.L 0.9952 0.2050 4.854 1.21e-06 ***
site.Q -0.4634 0.1941 -2.387 0.017 *
depth.L 0.8951 0.1988 4.502 6.74e-06 ***
depth.Q 0.2060 0.1984 1.038 0.299
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Negative Binomial(1.0807) family taken to be 1)
Null deviance: 185.1 on 89 degrees of freedom
Residual deviance: 100.8 on 84 degrees of freedom
AIC: 518.24
Mis predictores son todos categóricos. Es por eso que estoy obteniendo .L
y .Q
. Supongo que representan las diferentes categorías, pero ¿alguien sabe un código que pueda usar para etiquetarlas antes de ejecutar el GLM para que aparezcan como las diferentes categorías?
glm
.Respuestas:
Sus variables no solo están codificadas como factores (para hacerlas categóricas), están codificadas como factores ordenados . Luego, por defecto, R ajusta una serie de funciones polinómicas a los niveles de la variable. El primero es lineal (
.L
), el segundo es cuadrático (.Q
), el tercero (si tuviera suficientes niveles) sería cúbico, etc. R se ajustará a una función polinómica menos que el número de niveles en su variable. Por ejemplo, si tiene solo dos niveles, solo se ajustaría la tendencia lineal. Además, las bases polinómicas utilizadas son ortogonales. (Por lo que vale, nada de esto es específico para R, o para modelos binomiales negativos, todo el software y los tipos de modelos de regresión harían lo mismo).Centrándose específicamente en R, si quería las variables que han de codificarse como ordenada o desordenada, se utiliza el factor? :
fuente