Interpretación de la salida .L y .Q de un GLM binomial negativo con datos categóricos

14

Acabo de ejecutar un GLM binomial negativo y esta es la salida:

Call:
glm.nb(formula = small ~ method + site + depth, data = size.dat, 
    init.theta = 1.080668549, link = log)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.2452  -0.9973  -0.3028   0.3864   1.8727  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   1.6954     0.1152  14.720  < 2e-16 ***
method.L     -0.6828     0.1637  -4.171 3.04e-05 ***
site.L        0.9952     0.2050   4.854 1.21e-06 ***
site.Q       -0.4634     0.1941  -2.387    0.017 *  
depth.L       0.8951     0.1988   4.502 6.74e-06 ***
depth.Q       0.2060     0.1984   1.038    0.299    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for Negative Binomial(1.0807) family taken to be 1)

    Null deviance: 185.1  on 89  degrees of freedom
Residual deviance: 100.8  on 84  degrees of freedom
AIC: 518.24

Mis predictores son todos categóricos. Es por eso que estoy obteniendo .Ly .Q. Supongo que representan las diferentes categorías, pero ¿alguien sabe un código que pueda usar para etiquetarlas antes de ejecutar el GLM para que aparezcan como las diferentes categorías?

Vivienne
fuente
Encuentro que el código es bastante confuso ¿hay un código más simple? Las categorías son muy simples: método 1 y método 2, sitio 1, sitio 2 y sitio 3 y la profundidad es 5, 10 y 15
Vivienne
ats.ucla.edu/stat/r/library/contrast_coding.htm#SIMPLE - o ats.ucla.edu/stat/r/library/contrast_coding.htm#dummy , que es el valor predeterminado para los factores no ordenados en glm.
Scortchi - Restablece a Monica

Respuestas:

12

Sus variables no solo están codificadas como factores (para hacerlas categóricas), están codificadas como factores ordenados . Luego, por defecto, R ajusta una serie de funciones polinómicas a los niveles de la variable. El primero es lineal ( .L), el segundo es cuadrático ( .Q), el tercero (si tuviera suficientes niveles) sería cúbico, etc. R se ajustará a una función polinómica menos que el número de niveles en su variable. Por ejemplo, si tiene solo dos niveles, solo se ajustaría la tendencia lineal. Además, las bases polinómicas utilizadas son ortogonales. (Por lo que vale, nada de esto es específico para R, o para modelos binomiales negativos, todo el software y los tipos de modelos de regresión harían lo mismo).


Centrándose específicamente en R, si quería las variables que han de codificarse como ordenada o desordenada, se utiliza el factor? :

my.variable <- factor(my.variable, ordered=TRUE)   # an ordered factor
my.variable <- factor(my.variable, ordered=FALSE)  # an unordered factor
gung - Restablece a Monica
fuente
Oh, los había ordenado ahora que tiene las etiquetas, ¡muchas gracias gung!
Vivienne