Tengo el siguiente resultado:
Generalized linear mixed model fit by the Laplace approximation
Formula: aph.remain ~ sMFS2 +sAG2 +sSHDI2 +sbare +season +crop +(1|landscape)
AIC BIC logLik deviance
4062 4093 -2022 4044
Random effects:
Groups Name Variance Std.Dev.
landscape (Intercept) 0.82453 0.90804
Number of obs: 239, groups: landscape, 45
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.65120 0.14051 18.868 <2e-16
sMFS2 0.26922 0.17594 1.530 0.1260
sAG2 0.09268 0.14529 0.638 0.5235
sSHDI2 0.28345 0.17177 1.650 0.0989
sbare 0.41388 0.02976 13.907 <2e-16
seasonlate -0.50165 0.02729 -18.384 <2e-16
cropforage 0.79000 0.06724 11.748 <2e-16
cropsoy 0.76507 0.04920 15.551 <2e-16
Correlation of Fixed Effects:
(Intr) sMFS2 sAG2 sSHDI2 sbare sesnlt crpfrg
sMFS2 -0.016
sAG2 0.006 -0.342
sSHDI2 -0.025 0.588 -0.169
sbare -0.113 -0.002 0.010 0.004
seasonlate -0.034 0.005 -0.004 0.001 -0.283
cropforage -0.161 -0.005 0.012 -0.004 0.791 -0.231
cropsoy -0.175 -0.022 0.013 0.013 0.404 -0.164 0.557
Todas mis variables continuas (denotadas por un pequeño s
antes del nombre de la variable) están estandarizadas (puntajes z). season
es una variable categórica con 2 niveles (temprano y tardío), y crop
es una variable categórica con 3 niveles (maíz, forraje y soja).
Esta correlación de la matriz de efectos fijos realmente me confunde, porque todas las correlaciones tienen el signo opuesto que tienen cuando miro las regresiones simples de pares de variables. es decir, la matriz de correlación de efectos fijos sugiere una fuerte correlación positiva entre cropforage
y sbare
, cuando de hecho hay una correlación NEGATIVA muy fuerte entre estas variables, los cultivos forrajeros tendían a tener mucho menos suelo desnudo en comparación con los cultivos de maíz y soja. Los pares de variables continuas tienen el mismo problema, la correlación de la matriz de efectos fijos dice que todo es lo contrario de lo que debería ser ... ¿Podría esto ser debido a la complejidad del modelo (no es una simple regresión)? ¿Podría tener algo que ver con el hecho de que las variables están estandarizadas?
Gracias.
Si sus correlaciones negativas y positivas son iguales en su valor y solo su signo difiere, está ingresando la variable por error. Pero no creo que este sea el caso para ti, ya que ya pareces bastante avanzado en estadísticas.
La inconsistencia que está experimentando puede ser y probablemente sea causada por la multicolinealidad. Significa cuando algunas variables independientes comparten algunos efectos superpuestos, o en otras palabras, se correlacionan entre sí. por ejemplo, modelar las variables "tasa de crecimiento" y "tamaño tumoral" puede causar multicolinealidad, ya que es posible y probable que los tumores más grandes tengan tasas de crecimiento más altas (antes de ser detectados) per se. Esto puede confundir al modelo. Y si su modelo tiene pocas variables independientes que se correlacionan entre sí, la interpretación de los resultados a veces puede ser bastante difícil. A veces conduce a coeficientes totalmente extraños, incluso en tal medida que el signo de algunas de las correlaciones se invierte.
Primero debe detectar las fuentes de multicolinealidad y tratarlas y luego volver a ejecutar su análisis.
fuente
Puede ser útil mostrar que esas correlaciones entre los efectos fijos se obtienen al convertir el "vcov" del modelo en una matriz de correlación. Si
fit
es su modelo lme4 ajustado, entoncesy las correlaciones entre los efectos fijos son las entradas fuera de diagonal.
fuente