Estoy tratando de interpretar la varianza factores de inflación utilizando el vif
función en el paquete R car
. La función imprime un generalizado y también . Según el archivo de ayuda , este último valor
Para ajustar la dimensión del elipsoide de confianza, la función también imprime GVIF ^ [1 / (2 * df)] donde df son los grados de libertad asociados con el término.
No entiendo el significado de esta explicación en el archivo de ayuda, por lo que no estoy seguro de si debería usar o . Para mi modelo, estos dos valores son muy diferentes (el máximo es ~ ; el máximo es ~ ).
¿Podría alguien explicarme cuál debería usar y qué significa ajustar la dimensión del elipsoide de confianza?
fuente
Me encontré exactamente con la misma pregunta e intenté abrirme camino. Vea mi respuesta detallada a continuación.
En primer lugar, encontré 4 opciones que producen valores VIF similares en R:
•
corvif
comando del paquete AED,•
vif
comando del paquete del automóvil,•
vif
comando del paquete rms,•
vif
comando del paquete DAAG.El uso de estos comandos en un conjunto de predictores que no incluyen factores / variables categóricas o términos polinomiales es sencillo. Los tres comandos producen la misma salida numérica aunque el
corvif
comando del paquete AED etiqueta los resultados como GVIF.Sin embargo, normalmente, GVIF solo entra en juego para factores y variables polinómicas. Las variables que requieren más de 1 coeficiente y, por lo tanto, más de 1 grado de libertad, generalmente se evalúan utilizando el GVIF. Para términos de un coeficiente, VIF es igual a GVIF.
Por lo tanto, puede aplicar reglas generales estándar sobre si la colinealidad puede ser un problema, como un umbral de 3, 5 o 10. Sin embargo, se debe aplicar (debe) cierta precaución (ver: http://www.nkd-group.com/ghdash/mba555/PDF/VIF%20article.pdf ).
En el caso de términos de coeficientes múltiples, como por ejemplo predictores categóricos, los 4 paquetes producen diferentes resultados. Los
vif
comandos de los paquetes rms y DAAG producen valores VIF, mientras que los otros dos producen valores GVIF.Veamos primero los valores VIF de los paquetes rms y DAAG:
TNAP e ICE son predictores continuos y Reg es una variable categórica presentada por los maniquíes RegB a RegE. En este caso, RegA es la línea de base. Todos los valores de VIF son bastante moderados y generalmente no hay nada de qué preocuparse. El problema con este resultado es que se ve afectado por la línea de base de la variable categórica. Para asegurarse de no tener un valor VIF por encima de un nivel aceptable, sería necesario rehacer este análisis para cada nivel de la variable categórica que sea la línea de base. En este caso cinco veces.
Aplicando el
corvif
comando del paquete AED o elvif
comando del paquete del automóvil, se producen los valores GVIF:El GVIF se calcula para conjuntos de regresores relacionados, como un conjunto de regresores ficticios. Para las dos variables continuas TNAP e ICE, esto es lo mismo que los valores VIF anteriores. Para la variable categórica Reg, ahora obtenemos un valor GVIF muy alto, aunque los valores VIF para los niveles individuales de la variable categórica fueron todos moderados (como se muestra arriba).
fuente
[ASK QUESTION]
en la parte superior y pregúntela allí, entonces podemos ayudarlo adecuadamente. Como eres nuevo aquí, es posible que desees realizar nuestro recorrido , que contiene información para nuevos usuarios.Fox y Monette (cita original para GVIF, GVIF ^ 1 / 2df) sugieren llevar GVIF a la potencia de 1 / 2df hace que el valor de GVIF sea comparable en diferentes números de parámetros. "Es análogo tomar la raíz cuadrada del factor usual de variación de inflación" (de An R and S-Plus Companion to Applied Regression de John Fox). Entonces sí, cuadrarlo y aplicar la "regla de oro" VIF habitual parece razonable.
fuente