Cuando trabajamos con muchas variables de entrada, a menudo nos preocupa la multicolinealidad . Existen varias medidas de multicolinealidad que se utilizan para detectar, pensar y / o comunicar multicolinealidad. Algunas recomendaciones comunes son:
- El múltiple para una variable particular
- La tolerancia, , para una variable particular
- El factor de inflación de varianza, , para una variable particular
El número de condición de la matriz de diseño en su conjunto:
(Hay algunas otras opciones discutidas en el artículo de Wikipedia, y aquí en SO en el contexto de R.)
El hecho de que los primeros tres sean una función perfecta el uno del otro sugiere que la única ventaja neta posible entre ellos sería psicológica. Por otro lado, los primeros tres le permiten examinar las variables individualmente, lo que podría ser una ventaja, pero he oído que el método del número de condición se considera el mejor.
- ¿Es esto cierto? ¿Lo mejor para qué?
- ¿Es el número de condición una función perfecta de 's? (Creo que lo sería)
- ¿La gente encuentra que uno de ellos es más fácil de explicar? (Nunca he tratado de explicar estos números fuera de clase, solo doy una descripción suelta y cualitativa de multicolinealidad).
fuente
Respuestas:
A fines de la década de 1990, hice mi disertación sobre colinealidad.
Mi conclusión fue que los índices de condición eran los mejores.
La razón principal fue que, en lugar de mirar variables individuales , le permite mirar conjuntos de variables. Dado que la colinealidad es una función de conjuntos de variables, esto es algo bueno.
Además, los resultados de mi estudio de Monte Carlo mostraron una mejor sensibilidad a la colinealidad problemática, pero hace mucho tiempo que olvidé los detalles.
Por otro lado, es probablemente el más difícil de explicar. Mucha gente sabe quéR2 es. Solo un pequeño subconjunto de esas personas ha oído hablar de valores propios. Sin embargo, cuando he usado índices de condición como herramienta de diagnóstico, nunca me han pedido una explicación.
Para mucho más sobre esto, consulte los libros de David Belsley. O, si realmente lo desea, puede obtener mi disertación Diagnóstico de multicolinealidad para regresión múltiple: un estudio de Monte Carlo
fuente