Quiero detectar si la colinealidad es un problema en mi regresión OLS. Entiendo que los factores de inflación de varianza y el índice de condición son dos medidas comúnmente utilizadas, pero me resulta difícil encontrar algo definitivo sobre los méritos de cada enfoque, o cuáles deberían ser los puntajes.
Sería muy útil una fuente prominente que indique qué enfoque hacer y / o qué puntajes son apropiados.
Se hizo una pregunta similar en "¿Hay alguna razón para preferir una medida específica de multicolinealidad?" pero idealmente busco una referencia que pueda citar.
Respuestas:
Belsley, Kuh y Welsch es el texto al que acudir para este tipo de preguntas. Incluyen una extensa discusión sobre diagnósticos anteriores en una sección titulada "Perspectiva histórica". Sobre VIF escriben
Finalmente, BKW recomienda diagnosticar la colinealidad mediante
fuente
Sin embargo, los VIF implementados normalmente no pueden informarle sobre la colinealidad con la intercepción, ya que la intercepción generalmente se incluye silenciosamente en estas regresiones "auxiliares". Además, si un regresor tiene un VIF alto, no sabe de inmediato qué otros regresores son responsables de la colinealidad. Debería observar los coeficientes estandarizados en las regresiones auxiliares.
Los índices de condición y las proporciones de descomposición de colinealidad de Belsley, Kuh y Welsch (Belsley, DA; Kuh, E. y Welsch, RE Diagnóstico de regresión: identificación de datos influyentes y fuentes de colinealidad. John Wiley & Sons, 1980) son mucho más difíciles de entender. Solía trabajar con esto hace unos años, pero no intentaré explicarlos aquí sin obtener un repaso ;-)
Estos diagnósticos no permiten la detección de colinealidad con el punto de intersección. Y puede investigar las proporciones de descomposición de la colinealidad para deducir qué otros regresores son responsables de la colinealidad de un regresor dado.
fuente
Para referencias ampliamente disponibles para citar, el libro de Faraway en la página 117 proporciona una regla general de más de 30 para detectar problemas basados en números de condición, y Una Introducción al Aprendizaje Estadístico , página 101, dice que los valores de VIF superiores a 5 o 10 indican un problema .
Probablemente más importante que el método que use para identificar la multicolinealidad será cómo lo maneje.
fuente