¿Alguien puede explicarme el concepto de distancia de Mahalanobis? Por ejemplo, ¿cuál es la distancia de Mahalanobis entre dos puntos x e y, y especialmente, cómo se interpreta para el reconocimiento de patrones?
11
¿Alguien puede explicarme el concepto de distancia de Mahalanobis? Por ejemplo, ¿cuál es la distancia de Mahalanobis entre dos puntos x e y, y especialmente, cómo se interpreta para el reconocimiento de patrones?
Respuestas:
La distancia de Mahalanobis proporciona una manera de medir cuán similar es un conjunto de condiciones a un conjunto conocido de condiciones. Cuenta la covarianza entre variables.
Se calcula como: donde: D 2
Esta página proporciona una explicación detallada (con ejemplos del análisis del paisaje).
fuente
La distancia de Mahalanobis se utiliza para encontrar valores atípicos en un conjunto de datos. No sé en qué campo se encuentra, pero en psicología se usa para identificar casos que no "encajan" con lo que se espera dadas las normas para el conjunto de datos. Por ejemplo, si su muestra está compuesta por individuos con bajos niveles de depresión y tiene uno o dos individuos con niveles muy altos de depresión, entonces tendrían distancias de Mahalanobis que son mayores que el valor crítico esperado. Probablemente desee eliminar estos casos si son muy extremos Y si considera que no encajan con su conjunto de datos. (Usando el ejemplo proporcionado, su muestra está compuesta por individuos con bajos niveles de depresión, por lo tanto, aquellos uno o dos individuos con altos niveles de depresión no encajan con el resto). La identificación de valores atípicos es muy importante porque muchos análisis estadísticos tienen un "supuesto de normalidad", es decir, una expectativa de que sus datos se distribuyen normalmente. Los valores atípicos también pueden contribuir a datos sesgados, y por esta razón también deberían eliminarse. (A menos que transforme toda la variable y esto corrija la inclinación). Muchos programas de estadísticas como SPSS le permiten calcular las distancias M y la probabilidad asociada con cada puntaje para identificar valores atípicos. Puedo proporcionarle instrucciones de SPSS, pero no sé si está utilizando SPSS. (A menos que transforme toda la variable y esto corrija la inclinación). Muchos programas de estadísticas como SPSS le permiten calcular las distancias M y la probabilidad asociada con cada puntaje para identificar valores atípicos. Puedo proporcionarle instrucciones de SPSS, pero no sé si está utilizando SPSS. (A menos que transforme toda la variable y esto corrija la inclinación). Muchos programas de estadísticas como SPSS le permiten calcular las distancias M y la probabilidad asociada con cada puntaje para identificar valores atípicos. Puedo proporcionarle instrucciones de SPSS, pero no sé si está utilizando SPSS.
fuente