Estoy interesado en saber qué sucede realmente en Hellinger Distance (en términos simples). Además, también me interesa saber cuáles son los tipos de problemas que podemos usar Hellinger Distance. ¿Cuáles son los beneficios de usar Hellinger Distance?
machine-learning
data-mining
text-mining
distance
Smith Volka
fuente
fuente
Respuestas:
La distancia de Hellinger es una medida para medir la diferencia entre dos distribuciones de probabilidad. Es el análogo probabilístico de la distancia euclidiana .
Es útil al cuantificar la diferencia entre dos distribuciones de probabilidad. Por ejemplo, si estima una distribución para usuarios y no usuarios de un servicio. Si la distancia de Hellinger es pequeña entre esos grupos para algunas características, entonces esas características no son estadísticamente útiles para la segmentación.
fuente