¿Cómo calcula la distancia de Gower la diferencia entre las variables binarias?

13

Tengo 17 variables numéricas y 5 binarias (0-1), con 73 muestras en mi conjunto de datos. Necesito ejecutar un análisis de clúster. Sé que la distancia de Gower es una buena métrica para conjuntos de datos con variables mixtas. Sin embargo, no podía entender cómo la distancia de Gower calcula la diferencia entre las variables binarias . Me parece que no es diferente de la distancia euclidiana.

Emrah Bilgiç
fuente
Tu pregunta no está del todo clara. ¿Simplemente pregunta 'cómo calcula la distancia de Gower la diferencia entre las variables binarias'? ¿Qué significa "no hay diferencia que Euclidiana" significa?
gung - Restablece a Monica
1
Gracias. Lo siento, pregunto cómo Gower calcula la diferencia entre las variables binarias. Quiero decir, no pude entender las diferencias por cierto. Euclidiana y Gower para variable binaria.
Emrah Bilgiç
¿Has buscado en este sitio Gower? stats.stackexchange.com/a/15313/3277
ttnphns
Sí, lo hice. La distancia euclidiana es 0, si ambas muestras tienen el mismo valor, 1 si no. ¿Qué hay de Gower?
Emrah Bilgiç
44
@ EmrahBilgiç, la métrica de Gower es similitud, no distancia. Se convierte en "distancia" cuando se resta de 1. Lea en el enlace de arriba cómo procesa los datos binarios.
ttnphns

Respuestas:

5

¿Qué hay de los atributos binarios que tienen los valores "m" y "f" para "masculino" y "femenino"?

¿Te das cuenta de que para una variable dicotómica, todo lo que puedes obtener es "igual" o "diferente"? La diferencia de puntos clave entre distancias no es si el valor es 1 o 0; pero cómo se combinan múltiples variables.

HA SALIDO - Anony-Mousse
fuente
3

La distancia de Gower usa Manhattan para calcular la distancia entre puntos de datos continuos y Dice para calcular la distancia entre puntos de datos categóricos

Sanjeet
fuente