Tengo datos que representan algún aspecto del comportamiento humano. Quiero agruparlo (sin supervisión) en perfiles de comportamiento de algún tipo. ahora, algunas de mis variables son categóricas (con 2 o más categorías), y algunas son continuas (la mayoría son porcentajes). Algunas variables son aún más complejas en que una categoría tiene más continua y la otra no tiene esos datos adicionales.
Mi pregunta es sobre cómo clasificar estos datos. ¿Cuáles son los enfoques (¿comunes?) Para tratarlo?
No necesito código ni nada, sino algunas referencias o instrucciones que me ayudarán a comprender mejor cómo enfrentar este desafío.
Si conoce R
funciones que faciliten dicho análisis, sería excelente, pero no es necesario.
Gracias.
Respuestas:
fuente
Ver https://cran.r-project.org/web/packages/ClustOfVar para el paquete R
ClustOfVar
. Parece implementar algunos de los mejores métodos de agrupamiento disponibles para mezclas de tipos variables.fuente