Preguntas etiquetadas con clustering

8
Resultados adversos de los criterios de agrupamiento

He llevado a cabo una agrupación de puntos de coordenadas (longitud, latitud) y he encontrado resultados sorprendentes y adversos de los criterios de agrupación para el número óptimo de agrupaciones. Los criterios se toman del clusterCrit()paquete. Los puntos que estoy tratando de agrupar en una...

8
Mapas autoorganizados versus kernel k-means

Para una aplicación, quiero agrupar datos (potencialmente de alta dimensión) y extraer la probabilidad de pertenecer a un clúster. Considero en este momento mapas autoorganizados o kernel k-means para hacer el trabajo. ¿Cuáles son los pros y los contras de cada clasificador para esta tarea? ¿Me...

8
¿Por qué un modelo estadístico se sobreajusta si se le da un gran conjunto de datos?

Mi proyecto actual puede requerir que construya un modelo para predecir el comportamiento de un determinado grupo de personas. el conjunto de datos de entrenamiento contiene solo 6 variables (la identificación es solo para fines de identificación): id, age, income, gender, job category, monthly...

8
Agrupaciones que pueden ser causadas por K-means

Recibí la siguiente pregunta como pregunta de prueba para mi examen y simplemente no puedo entender la respuesta. A continuación se muestra un diagrama de dispersión de los datos proyectados en los dos primeros componentes principales. Deseamos examinar si existe alguna estructura de grupo en el...

8
Usar k-means con otras métricas

Así que me doy cuenta de que esto se ha preguntado antes: por ejemplo, ¿cuáles son los casos de uso relacionados con el análisis de conglomerados de diferentes métricas de distancia? pero he encontrado que las respuestas son algo contradictorias con lo que se sugiere que debería ser posible en la...

8
Cómo realizar SVD para imputar valores perdidos, un ejemplo concreto

He leído los excelentes comentarios sobre cómo lidiar con los valores perdidos antes de aplicar SVD, pero me gustaría saber cómo funciona con un ejemplo simple: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Dada la matriz anterior, si elimino los valores de NA,...