¿Libros o artículos recomendados como introducción al análisis de conglomerados?

12

Estoy trabajando en un pequeño corpus de texto (200M), que quiero explorar con algunos análisis de conglomerados. ¿Qué libros o artículos sobre ese tema recomendarías?

miku
fuente

Respuestas:

6

Puede valer la pena mirar los libros de MW Berry:

  1. Encuesta de minería de texto I: agrupamiento, clasificación y recuperación (2003)
  2. Encuesta de minería de textos II: agrupamiento, clasificación y recuperación (2008)

Consisten en series de documentos aplicados y de revisión. El último parece estar disponible como PDF en la siguiente dirección: http://bit.ly/deNeiy .

Aquí hay algunos enlaces relacionados con CA aplicados a la minería de texto:

También puede ver el análisis semántico latente , pero vea mi respuesta allí: resolver un problema de agrupamiento .

chl
fuente
5

Encontrar grupos en los datos. Una introducción al análisis de conglomerados de los profesores Leonard Kaufman y Peter J. Rousseeuw.

Estoy leyendo el libro y lo encuentro muy útil porque:

  • Como lo afirman los autores en el prefacio:

Nuestro propósito era escribir un libro aplicado para el usuario general. Queríamos hacer que el análisis de conglomerados esté disponible para personas que no necesariamente tienen una sólida base matemática o estadística.

  • Proporciona contenido teórico para comprender las funciones disponibles en el Rpaquete Cluster .

  • Los capítulos se pueden leer individualmente de acuerdo con el método de agrupación de interés.
    la excepción es el capítulo 3, que se basa en el capítulo 2

Los capítulos del libro son:

  1. Introducción
  2. Particionamiento en torno a medoides (Programa PAM).
  3. Agrupación de aplicaciones grandes (Programa CLARA).
  4. Análisis difuso (Programa DIVERTIDO).
  5. Anidamiento aglomerativo (Programa AGNES).
  6. Análisis divisivo (Programa DIANA).
  7. Análisis Monotetico (Programa MONA).

Referencias

Kaufman, L. y Rousseeuw, PJ (2005). Encontrar grupos en los datos. Una introducción al análisis de conglomerados (p. 342). John Wiley & Sons Inc.

Maechler, M. (2013). Análisis de clúster ampliado Rousseeuw et al. CRAN

Andre Silva
fuente
Este libro de hecho proporciona una buena visión general del campo. Se centra en algunos algoritmos / métodos (por ejemplo, la conocida silueta, que resultó haber sido diseñada por uno de los autores del libro) y los cubre ampliamente. También viene con algo de código, pero estilo 1990. FYI: tabla de contenido completa .
Franck Dernoncourt
2

Cluster Analysis de Brian S. Everitt es un buen tratamiento de Cluster Analysis aplicado en longitud de libro.

Brett
fuente