Estoy trabajando en un pequeño corpus de texto (200M), que quiero explorar con algunos análisis de conglomerados. ¿Qué libros o artículos sobre ese tema recomendarías?
Estoy trabajando en un pequeño corpus de texto (200M), que quiero explorar con algunos análisis de conglomerados. ¿Qué libros o artículos sobre ese tema recomendarías?
Puede valer la pena mirar los libros de MW Berry:
Consisten en series de documentos aplicados y de revisión. El último parece estar disponible como PDF en la siguiente dirección: http://bit.ly/deNeiy .
Aquí hay algunos enlaces relacionados con CA aplicados a la minería de texto:
También puede ver el análisis semántico latente , pero vea mi respuesta allí: resolver un problema de agrupamiento .
Encontrar grupos en los datos. Una introducción al análisis de conglomerados de los profesores Leonard Kaufman y Peter J. Rousseeuw.
Estoy leyendo el libro y lo encuentro muy útil porque:
Nuestro propósito era escribir un libro aplicado para el usuario general. Queríamos hacer que el análisis de conglomerados esté disponible para personas que no necesariamente tienen una sólida base matemática o estadística.
Proporciona contenido teórico para comprender las funciones disponibles en el R
paquete Cluster .
Los capítulos se pueden leer individualmente de acuerdo con el método de agrupación de interés.
la excepción es el capítulo 3, que se basa en el capítulo 2
Los capítulos del libro son:
Referencias
Kaufman, L. y Rousseeuw, PJ (2005). Encontrar grupos en los datos. Una introducción al análisis de conglomerados (p. 342). John Wiley & Sons Inc.
Maechler, M. (2013). Análisis de clúster ampliado Rousseeuw et al. CRAN
Este capítulo de Introducción a la minería de datos está disponible en línea y ofrece una buena descripción general.
fuente
Cluster Analysis de Brian S. Everitt es un buen tratamiento de Cluster Analysis aplicado en longitud de libro.
fuente
No específicamente sobre minería de texto, pero me gustó bastante el "Análisis de datos exploratorios con MATLAB" de Martínez y Martínez.
fuente
Otro libro en profundidad que vale la pena mirar: Manual de Análisis de Clúster por Hennig et al. (2015)
fuente