Me gustaría saber si ustedes tienen algunos buenos tutoriales (rápidos y directos) sobre modelos de temas y LDA, enseñando intuitivamente cómo establecer algunos parámetros, qué significan y, si es posible, con algunos ejemplos reales.
fuente
Me gustaría saber si ustedes tienen algunos buenos tutoriales (rápidos y directos) sobre modelos de temas y LDA, enseñando intuitivamente cómo establecer algunos parámetros, qué significan y, si es posible, con algunos ejemplos reales.
Si está trabajando en R, el tutorial de Carson Sievert sobre el uso de LDA para modelar temas en reseñas de películas es un excelente punto de partida:
http://cpsievert.github.io/LDAvis/reviews/reviews.html
Este tutorial hace uso de LDAvis, una visualización interactiva de distribuciones de temas y palabras que realmente pueden ayudar a la intuición.
Además, aunque no es breve, las conferencias de David M. Blei sobre modelos de temas son un gran recurso para comprender el significado detrás de los parámetros: http://videolectures.net/mlss09uk_blei_tm/
Recomiendo este tutorial: Comenzando con el modelado de temas y MALLET
Aquí hay algunos enlaces adicionales para ayudarlo a comenzar ...
Buenos materiales introductorios (incluidos enlaces a trabajos de investigación): http://www.cs.princeton.edu/~blei/topicmodeling.html
Software:
Aún más aquí en el blog Biased Estimates: Lista de lectura de modelos de temas
Si está buscando algo simple para comenzar y fácil de implementar, se lo recomendaría.
El proyecto CLARIN-D ha reunido algunos buenos consejos para tutoriales para modelado de temas y LDA en el sitio de la Colección de Materiales de Enseñanza y Aprendizaje (TeLeMaCo) alojado por el centro CLARIN de la Universität des Saarlandes .
Sugiero probar el tutorial Gensim de Machine Learning Plu . Le proporcionará una visión global de NLP y LDA, que incluye: cómo preprocesar sus datos, realizar ingeniería de características y aplicar LDA.