Estos términos se mezclan mucho, pero me gustaría saber cuáles cree que son las diferencias, si las hay.
Gracias
fuente
Estos términos se mezclan mucho, pero me gustaría saber cuáles cree que son las diferencias, si las hay.
Gracias
LSA y LSI se usan principalmente como sinónimos, y la comunidad de recuperación de información generalmente se refiere a él como LSI. LSA / LSI utiliza SVD para descomponer la matriz de documentos de término A en una matriz de términos y conceptos U, una matriz de valores singulares S y una matriz de documentos de conceptos V en la forma: A = USV '. La página de wikipedia tiene una descripción detallada de la indexación semántica latente .
Notablemente, mientras que LSA y LSI usan SVD para hacer su magia, hay un método computacional y conceptualmente más simple llamado HAL (Hyperspace Analogue to Language) que se filtra a través del texto haciendo un seguimiento de los contextos anteriores y posteriores. Los vectores se extraen de estas matrices de coincidencia (a menudo ponderadas) y se seleccionan palabras específicas para indexar el espacio semántico. En muchos sentidos, se me da a entender que funciona tan bien como LSA sin requerir el paso matemático / conceptualmente complejo de SVD. Ver Lund & Burgess, 1996 para más detalles.
NMF y SVD son algoritmos de factorización de matriz. Wikipedia tiene información relevante sobre NMF .
Los otros respondedores han cubierto LSI / LSA ...
fuente