Cuando digo "documento", tengo en mente páginas web como artículos de Wikipedia e historias de noticias. Prefiero las respuestas que ofrecen métricas de distancia léxica de vainilla o métricas de distancia semántica de última generación, con mayor preferencia por la