Preguntas etiquetadas con nlp

El procesamiento del lenguaje natural (PNL) es un campo de la informática, la inteligencia artificial y la lingüística relacionadas con las interacciones entre las computadoras y los lenguajes humanos (naturales). Como tal, la PNL está relacionada con el área de interacción humano-computadora. Muchos desafíos en PNL implican la comprensión del lenguaje natural, es decir, permitir que las computadoras obtengan el significado de la entrada del lenguaje humano o natural, y otros implican la generación del lenguaje natural.

29
¿Por qué xgboost es mucho más rápido que sklearn GradientBoostingClassifier?

Estoy tratando de entrenar un modelo de aumento de gradiente en más de 50k ejemplos con 100 características numéricas. XGBClassifiermaneja 500 árboles en 43 segundos en mi máquina, mientras que GradientBoostingClassifiermaneja solo 10 árboles (!) en 1 minuto y 2 segundos :( No me molesté en tratar...

22
¿Cuál es una mejor entrada para Word2Vec?

Esto es más como una pregunta general de PNL. ¿Cuál es la entrada adecuada para entrenar una incrustación de palabras, a saber, Word2Vec? ¿Deberían todas las oraciones que pertenecen a un artículo ser un documento separado en un corpus? ¿O debería cada artículo ser un documento en dicho corpus?...

21
¿Cómo cargo el modelo entrenado FastText con Gensim?

Traté de cargar el modelo preformado fastText desde aquí el modelo Fasttext . Estoy usando wiki.simple.en from gensim.models.keyedvectors import KeyedVectors word_vectors = KeyedVectors.load_word2vec_format('wiki.simple.bin', binary=True) Pero, muestra los siguientes errores Traceback (most...