Preguntas etiquetadas con nltk

29
¿Por qué xgboost es mucho más rápido que sklearn GradientBoostingClassifier?

Estoy tratando de entrenar un modelo de aumento de gradiente en más de 50k ejemplos con 100 características numéricas. XGBClassifiermaneja 500 árboles en 43 segundos en mi máquina, mientras que GradientBoostingClassifiermaneja solo 10 árboles (!) en 1 minuto y 2 segundos :( No me molesté en tratar...

15
Similitud entre dos palabras.

Estoy buscando una biblioteca de Python que me ayude a identificar la similitud entre dos palabras u oraciones. Haré la conversión de audio a texto, lo que dará como resultado un diccionario de inglés o palabras que no estén en el diccionario (podría ser el nombre de una persona o compañía)....

8
Trozos complejos con NLTK

Estoy tratando de descubrir cómo usar el troceador en cascada de NLTK según el Capítulo 7 del libro de NLTK . Desafortunadamente, me encuentro con algunos problemas al realizar medidas de fragmentación no triviales. Comencemos con esta frase: "adventure movies between 2000 and 2015 featuring...