Ciencia de los datos

15
R: aprendizaje automático en GPU

¿Hay algún paquete de aprendizaje automático para R que pueda hacer uso de la GPU para mejorar la velocidad de entrenamiento (algo así como theano del mundo python)? Veo que hay un paquete llamado gputools que permite la ejecución de código en la gpu, pero estoy buscando una biblioteca más...

15
Predicción de similitud de oraciones

Estoy tratando de resolver el siguiente problema: tengo un conjunto de oraciones como mi conjunto de datos, y quiero poder escribir una nueva oración y encontrar la oración con la que la nueva es más similar en el conjunto de datos. Un ejemplo se vería así: Nueva oración: " I opened a new...

15
Herramientas de ciencia de datos con Scala

Sé que Spark está completamente integrado con Scala. Su caso de uso es específicamente para grandes conjuntos de datos. ¿Qué otras herramientas tienen buen soporte de Scala? ¿Es Scala el más adecuado para conjuntos de datos más grandes? ¿O también es adecuado para conjuntos de datos más...

15
Similitud entre dos palabras.

Estoy buscando una biblioteca de Python que me ayude a identificar la similitud entre dos palabras u oraciones. Haré la conversión de audio a texto, lo que dará como resultado un diccionario de inglés o palabras que no estén en el diccionario (podría ser el nombre de una persona o compañía)....