¿Hay alguna biblioteca de aprendizaje automático para Ruby que sea relativamente completa (incluida una amplia variedad de algoritmos para el aprendizaje supervisado y no supervisado), probada de manera sólida y bien documentada? Me encanta el scikit-learn de Python por su increíble documentación, pero un cliente preferiría escribir el código en Ruby ya que eso es con lo que está familiarizado.
Idealmente, estoy buscando una biblioteca o un conjunto de bibliotecas que, como scikit
y numpy
, puedan implementar una amplia variedad de estructuras de datos como matrices dispersas, así como estudiantes.
Algunos ejemplos de cosas que necesitaremos hacer son la clasificación binaria usando SVM e implementando modelos de bolsa de palabras que esperamos concatenar con datos numéricos arbitrarios, como se describe en esta publicación de StackOverflow .
fuente
Respuestas:
Seguiré y publicaré una respuesta por ahora; si alguien tiene algo mejor, aceptaré el suyo.
En este punto, la opción más poderosa parece ser acceder a WEKA usando jRuby. Pasamos ayer recorriendo la red, y esta combinación incluso fue utilizada por una charla en RailsConf 2012 , por lo que supongo que si hubiera un paquete de rubí puro comparable, lo habrían utilizado.
Tenga en cuenta que si sabe exactamente lo que necesita, hay muchas bibliotecas individuales que envuelven paquetes independientes como libsvm o vuelven a implementar algunos algoritmos individuales como Naive Bayes en Ruby puro y le ahorrará el uso de jRuby.
Pero para una biblioteca de uso general, WEKA y jRuby parecen ser la mejor apuesta en este momento.
fuente