Tutorial de aprendizaje automático en línea

8

¿Alguien sabe algunos buenos tutoriales sobre técnicas de aprendizaje automático en línea? Es decir, cómo se puede usar en entornos en tiempo real, cuáles son las diferencias clave en comparación con los métodos normales de aprendizaje automático, etc.

UPD: Gracias a todos por las respuestas, por "en línea" me refiero a los métodos que se pueden entrenar en un modo en tiempo real, basados ​​en nuevas entradas una por una.

Igor Bobriakov
fuente
2
¿Podría aclarar aspectos clave de "en línea" que le interesen? ¿Tiene un formulario específico para los datos o alguna opción para entrenar previamente su algoritmo antes de la parte en línea?
Neil Slater
¿te refieres a analizar flujos de datos?
Johnny000

Respuestas:

5
  1. Hay una muy buena biblioteca de algoritmos de aprendizaje automático en línea de un grupo en NTU, llamada LIBOL. Este sería un muy buen lugar para comenzar a experimentar con los algoritmos.
    La guía del usuario adjunta y la publicación JMLR asociada son una introducción muy buena a los algoritmos básicos en este campo.
  2. Avrim Blum tiene una encuesta más antigua y técnica sobre algoritmos de aprendizaje en línea.
tchakravarty
fuente
Los dos primeros enlaces están muertos.
Suzana
1

Puede ver si puede mezclar la transmisión de Spark ( https://spark.apache.org/docs/1.1.0/streaming-programming-guide.html ) y la Biblioteca de Spark ML ( https://spark.apache.org/docs /1.1.0/mllib-guide.html ).

Spark Streaming permite procesar transmisiones de datos en vivo y Spark ML Library es una biblioteca de aprendizaje automático para Spark. ¡Entonces quizás puedas hacer algo bueno!

Pero este es un tema muy interesante, estoy trabajando en ello. ¿Puede ser bueno crear una Comunidad de Google en él ( https://plus.google.com/communities )?

JC R
fuente
0

Hay muchos en youtube y aquí hay uno famoso de Andrew Ng de coursea: https://www.coursera.org/course/ml

alvas
fuente
No estoy 100% convencido por los temas de ese curso. Por ejemplo, ¿los SVM son realmente de uso práctico en estos días? Nunca ves una entrada ganadora de Kaggle que usara SVM como parte principal.
Lembik
2
Creo que la pregunta de OP es específicamente sobre técnicas en línea , es decir, dónde se espera que el sistema aprenda al menos parcialmente "en el trabajo". No tutoriales en línea
Neil Slater
Estoy de acuerdo con @NeilSlater ya que el OP mencionó "en comparación con los métodos normales de aprendizaje automático".
Rohit
44
jajaja, "en línea" es ambiguo
alvas