Esto se inspiró en la regresión lineal en línea eficiente , que me pareció muy interesante. ¿Existe algún texto o recurso dedicado a la computación estadística a gran escala, mediante la cual la computación con conjuntos de datos es demasiado grande para caber en la memoria principal, y tal vez demasiado variada para submuestrar efectivamente? Por ejemplo, ¿es posible adaptar modelos de efectos mixtos en línea? ¿Alguien ha estudiado los efectos de reemplazar las técnicas estándar de optimización de segundo orden para MLE con técnicas de primer orden, tipo SGD?
12
Respuestas:
Puede investigar el proyecto Vowpal Wabbit , de John Langford en Yahoo! Investigación . Es un alumno en línea que realiza un descenso gradiente especializado en algunas funciones de pérdida. VW tiene algunas características asesinas:
El libro Bianchi & Lugosi Prediction, Learning and Games ofrece una base sólida y teórica para el aprendizaje en línea. Una lectura pesada, pero vale la pena!
fuente