Geometría Algebraica para Estadística

8

He escuchado acerca de los usos de la geometría algebraica en estadística y aprendizaje automático. Quería intentar aprender un poco sobre estos temas. No sé casi nada sobre geometría algebraica, pero tengo experiencia en matemáticas y sé sobre teoría básica de grupos, campos de anillos y algo de álgebra conmutativa. Mis preguntas son:

  1. ¿Cuáles son los conceptos de Geometría Algebríaca que debo aprender que están conectados a las aplicaciones en Estadísticas / ML (supongo que solo una parte de lo que generalmente se enseña en los cursos y libros de Geometría Algebraica es útil)?

  2. ¿Me puede recomendar algunos libros / documentos introductorios para alguien con mi experiencia? No me refiero a los libros de texto estándar para AG, sino a algo que se centra en los conceptos utilizados en las aplicaciones.

sjm.majewski
fuente
3
Puede comenzar con M. Drton, B. Sturmfels y S. Sullivant, Lectures on Algebraic Statistics , Springer, 2009.
cardenal

Respuestas:

11

Aquí hay una lista de las referencias estándar:

Aquí hay una lista de referencias relacionadas, que no abordan directamente las estadísticas algebraicas, aunque proporcionan antecedentes en la metodología utilizada para el tema:

Páginas web de cursos sobre el tema, pasado y presente:

Es casi seguro que estas listas no son exhaustivas.

Chill2Macht
fuente
5

ingrese la descripción de la imagen aquí

Seguro que será influyente, este libro sienta las bases para el uso de la geometría algebraica en la teoría del aprendizaje estadístico. Muchos modelos estadísticos ampliamente utilizados y máquinas de aprendizaje aplicadas a la ciencia de la información tienen un espacio de parámetros que es singular: los modelos mixtos, las redes neuronales, los HMM, las redes bayesianas y las gramáticas estocásticas sin contexto son ejemplos importantes. La geometría algebraica y la teoría de la singularidad proporcionan las herramientas necesarias para estudiar tales modelos no lisos. Se establecen cuatro fórmulas principales:

  1. la función de probabilidad logarítmica puede recibir una forma estándar común usando resolución de singularidades, incluso aplicada a modelos más complejos;

  2. el comportamiento asintótico de la probabilidad marginal o 'la evidencia' se deriva de la teoría de la función zeta;

  3. se derivan nuevos métodos para estimar los errores de generalización en las estimaciones de Bayes y Gibbs a partir de errores de entrenamiento;

  4. Los errores de generalización de máxima verosimilitud y los métodos a posteriori se aclaran mediante la teoría del proceso empírico sobre variedades algebraicas.

Rodrigo de Azevedo
fuente
Gracias por la referencia: ¡este libro parece la mejor recomendación hasta ahora! Tendré que conseguirlo pronto. También para cualquier persona interesada aquí hay una pregunta en este sitio web sobre este libro: stats.stackexchange.com/questions/22391/…
Chill2Macht