Fuentes para la teoría del juego evolutivo algorítmico

15

Uso el término del título en un sentido muy laxo.

Hay una gran cantidad de trabajo sobre la teoría de los juegos evolutivos, incluidos sus fundamentos matemáticos. Me recomendaron "Juegos evolutivos y dinámica de población", pero aún no he profundizado en ello.

También hay una gran cantidad de trabajo sobre la teoría algorítmica de juegos, que es un tema popular en este sitio.

Lo que me gustaría ver es un trabajo que haga declaraciones computacionales de complejidad o convergencia sobre ciertas dinámicas evolutivas.

Ejemplos (redactados muy libremente):

  1. Dada una población y un esquema evolutivo, ¿podemos dar un arrepentimiento probabilístico vinculado a la optimización de la población a largo plazo (en comparación con el mejor individuo producido?). Esto parece relacionarse fuertemente con conjuntos de expertos y problemas de bandidos. ¿Qué pasa en entornos no estacionarios?
  2. Dado un conjunto de poblaciones de diferentes especies que interactúan en su entorno, jugando casi cualquier tipo de juego multijugador, ¿qué declaraciones podemos hacer sobre la eventual estabilidad de sus estrategias o distribuciones de estrategias, dadas sus estrategias evolutivas.
  3. En cualquier tipo de ambiente con muchos "nichos" (entiendo una forma muy amplia de redacción), ya sea en términos de relación directa con el medio ambiente o en términos de relaciones con otras especies, ¿qué declaraciones podemos hacer sobre cómo se distribuirán las poblaciones? a través de estos nichos.
  4. Cualquier problema que no haya preguntado pero que debería: voy a llegar a esto con poco AGT, TCS, Algoritmos genéticos, teoría de juegos evolutivos o antecedentes de biología de poblaciones; Estoy haciendo mis preguntas desde un punto de vista de optimización / aprendizaje automático / estadísticas, que puede ser incorrecto o incompleto.
Elliot JJ
fuente

Respuestas:

11

Este es uno de los temas en los que he estado buscando conexiones por un tiempo. Sin embargo, no parecen ser tan frecuentes. Las personas que trabajan en biología teórica y economía que usan EGT, generalmente se adhieren a la teoría de sistemas dinámicos y no usan la lente algorítmica. Por lo tanto, la mayoría de los resultados son del estilo AMath / Física, y no de los algoritmos y el estilo matemático discreto. Si está dispuesto a seguir el enfoque de sistemas dinámicos, entonces hay una encuesta de Hofbauer y Sigmund que es más corta y más reciente que su libro (lo menciono y algunos comentarios aprobados en una respuesta anterior ).

Uno de los lugares en los que la dinámica del replicador se ha utilizado en resultados relacionados con la complejidad es Marcello Pelillo y sus coautores como heurísticos para resolver max-clique (reduzca la programación de max-clique a cuadrática, resuelva la programación cuadrática utilizando la dinámica de replicador como su heurística) :

[1] Immanuel M. Bomze y Marcello Pelillo [2000]. "Aproximación de la camarilla de peso máximo utilizando la dinámica del replicador". Transacciones IEEE en redes neuronales 11 (6)

[2] Marcello Pelillo y Andrea Torsello [2006]. "Dinámica de juego monótono y el problema de la camarilla máxima". Computación neuronal 18: 1215-1258.

Σ2PAGΣ2PAG

[3] Kousha Etessami y Andreas Lochbihler [2008] "La complejidad computacional de las estrategias evolutivamente estables". International Journal of Game Theory , 37 (1): 93-113. (Disponible por primera vez en 2004 como informe técnico ECCC TR04-055).

[4] Vincent Conitzer [2013] "La complejidad computacional exacta de las estrategias evolutivamente estables". La novena Conferencia sobre Economía de la Web y de Internet (WINE) . ( pdf )

Muchas de las preguntas interesantes de EGT de hoy son sobre juegos en gráficos, y aunque hay algunos resultados dinámicos del sistema, como (también vea esta pregunta para extensiones de este enfoque):

[5] Hisashi Ohtsuki y Martin Nowak [2006] "La ecuación del replicador en gráficos". _ Journal of Theoretical Biology_, 243 (1), 86-97 ( enlace , publicación de blog )

La mayor parte del trabajo se realiza a través de modelos basados ​​en agentes (consulte esta respuesta para un contexto de modelos de propagación de enfermedades). Estos modelos suelen ser mucho más acogedores para las declaraciones de complejidad y convergencia. Mira el siguiente libro para más información:

[6] Yoav Shoham y Kevin Leyton-Brown [2009], "Sistemas multiagente: bases algorítmicas, teóricas de juego y lógicas", prensa de la Universidad de Cambridge.

Creo que el aprendizaje automático es una forma bastante directa de acercarse a EGT, ya que es un punto medio natural entre la física relevante (mecánica estadística) y la informática. Esto definitivamente se ha hecho, me tomaría un poco encontrar una buena referencia, pero una referencia aleatoria (que también muestra que la gente de EGT ha considerado otros conceptos de equilibrio populares, como el equilibrio correlacionado):

[7] Sergiu Hart y Andreu Mas-Colell [2000], "Un procedimiento adaptativo simple que conduce al equilibrio correlacionado", Econometrica 68 (5): 1127-1150

[8] Antonella Ianni [2001], "Aprendizaje de equilibrios correlacionados en juegos de población", Mathematical Social Sciences 42 (3): 271-294.

[9] Ludek Cigler y Boi Faltings [2011], "Alcanzar equilibrios correlacionados a través del aprendizaje de múltiples agentes", AAMAS 2011: 509-516

Definitivamente espero que otros den respuestas más específicas, ya que esta es una pregunta que siempre quise saber más.

Artem Kaznatcheev
fuente
5

Como han dicho otros, hay menos de lo que cabría esperar. Un par de documentos relacionados tangencialmente:

"Pesos multiplicativos en juegos de coordinación y la teoría de la evolución" de Chastain, Livnat, Papadimitriou y Vazirani. Este artículo argumenta que la dinámica evolutiva (en un modelo simple) es equivalente a un juego de coordinación entre genes que se juegan con el algoritmo de aprendizaje de pesos multiplicativos. Analizan la variante de 2 genes, en un modelo simplificado.

Tenga en cuenta que el algoritmo de pesos multiplicativos es una dinámica natural conocida por converger al equilibrio de Nash en juegos de suma cero, juegos de potencial no atómico y algunos otros (ver, por ejemplo, Freund y Schapire )

"El precio de la anarquía estocástica" de Chung, Ligett, Pruhs y yo (desde hace un tiempo). Aquí estudiamos los estados estocásticamente estables de un juego, que están relacionados con ESS. No nos preocupa la complejidad de encontrarlos, pero mostramos que en algunos juegos, el precio de la anarquía es más bajo en el conjunto de equilibrios estocásticamente estables en comparación con los equilibrios arbitrarios de Nash.

Aaron Roth
fuente
-1

norte2

Chad Brewbaker
fuente