Estaba (y todavía estoy) realmente interesado en la respuesta a esta pregunta, porque esta es una variación interesante sobre la complejidad de los juegos que no se ha resuelto, así que ofrecí una recompensa. Pensé que la pregunta original era muy difícil, así que publiqué tres preguntas relacionadas que también merecerían la recompensa. Nadie publicó ninguna respuesta antes de que expirara la recompensa. Más tarde pude responder dos de las preguntas relacionadas (preguntas 3 y 4, discutidas a continuación en mi publicación original), mostrando que aproximar el valor de los juegos arbitrados con monedas semiprivadas correlacionadas (definidas a continuación) fue EXPTIME-complete. La pregunta original sigue sin respuesta. También me interesaría cualquier resultado que ponga juegos relacionados entre PSPACE y EXPTIME en clases de complejidad interesantes.
POSTE ORIGINAL:
Esta pregunta fue inspirada por la discusión sobre la pregunta hexadecimal de Itai . Un juego arbitrado es un juego en el que dos jugadores computacionalmente ilimitados juegan comunicándose a través de un verificador de tiempo polinómico que puede lanzar monedas privadas (por lo tanto, la cantidad de turnos y la cantidad de comunicación también está limitada por el tiempo polinómico). Al final del juego, el árbitro ejecuta un algoritmo en P para determinar quién gana. Determinar quién gana un juego de este tipo (incluso aproximadamente) está completo EXPTIME. Si tienes monedas públicas y comunicación pública, tales juegos están en PSPACE. ( Ver Feige y Killian, "Making Short Games" ). Mi pregunta se refiere al límite entre estos dos resultados.
Pregunta: Suponga que tiene dos jugadores computacionalmente ilimitados que juegan un juego de longitud polinómica. El papel del árbitro se limita a, antes de cada movimiento, dar a cada jugador un cierto número de lanzamientos de monedas privados (no correlacionados con los del otro jugador). Todos los movimientos del jugador son públicos, y así lo ve su oponente: la única información privada son los lanzamientos de monedas. Al final del juego, se revelan todos los lanzamientos privados de monedas, y el árbitro polivalente usa estos lanzamientos de monedas y los movimientos del jugador para decidir quién gana.
Por el resultado de los juegos arbitrados, la aproximación de la probabilidad de que gane el primer jugador es EXPTIME, y también es claramente difícil para PSPACE. ¿Cuál (si alguno) es? ¿Se sabe algo sobre este problema?
Tenga en cuenta que los jugadores pueden tener que usar estrategias mixtas, ya que puede jugar juegos de matriz de suma cero (a la von Neumann) de esta manera.
MATERIAL AGREGADO:
Vamos a llamar a esta RGUSP clase de complejidad (todos los lenguajes que puede ser reducida a un juego Refereed con no correlacionados semiprivadas monedas como se describe anteriormente, tal que si x ∈ L , el jugador 1 gana con probabilidad ≥ 2 / 3 , y si x ∉ L , reproductor 1 gana con probabilidad leq 1 / 3 ). Mis tres preguntas relacionadas son:
Pregunta 2: RGUSP parece bastante robusto. Por ejemplo, si cambiamos el juego para que el árbitro no envíe mensajes, sino que solo observe los mensajes públicos de los jugadores 1 y 2 y reciba mensajes privados de ellos, entonces aproximar el valor de este juego sigue siendo equivalente a RGUSP. Me gustaría demostrar que RGUSP es robusto, por lo que estoy dispuesto a dar la recompensa a cualquiera que encuentre una clase de complejidad natural C para que PSPACE C ⊆ RGUSP, donde ninguno de los contenidos parece ser exacto.
Pregunta 3: También sospecho firmemente que la clase RGCSP (Juegos referidos con monedas semiprivadas correlacionadas) está COMPLETAMENTE COMPLETA, y también estoy dispuesto a dar la recompensa a alguien que demuestre este hecho. En RGCSP, en el primer paso, el árbitro le da a los dos jugadores variables aleatorias correlacionadas (por ejemplo, podría darle al primer jugador un punto en un plano proyectivo grande y al segundo jugador una línea que contenga este punto). Después de esto, para un número polinómico de rondas, los dos jugadores se alternan enviándose mensajes públicos de tamaño polivinílico. Después de jugar el juego, el árbitro de tiempo múltiple decide quién ganó. ¿Cuál es la complejidad de aproximar la probabilidad de ganar para el jugador 1?
Pregunta 4: Finalmente, tengo una pregunta que realmente puede ser sobre criptografía y distribuciones de probabilidad: si la capacidad de realizar transferencias inconscientes a dos jugadores en un juego arbitrado con monedas semiprivadas no correlacionadas les permite jugar un juego arbitrario arbitrado con monedas correlacionadas (o, alternativamente, ¿les permite jugar un juego determinando el ganador del cual es EXPTIME-complete)?
Respuestas:
No puedo responder mi pregunta original, pero puedo responder la pregunta 3 (y 4), que agregué cuando ofrecí una recompensa porque pensé que la pregunta original probablemente era demasiado difícil. De hecho, tengo dos pruebas de la pregunta 3.
======== Prueba 1 ============
La primera prueba utiliza el hecho de que la transferencia inconsciente es universal para el cálculo seguro de dos partes. Por lo tanto, si los jugadores 1 y 2 pueden realizar transferencias inconscientes, pueden simular un árbitro arbitrario en tiempo polinómico, por lo que se pueden aplicar los resultados anteriores de que los juegos arbitrados son EXPTIME completos.
Cuando pregunté por primera vez la pregunta 4, me preocupaba que los resultados de cómputo seguro de dos partes no se aplicaran a este tipo de cómputo interactivo con un árbitro, pero de hecho es bastante fácil demostrar que lo hacen.
=========== Prueba 2 ===========
Lo primero que usaremos es que, incluso con monedas aleatorias no correlacionadas, el árbitro puede hacer que los jugadores 1 y 2 realicen un compromiso de bits, haciendo que XOR los datos que desean comprometer con las monedas aleatorias. Por lo tanto, podemos hablar sobre P1 y P2 poniendo cosas en sobres sellados.
fuente