Un juego en varios gráficos.

13

Considere el siguiente juego en un gráfico ponderado dirigido con una ficha en algún nodo.G

Todos los nodos de están marcados por A o B.G

Hay dos jugadores, Alice y Bob. El objetivo de Alice (Bob) es cambiar el chip a un nodo marcado por A (B).

Inicialmente, Alice y Bob tienen y dólares respectivamente.mAmB

Si un jugador está en una posición perdedora (es decir, la posición actual de la ficha está marcada con la letra opuesta), puede mover la ficha a un nodo vecino. Tal movimiento cuesta algunos dólares (el peso del borde correspondiente).

El jugador pierde si él o ella está en una posición perdedora y no tiene dinero para arreglarlo.

Ahora considere el lenguaje GAME que consiste en todos los gráficos ponderados dirigidos (todos los pesos son enteros positivos), la posición inicial del chip y las mayúsculas de Alice y Bob que se dan en la representación unariaG

tal que Alice tiene una estrategia ganadora en este juego.

El juego de lenguaje pertenece a P . De hecho, la posición actual del juego está definida por la posición del chip y las mayúsculas actuales de Alice y Bob, por lo que la programación dinámica funciona (aquí es importante que las mayúsculas iniciales se den en la representación unaria).

Ahora considere la siguiente generalización de este juego. Considere varios gráficos ponderados dirigidos con un chip en cada gráfico. Todos los nodos de todos los gráficos están marcados por A y B. Ahora Bob gana si todas las fichas están marcadas por B y Alice gana si al menos una ficha marcada por A.G1,Gn

Considere el lenguaje MÚLTIPLES JUEGOS que consta de todos los gráficos G1,,Gn , posiciones iniciales y mayúsculas mA y mB (en la representación unaria) de manera que Alice gane en el juego correspondiente. Aquí es importante que las capitales sean comunes para todos los gráficos, por lo que no se trata solo de varios GAME independientes.

Pregunta ¿Cuál es la complejidad del lenguaje MULTI-JUEGOS? (¿También pertenece a P o hay algunas razones para pensar que este problema es difícil?)

UPD1 Neal Young sugirió utilizar la teoría de Conway. Sin embargo, no sé si es posible usar esta teoría para varios juegos con capital común.

UPD2 Quiero mostrar un ejemplo que muestre que MULTI-GAME no es muy simple. Deje que Alice divide su capital de mA de algunos n términos mA=a1+a2+an (Ella se va a utilizar ai dólares para i gráfica -ésimo). Defina bi como el número mínimo tal que en el i -ésimo juego Bob gane si Alice y Bob tienen ai y bi dólares respectivamente. Si b1+bn>mB (para algunas divisionesmA=a1+a2+an ) entonces Alice gana. Sin embargo, lo contrario no es cierto. Considere dos copias del siguiente gráfico (inicialmente, el chip está en la parte superior izquierda A): ingrese la descripción de la imagen aquí

Por un gráfico Bob victorias si mA=0 y mB=2 o si mA=1 y mB=3 . Sin embargo, para el juego con dos copias de este gráfico Bob pierde si mA=1 y mB=5 . De hecho, Bob tiene que pasar 4 o 5 dólares para cambiar ambos chips a un nodo marcado por B . Luego, Alice puede cambiar al menos un chip a un nodo marcado por A. Después de eso, Bob no tiene dinero para salvar su posición.

UPD3 Dado que la pregunta para gráficos arbitrarios parece difícil, considere gráficos específicos. Denote los nodos de algún gráfico Gi como 1,k . Mi restricción es la siguiente: para cada par i<j existe un borde de i a j y no existe el borde inverso. También existe una restricción para los costos de las aristas: para i<j<k la arista j a k no es mayor que de i a k .

Alexey Milovanov
fuente
44
en MULTI-GAME, ¿qué constituye un movimiento? ¿El jugador hace un movimiento en cada gráfico? ¿O elige un gráfico para hacer un movimiento? ¿Has investigado si la teoría de los juegos de Conway (calefacción y refrigeración) se aplica aquí? (Algunas referencias se pueden encontrar aquí: en.wikipedia.org/wiki/… )
Neal Young
@Neal Young El jugador elige un gráfico para hacer un movimiento.
Alexey Milovanov
FWIW, si recuerdo, la teoría de los juegos de Conway considera cómo jugar juegos que están compuestos de otros juegos de esa manera (en cada movimiento, el jugador elige uno de los subjuegos para moverse). Sin embargo, no sé qué relevancia tiene su teoría sobre la complejidad computacional.
Neal Young el
1
@NealYoung Gracias, pero entiendo que el problema es que los jugadores tienen capitales comunes para todos los juegos. No encuentro la forma en que puede ser fijado por la teoría de Conway ...
Alexey Milovanov
¿Alice (Bob) está obligada a mover el chip si está en el nodo A (B)? ¿Cuáles son las condiciones ganadoras del juego múltiple? ¿B gana también cuando todas las fichas están en los nodos B, pero A todavía tiene algo de dinero? Usted dice que A gana si al menos un chip está en A, por lo que A simplemente puede tratar de mantener dos chips en un nodo marcado con A en los dos gráficos "menos costosos"; Tan pronto como B aleja una de las dos fichas del nodo A, Alice la trae de vuelta (e ignora los otros gráficos)
Marzio De Biasi

Respuestas:

2

Dado que la respuesta de Steven Stadnicki no parece haber sido aceptada por el autor de la pregunta, pensé que aún podría ser útil proporcionar una actualización: tengo una reducción de 3SAT a MULTI-GAME. No he mirado la respuesta de Steven con cuidado ni he seguido el enlace que proporcionó, pero en base a la siguiente reducción no me sorprendería si MULTI-GAME es realmente PSPACE-complete. Sin embargo, podría no molestarme en extender este resultado más allá de la dureza NP.

Una instancia de 3SAT consta de cláusulas C1,,Cm , cada cláusula tiene la forma Ci=Li1Li2Li3 donde cada Lik es una de las variables x1,,xn o la negación de una de las variables.

Dada tal instancia de 3SAT, la reducción crea una instancia MULTI-GAME que consta de n+1 juegos, uno para cada variable y otro juego utilizado como sumidero de capital en exceso. Primero definiremos la estructura de los gráficos para cada juego, luego veremos un ejemplo y discutiremos la idea central, y luego descubriremos qué costos exactos asignar a los bordes para que la reducción se mantenga firme.

Primero, el gráfico de juego variable Gj para cada variable xj :

  1. Cree un vértice etiquetado xj marcado con una A (es decir, un vértice ganador para Alicia). El chip para Gj comienza en el vértice xj .
  2. Cree un vértice etiquetado como T y un vértice etiquetado como F , cada uno marcado con una B (es decir, ambos son posiciones ganadoras para Bob). Cree bordes dirigidos desde xj hasta T y F , ambos con costos de 1 .
  3. Para cada literal Lik de la cláusula Ci , si Lik=xj o Lik=¬xj , cree vértices etiquetados CiTA y CiFA marcados con A y vértices etiquetados CiTB y CiFB marcado con B. Agregar bordes (T,CiTA) y(F,CiFA) con costos ambos establecidos enlik . (Definiremoslik más tarde).

    Agregue aristas (CiTA,CiTB) y (CiTA,CiTB) . Si Lik=xj , entonces establezca el costo de (CiTA,CiTB) en lik1 y (CiTA,CiTB)El costo de T B ) paralik . De lo contrario, ajuste elcosto de(CiTA,CiTB) alik y elcosto de(CiTA,CiTB) alik1 .

El juego del sumidero de capital:

  1. Cree un vértice etiquetado C , marcado con B.
  2. Para cada cláusula Ci , cree un vértice etiquetado CiA marcado con A, y un vértice etiquetado CiB marcado con B. Cree un borde (C,CiA) con el costo de borde ci (nuevamente se determinará a continuación) , y una arista (CiA,CiB) también con costo de arista ci .

Esto es mucho para asimilar, así que espero que un ejemplo lo haga un poco más digerible. Nuestra instancia de 3SAT es la siguiente:

C1=x1x2¬x3

C2=x2x3¬x4

C3=¬x1¬x3x4

La reducción convierte esta instancia en 4 gráficos de juego variables y 1 gráfico de sumidero de capital. En los siguientes diagramas, los vértices rojos están marcados con A (es decir, son posiciones ganadoras para Alice), y los vértices cian están marcados con B (son posiciones ganadoras para Bob).

Gráfico para x1 :

ingrese la descripción de la imagen aquí

Gráfico para x2 :

ingrese la descripción de la imagen aquí

Gráfico para x3 :

ingrese la descripción de la imagen aquí

Gráfico para x4 :

ingrese la descripción de la imagen aquí

Gráfico para el sumidero de capital:

ingrese la descripción de la imagen aquí

La idea es la siguiente:

Bob se ve obligado a hacer los primeros n movimientos para salir de las posiciones perdedoras en los n juegos variables. Cada movimiento de este tipo codifica una asignación de verdadero o falso a la variable correspondiente.

Entonces, Alice tendrá suficiente capital para hacer exactamente 4 movimientos, cada uno de los cuales Bob necesitará tener suficiente capital para igualar para que Bob gane. Los valores ci y los valores lik deben elegirse de modo que la única estrategia ganadora posible de Alice sea la siguiente, para alguna cláusula Ci :

Cláusula de Alice Ci estrategia: sea Ci=Li1Li2Li3 . Para cada k{1,2,3} , si Lik=xj o ¬xj , pasar a Ci?A en el juego variable para xj . También pasa a CiA en el juego de sumidero de capital.

( Ci?A denota CiTA o CiFA , solo uno de los cuales es accesible en un juego variable dado después de los movimientos iniciales de Bob).

Si la apertura de Bob corresponde a una asignación de verdad que deja insatisfecha alguna cláusula Ci , entonces Alice elegir Ci e implementar la estrategia anterior le cuesta a Alice li1+li2+li3+ci capital implementar, y Bob lo mismo vencer; si, por otro lado, Ci está satisfecho, entonces el contrajuego de Bob obtiene un descuento de al menos 1 . Nuestro objetivo en el establecimiento de ci y lik valores y las capitales iniciales de Alice y Bob es asegurar que dicho descuento sea el factor decisivo para que Alice o Bob ganen.

Para ese fin, establezca b=m+1 , y establezca

lik=2b10+ib2k para cadak{1,2,3} ,

ci=3b10+b8k=13ib2k ,

El capital inicial de Alicia es 9b10+b8 ,

y el capital inicial de Bob a 9b10+b8+n1.

Tenga en cuenta que todos estos valores son polinomiales en m , por lo que la instancia MULTI-GAME generada por la reducción tiene un tamaño polinomial en el tamaño de la instancia 3SAT, incluso si estos costos están codificados en unario.

Tenga en cuenta también que para cada cláusula Ci , li1+li2+li3+ci=9b10+b8 es el capital inicial de Alice. (Que también es 1 mayor que la capital de Bob después de hacer los primeros n movimientos).

En primer lugar, queda claro de inmediato que si la apertura de Bob define una asignación de verdad que deja una cláusula Ci insatisfecha, entonces Alice gana usando su estrategia de cláusula Ci dada anteriormente.

Si la apertura de Bob satisface todas las cláusulas, podemos argumentar restricciones sobre las opciones de Alice que descartan cualquier otra posibilidad de que Alice gane. Tenga en cuenta que el orden en que Alice realiza sus movimientos es irrelevante, ya que las respuestas de Bob son forzadas y el capital total que Bob necesitará para responder a los movimientos de Alice no cambia por el orden de los movimientos de Alice.

  • Alice no puede hacer más de 4 movimientos: si Alice hace 5 o más movimientos, entonces sus movimientos tienen un costo total de 5b10 , lo que excede su presupuesto.
  • Alice debe hacer 4 movimientos: si Alice selecciona 3 movimientos del juego sumidero de capital, entonces su costo total es 9b10+3b83b7>9b10+2b8 que supera el presupuesto. Si selecciona incluso un movimiento de 3 de un juego variable, entonces su costo total es 8b10+2b8+b7 que es sustancialmente menor que el capital posterior a la apertura de Bob, por lo que Bob puede permitirse fácilmente el contrajuego.
  • Alice debe seleccionar un movimiento del juego de hundimiento de capital: si no lo hace, entonces selecciona 4 movimientos de juegos variables, con un costo total 8b10+4b7 , y nuevamente Bob puede permitirse el contrajuego. (Tenga en cuenta que si hubiera un juego separado de sumidero de capital por cláusula, incluso podríamos demostrar que Alice debe jugar exactamente en uno de esos juegos).

Desde esta etapa podemos ignorar los términos b10 y b8 en los costos de movimiento elegidos, ya que siempre sumarán 9b10+b8 . Desde Alice debe elegir exactamente un movimiento en el juego disipador de capital, asumir que es movida a CiA . Entonces Alice ha (ignorando b10 y b8 términos) k=13ib2k capital restante, y Bob tiene 1 menos de esta cantidad restante.

  • Alice debe seleccionar al menos un movimiento que cueste lj3 para alguna cláusula Cj : si no lo hace, entonces sus movimientos cuestan (nuevamente términos de orden inferior) 3b5 , y Bob tiene más que suficiente capital para contrajuego.
  • Dicho movimiento que cuesta lj3 debe ser el movimiento que cuesta li3 : no puede ser un movimiento que cueste lj3 para j>i , de lo contrario, este movimiento solo cuesta (i+1)b6 que es mayor que el resto de Alice presupuesto. Si es lj3 para j<i , entonces el movimiento de coste l(ij)3 también debe ser elegido por Alice para agotar el b6plazo de pedido en el presupuesto restante de Bob. Pero entonces, o bien el término de orden b2 en el presupuesto restante de Bob o el término de orden b2 no se agota, por lo que Bob gana fácilmente.

Argumentos similares deberían establecer que Alice debe seleccionar los movimientos que cuestan li2 y li1 . Si la asignación de verdad de Bob satisface Ci , entonces incluso esta estrategia no funciona, ya que el descuento que Bob obtiene en uno de los costos basados ​​en lik compensa el 1 capital menos que tiene después de su apertura.


Una observación sobre mi respuesta anterior: es obvio en retrospectiva que, para la variante TABLE-GAME de MULTI-GAME que definí en los comentarios de esa respuesta, un DP de estilo mochila resulta suficiente para determinar qué jugador tiene una estrategia ganadora. Puede argumentar que la mejor estrategia de Bob es responder siempre a un estado perdedor en una mesa de juego dada con la mínima inversión posible (esto no puede cortar un movimiento posterior para Bob que él tendría de otra manera), y a partir de ahí que el orden de los movimientos de Alice no importa. Luego se convierte en una cuestión de elegir una división del capital de Alice entre los juegos, de modo que la suma de las respuestas ganadoras mínimas de Bob sobre esos juegos exceda su presupuesto, que puede reformularse como un problema de estilo de mochila, que tiene un DP de tiempo polinómico debido a la representación unaria de costas. (Mi recurrencia en realidad '

Resulta que incluso una estructura de árbol simple para cada juego, con una profundidad constante y realmente solo una bifurcación significativa por juego (es decir, aquellas al comienzo que obligan a Bob a elegir una asignación de verdad) es suficiente para obtener la dureza NP. Tuve algunas ideas para deshacerme de esa bifurcación inicial, que se estancó al obligar de alguna manera a Bob a invertir una cantidad fija de capital relativamente grande en n juegos sin que Alice tenga que comprometerse previamente con esos juegos, pero obviamente ya que TABLE-GAME está en P esto no es posible sin la horquilla.

No he pensado mucho en su caso especial de UPD3 . Sospecho que también es NP-hard, por la razón de que mis dispositivos variables parecen a simple vista que pueden adaptarse a esas restricciones, pero probablemente no lo investigaré más a fondo.

gdmclellan
fuente
0

Actualización: probablemente incorrecta, dejando por ahora como un registro de haber explorado una avenida. Ver comentarios.

Actualización 2: definitivamente incorrecta.

Considere una gráfica de la forma (B) -1-> (A) -1-> (B), es decir, sol=(V,mi) , donde V={1,2,3} , E={(1,2),(2,3)} , los vértices 1, 2, 3 están etiquetados como B, A, B respectivamente, y los bordes tienen todos los costos asignados de 1.

Defina una instancia de 3 juegos de MULTI-GAME configurando mA=mB=2 , G1=G2=G3=G , con los tres juegos comenzando en el vértice 1. Claramente, Alice no puede ganar este juego.

Sin embargo, la recurrencia a continuación falla para M[3,2,2] : no hay división de los fondos de Bob 2u,u entre los dos primeros juegos y el tercer juego de tal manera que para todas las divisiones de los fondos de Alice v,2v , tanto M[2,2u,2v]=B y W[3,u,v]=B . Siu=1 ou=2 , entoncesM[2,2u,2]=A ; y siu=0 entoncesW[3,u,2]=A .

No veo una forma inmediata de salvar este enfoque. Invertir el orden de cuantificación en u y v hace que la recurrencia falle en la instancia en la actualización 2 de la publicación de preguntas.


mA,mB,G1,,Gn,

Precomputar

W[k,x,y]={Aif Alice wins GAME on Gk with initial funds x for Alice and y for Bob,Botherwise

xmAymB

M[k,x,y]kxmAymBM[k,x,y]=BA

M[1,x,y]=W[1,x,y]

y

M[k+1,x,y]=Bif and only ifvu,W[k+1,u,v]=BandM[k,xu,yv]=B.

M[n,mA,mB]=A

gdmclellan
fuente
Tu algoritmo está mal. Considere el gráfico en la imagen en mi publicación. Considere el JUEGO MÚLTIPLE con dos de estos gráficos. Aquí W [1,0,2] = W [2,0,2] = B y W [1,1,3] = W [2,1,3] = B. Sin embargo, para MULTI-GAME con m_A = 1 y m_B = 5 Alice gana
Alexey Milovanov
u
@AlexeyMilovanov con cambios en los cuantificadores por los que debería pasar la recurrencia para el ejemplo. Pero me ha puesto en duda este enfoque. Parece que podría requerir que Bob diseñe una única distribución de fondos que supere todas las distribuciones que Alice podría concebir. Dicho esto, no estoy seguro de haber sido persuadido de la idea central aquí: que este problema no se trata realmente de GAME. ¿Se sabe algo sobre el problema relacionado donde cada instancia de GAME se reemplaza por una tabla simple a la W anterior?
gdmclellan
La tabla W no define al ganador. No sé si es cierto para otra mesa ...
Alexey Milovanov
@AlexeyMilovanov La Tabla W, por definición, determina el ganador de las instancias de JUEGO aisladas a cualquiera de los gráficos de entrada específicos. No estoy seguro de por qué dirías lo contrario. Sin embargo, he actualizado mi respuesta con un contraejemplo, en caso de que hubiera alguna duda persistente de que era incorrecta.
gdmclellan
0

[n]n+1n0i+1i0i<n00n[n]n00

Gαβα[i]ββ[j][k]j<kαββ[j][k][k][i]{i{jk}}

Steven Stadnicki
fuente
1
Las pruebas en la tesis parecen usar grandes valores de i, j y k en los juegos. Tenga en cuenta que aquí se puede suponer que todos los pesos son, como máximo, las capitales de los jugadores, que se representaron en unario.
Antti Röyskö
@ AnttiRöyskö Tendré que mirar mucho más de cerca la prueba, entonces; Creo que el resultado en PSPACE-completeness of Go endgames utiliza el resultado de la tesis y también supone un recuento unario (ya que allí, i / j / k provienen del tamaño de las regiones del tablero).
Steven Stadnicki
αβ0 0
αβα[yo]>[j]j+1[yo][j]
αβnorte