Dado un juego determinista de suma cero de información parcial con solo un número finito de estados,
cuyos posibles resultados son [perder, empatar, ganar] con valores [-1,0, + 1] respectivamente,
¿cuál es la complejidad de aproximar el valor de tales un juego aditivamente dentro de ?
En particular, no puedo encontrar ningún algoritmo para hacerlo.
El resto de esta publicación se dedica por completo a dar una descripción más completa
del problema, por lo que si ya puede entender qué significa la pregunta en la parte superior
de esta publicación, entonces no hay razón para que lea el resto de esta publicación.
Dada una máquina árbitro con estados , con un estado inicial designado s 0 , un estado s a cuyo par de puntaje es [ - 1 , + 1 ] , un estado s b cuyo par de puntaje es [ + 1 , - 1 ] y estados de la forma
donde:
- es una función de { 1 , 2 , 3 , . . . , Num_of_choices } → { 1 , 2 , 3 , . . . , S }
Cuando la máquina está en un estado de esa forma:
- envía a Player_1 y envía p2_info a Player_2,
- envía al jugador indicado, espera a que un elemento de { 1 , 2 , 3 , . . . , num_of_choices } como entrada de ese jugador,
- luego pasa al estado indicado por
Cuando la máquina entra en uno de los otros dos estados o s b ,
- se detiene con el par de puntaje de ese estado como salida
Hay un juego natural de dos jugadores: la máquina de árbitro se inicia en el estado ,
los jugadores proporcionan las entradas que la máquina de árbitro espera, si la máquina de árbitro se
detiene, entonces el Jugador 1 obtiene el primer valor del par de salida de la máquina y el jugador 2
puntúa el segundo valor del par de salida de la máquina; de lo contrario, ambos jugadores puntúan 0.
¿Cuál es la complejidad del siguiente problema?
Dada tal máquina de árbitro y un número entero positivo N, genera un número racional
que está (aditivamente) dentro de 1 / N del valor del juego natural para el Jugador 1.
Como se mencionó anteriormente en esta pregunta, no puedo encontrar
ningún algoritmo para hacerlo.
fuente
Respuestas:
NOTA: mi supuesto algoritmo era incorrecto; Lo borré.
Para una cota inferior de la complejidad, la cuestión de la aproximación del valor de un simple juego estocástico se no sabe que estar en P . Usando el truco de aleatorización que di anteriormente, es fácil escribir un juego estocástico simple como un juego arbitrado con una tabla de búsqueda de tamaño polinómico.
fuente
Entrada: un juego como se describe en mi preguntaϵ
ϵ
debe generar SÍ si: el valor del juego para el Jugador 1 es mayor que 1-
permanece RE- duro incluso cuando
player_to_move siempre es 1 (es decir, solo se necesita 1 jugador)
y
s 0 ≠ s a y s a no está en Range (next_state_table)
(es decir, es literalmente imposible que el jugador pierda)
y
p1_info y p2_info y number_of_choices son independientes del estado
(es decir, el único comentario del jugador es si acaba de ganar o no)
.
fuente