Puntos fijos en computabilidad y lógica.

15

Esta pregunta también se ha publicado en Math.SE,

/math/1002540/fixed-points-in-computability-nd-logic

Espero que esté bien publicarlo aquí también. Si no es así, o si es demasiado básico para CS.SE, dígame y lo eliminaré.


Me gustaría entender mejor la relación entre los teoremas de punto fijo en la lógica y el cálculo de λ .

Antecedentes

1) El papel de los puntos fijos en la incompletitud e indefinibilidad de la verdad

Según tengo entendido, aparte de la idea fundamental de internalizar la lógica, la clave de las pruebas de la indefinibilidad de la verdad de Tarski y del teorema de incompletitud de Goedel es la siguiente teorema lógico de punto fijo , que vive en una metateoría constructiva y finitista (espero que la formulación está bien, corríjame si algo es incorrecto o incorrecto):

Existencia de puntos fijos en la lógica.

Supongamos que T es una teoría suficientemente expresiva y recursivamente enumerable sobre el lenguaje L , y que C sea ​​una codificación de las fórmulas L en T , es decir, un algoritmo que convierte las fórmulas arbitrarias bien formadas φ en fórmulas L con una variable libre C ( φ ) ( v ) , de modo que para cualquier fórmula L φ tenemos T! v : C ( φ ) ( v ) .LφLC(φ)(v)LφT!v:C(φ)(v)

Entonces existe un algoritmo Y convierte las fórmulas bien formadas Len una variable libre en fórmulas bien formadas Lcerradas, de modo que para cualquier fórmula L en una variable libre ϕ tenemos

TY(ϕ)v:C(Y(ϕ))(v)ϕ(v),
que, interpretando C como un símbolo de función definida , también podría escribirse de manera más compacta como
TY(ϕ)ϕ(Y(ϕ)).

En otras palabras, Y es un algoritmo para la construcción de puntos fijos con respecto a la equivalencia T de las fórmulas de una variable L.

Esto tiene al menos dos aplicaciones:

  • Al aplicarlo al predicado ϕ(v) expresa " v codifica una oración que, cuando se instancia con su propia codificación, no es demostrable". produce la formalización de "Esta oración no es demostrable", que se encuentra en el corazón del argumento de Goedel.

  • Aplicarlo a para una oración arbitraria ϕ produce la indefinibilidad de la verdad de Tarski.¬ϕϕ

2) Puntos fijos en λ sin tipoλ tipo

En el cálculo tipo, la construcción de puntos fijos es importante en la realización de funciones recursivas.λ

Existencia de puntos fijos en cálculo :λ

Hay un combinador de punto fijo , es decir, un -term Y tal que para cualquier λ -term f , tenemos f ( Y f ) ~ alpha ß Y f .λYλf

f(Yf)αβYf.

Observación

Lo que me deja atónito es que el combinador de punto fijo en λλf.(λx.f(xx))(λx.f(xx))λ cálculo refleja directamente, de una manera muy limpia y no técnica, la prueba habitual del teorema lógico de punto fijo:

En términos generales , dada una fórmula , uno considera la formalización φ ( v ) de la declaración " v codifica una oración que, cuando se instancia consigo misma, satisface ϕ ", y pone A ( ϕ ) : = φ ( φ ) . La oración φ ( v ) es como λ x . f ( x x ) y φ ( φ ) ( λφφ(v)vϕA(ϕ):=φ(φ)φ(v)λx.f(xx)φ(φ) corresponde a(λx.f(xx))(λx.f(xx)) .

Pregunta

A pesar de su idea rápidamente descrita, encontré que la prueba del teorema lógico de punto fijo es bastante técnica y difícil de llevar a cabo en todos los detalles; Kunen lo hace, por ejemplo, en el Teorema 14.2 de su libro 'Set Theory'. Por otro lado, el combinador en λYλ es muy simple y sus propiedades se verifican fácilmente.

¿El teorema lógico de punto fijo se sigue rigurosamente de los combinadores de punto fijo en λ cálculo ?

Por ejemplo, ¿se puede modelar el cálculo mediante fórmulas L hasta la equivalencia lógica, de modo que la interpretación de cualquier combinador de punto fijo proporcione un algoritmo como se describe en el teorema del punto fijo lógico?λL


Editar

En vista de las muchas otras instancias del mismo argumento de diagonalización descrito en las respuestas de Martin y Cody, uno debería reformular la pregunta:

¿Existe una generalización común de los argumentos de diagonalización siguiendo el principio expresado en el combinador ? λ f . ( λ x . f ( x x ) ) ( λ x . f ( x x ) )Y

λf.(λx.f(xx))(λx.f(xx))

Si lo entiendo correctamente, una propuesta es el Teorema del punto fijo de Lawvere , ver más abajo. Sin embargo, desafortunadamente no puedo seguir las especializaciones relevantes en ninguno de los artículos que Martin citó en su respuesta, y estaría feliz si alguien pudiera explicarlas. Primero, para completar:

Teorema del punto fijo de Lawvere

Sea una categoría con productos finitos y φ : A × A Y tal que para cualquier morfismo f : A Y en C haya alguna f : 1 A tal que para todos los puntos p : 1 A uno tenga 1 p A f Y = 1 p A f , ID ACφ:A×AYf:AYCf:1Ap:1A

1pA f Y  =  1pAf,idAA×AφY.

Luego, para cualquier endomorfismo , poniendo f : = A Δ A × A φ Y gg:YYcualquier elección defda lugar a un punto de fijog, a saber, 1f , f A×A varphi Y.

f := AΔA×AφYgY,
fg
1f,fA×AφY.

Esta es una afirmación en la teoría (intuitiva) de primer orden de categorías con productos finitos y, por lo tanto, se aplica a cualquier modelo de este último.

Por ejemplo , tomar todo el universo teórico de conjuntos como el dominio del discurso da la paradoja de Russel (tome el conjunto hipotético de conjuntos, Y : = Ω : = { 0 , 1 } y ρ : A × A Ω el -predicar) y el teorema de Cantor (tome A cualquier conjunto y ρ : A × A Ω correspondiente a la supuesta hipótesis A Ω AAY:=Ω:={0,1}ρ:A×AΩAρ:A×AΩAΩA) Además, la traducción de la prueba del Teorema de Lawvere da los argumentos diagonales habituales.

Problema más concreto:

¿Alguien puede explicar en detalle una aplicación del Teorema de Lawvere a funciones recursivas parciales o los teoremas lógicos de punto fijo? En particular, ¿qué categorías debemos considerar allí?

En D. Pavlovic, Sobre la estructura de paradojas , el autor considera la categoría generada libremente por con Fin ( N )NEnd(N) las funciones recursivas parciales.

Lamentablemente, no entiendo lo que esto significa.

Por ejemplo, ¿cuál debería ser la ley de composición en End(N) ? ¿Composición de funciones recursivas parciales? Después de todo, se dice que el teorema de Lawvere aplica con , de modo que, en particular, cualquier morfismo NN debe tener un punto fijo 1 N . Si los endomorfismos son funciones recursivas parciales y si la composición significa composición de funciones, esto parece extraño: si los puntos 1 N son solo elementos de N , entonces la afirmación es incorrecta, y si un morfismo 1 NA=Y=NNN1N1NN1N es también una función parcial, por lo tanto, puede ser indefinido, el teorema del punto fijo es trivial.

¿Cuál es la categoría que uno realmente quiere considerar?

Tal vez el objetivo es obtener el teorema del punto fijo de Roger, pero de alguna manera uno debería construir una codificación de funciones recursivas parciales por números naturales en la definición de la categoría, y no puedo entender cómo hacerlo.

Sería muy feliz si alguien pudiera explicar la construcción de un contexto al que se aplica el Teorema del punto fijo de Lawvere, dando lugar a un teorema lógico de punto fijo o un teorema de punto fijo para funciones recursivas parciales.

¡Gracias!

Hanno Becker
fuente
1
Bueno, la parte técnica del teorema de punto fijo de Gödel es demostrar que las funciones recursivas se pueden representar numéricamente en la teoría, y no hay forma de evitarla, ya que hay que usar en algún momento algo que distinga, digamos , de varias Teorías decidibles. Si lo desea, puede considerarlo como la implementación del cálculo λ en aritmética. Qλ
Emil Jeřábek apoya a Monica el
@ EmilJeřábek: ¡Gracias por tu comentario! Entiendo que no habrá forma de evitar una codificación de funciones recursivas, pero me gustaría separar claramente lo que concierne a la codificación y lo que es formal después.
Hanno Becker el
@ EmilJeřábek: Lo que me gustaría entender es si se puede hacer rigurosa la impresión de que la parte relativa a la codificación da lugar a algún tipo de modelo de cálculo través del cual el combinador Y puede interpretarse y da lugar a varios puntos fijos. teoremas λY
Hanno Becker
El teorema del punto fijo de Lawvere se puede aplicar de manera relativamente trivial a las funciones recursivas parciales, considerando que hay una enumeración (recursiva) de funciones recursivas parciales, es decir, una suposición computable N( NN ) en la categoría de funciones recursivas parciales. El teorema del punto fijo dice: "cada funcional recursivo (de tipo ( NN )φN(NN) ) tiene un punto fijo", que es exactamente elcombinador Y. (NN)(NN)Y
cody
Cody, ¿podrías explicar con precisión qué categoría estás usando, porque ese es el punto en el que no puedo seguir las otras fuentes?
Hanno Becker

Respuestas:

7

Probablemente no estoy respondiendo directamente a su pregunta, pero hay una generalización matemática común de mucha paradoja, incluidos los teoremas de Gödel y el combinador Y. Creo que esto fue explorado por primera vez por Lawvere. Ver también [2, 3].

  1. FW Lawvere, argumentos diagonales y categorías cerradas cartesianas .

  2. D. Pavlovic, Sobre la estructura de las paradojas .

  3. NS Yanofsky, Un enfoque universal para paradojas autorreferenciales, incompletitud y puntos fijos .

Martin Berger
fuente
¡Gracias, Martin, estas son referencias muy interesantes! Sin embargo, tengo problemas para extraer de la situación lógica un contexto categórico al que se aplica textualmente el teorema del punto fijo lógico de Lawvere. En el artículo de Yanofsky, por ejemplo, dudo que la operación de sustitución Lind1×Lind1Lind0 esté bien definida si se consideran términos hasta equivalencia lógica. ¿Entiendes esto?
Hanno Becker el
@HannoBecker Esto puede ser bastante difícil y sensible a la codificación.
Martin Berger
5

No tengo una respuesta completa a su pregunta, pero sí tengo esto:

Según Wikipedia dice

Para cada función recursiva parcial existe un índice p tal que φ pλ y . Q ( p , y )Q(x,y)p

φpλy.Q(p,y)
φN

λ

ϕTn

Tϕ(n¯)Ty,φn(y)=0

Esto no es exactamente lo que quieres, pero un truco de internalización puede darte una declaración más sólida

Tϕ(n¯)y,φn(y)=0

Ahora, nuevamente, este no es el teorema lógico de punto fijo, pero puede servir para el mismo propósito.

Prueba: Definir Q(x,y)

Q(x,y)=0 iff Tϕ(x¯) in at most y steps
Qy,Q(x,y)Tϕ(x¯)Ty,Q(x¯,y)ωQ

Con un poco de reflexión, probablemente pueda fortalecer este argumento para darle el teorema completo directamente sin la internalización.

cody
fuente
¡Gracias por su respuesta! Déjame ir lentamente para ver si te entiendo: En tu primera declaración, puede φ:NC(N,N)
C(N2,N)Map(N,C(N,N))Map(N,N)
C(N,N)norte2norte(norte,metro)φ(norte)(metro)
Yλ
φYY FF(Y F)pag: =Y Qλ cálculo sería tener un quoteyevalY
cody