Un Y-combinator es un concepto informático desde el lado "funcional" de las cosas. La mayoría de los programadores no saben mucho acerca de los combinadores, incluso si han oído hablar de ellos.
- ¿Qué es un combinador en Y?
- ¿Cómo funcionan los combinadores?
- ¿Para qué son buenos?
- ¿Son útiles en lenguajes de procedimiento?
functional-programming
computer-science
theory
definition
combinators
Chris Ammerman
fuente
fuente
Respuestas:
Si estás listo para una lectura larga, Mike Vanier tiene una gran explicación . En pocas palabras, le permite implementar la recursividad en un lenguaje que no necesariamente lo admite de forma nativa.
fuente
Un combinador en Y es un "funcional" (una función que opera en otras funciones) que permite la recursividad, cuando no puede referirse a la función desde sí mismo. En la teoría de la informática, generaliza la recursión , abstrae su implementación y, por lo tanto, la separa del trabajo real de la función en cuestión. El beneficio de no necesitar un nombre en tiempo de compilación para la función recursiva es una especie de bonificación. =)
Esto es aplicable en idiomas que admiten funciones lambda . La naturaleza basada en expresiones de lambdas generalmente significa que no pueden referirse a sí mismas por su nombre. Y trabajar alrededor de esto al declarar la variable, al referirse a ella, luego asignarle la lambda, para completar el ciclo de autorreferencia, es frágil. La variable lambda se puede copiar y la variable original se puede reasignar, lo que rompe la autorreferencia.
Los combinadores Y son engorrosos de implementar, y a menudo de usar, en lenguajes de tipo estático (que a menudo son los lenguajes de procedimiento ), porque generalmente las restricciones de tipeo requieren la cantidad de argumentos para que la función en cuestión se conozca en tiempo de compilación. Esto significa que se debe escribir un combinador y para cualquier recuento de argumentos que uno necesite usar.
A continuación se muestra un ejemplo de cómo el uso y el funcionamiento de un Y-Combinator, en C #.
Usar un Y-combinador implica una forma "inusual" de construir una función recursiva. Primero debe escribir su función como un fragmento de código que llama a una función preexistente, en lugar de a sí misma:
Luego lo convierte en una función que toma una función para llamar y devuelve una función que lo hace. Esto se llama funcional, porque toma una función y realiza una operación con ella que da como resultado otra función.
Ahora tiene una función que toma una función y devuelve otra función que parece un factorial, pero en lugar de llamarse a sí misma, llama al argumento pasado a la función externa. ¿Cómo haces que esto sea factorial? Pase la función interna a sí mismo. El Y-Combinator hace eso, al ser una función con un nombre permanente, que puede introducir la recursividad.
En lugar de que el factorial se llame a sí mismo, lo que sucede es que el factorial llama al generador factorial (devuelto por la llamada recursiva a Y-Combinator). Y dependiendo del valor actual de t, la función devuelta por el generador llamará al generador nuevamente, con t - 1, o simplemente devolverá 1, terminando la recursión.
Es complicado y críptico, pero todo se agita en tiempo de ejecución, y la clave de su funcionamiento es la "ejecución diferida" y la ruptura de la recursión para abarcar dos funciones. La F interna se pasa como un argumento , que se llamará en la próxima iteración, solo si es necesario .
fuente
fix :: (a -> a) -> a
y,a
a su vez, puede ser función de tantos argumentos como desee. Esto significa que la escritura estática no hace que esto sea engorroso.He levantado esto de http://www.mail-archive.com/[email protected]/msg02716.html, que es una explicación que escribí hace varios años.
Usaré JavaScript en este ejemplo, pero muchos otros idiomas también funcionarán.
Nuestro objetivo es poder escribir una función recursiva de 1 variable usando solo funciones de 1 variables y sin asignaciones, definiendo cosas por nombre, etc. (Por qué este es nuestro objetivo es otra pregunta, tomemos esto como el desafío que tenemos son dados.) Parece imposible, ¿eh? Como ejemplo, implementemos factorial.
Bueno, el primer paso es decir que podríamos hacer esto fácilmente si engañamos un poco. Usando funciones de 2 variables y asignaciones, al menos podemos evitar tener que usar asignaciones para configurar la recursividad.
Ahora veamos si podemos hacer menos trampa. Bueno, en primer lugar estamos usando la asignación, pero no necesitamos hacerlo. Podemos escribir X e Y en línea.
Pero estamos usando funciones de 2 variables para obtener una función de 1 variable. ¿Podemos arreglar eso? Bueno, un tipo inteligente llamado Haskell Curry tiene un buen truco, si tienes buenas funciones de orden superior, solo necesitas funciones de 1 variable. La prueba es que puede pasar de funciones de 2 (o más en el caso general) a 1 variable con una transformación de texto puramente mecánica como esta:
donde ... permanece exactamente igual. (Este truco se llama "curry" por su inventor. El idioma Haskell también se llama así por Haskell Curry. Archívelo bajo trivia inútil). Ahora simplemente aplique esta transformación en todas partes y obtengamos nuestra versión final.
Siéntase libre de probarlo. alertar () ese retorno, atarlo a un botón, lo que sea. Ese código calcula factoriales, recursivamente, sin usar asignación, declaraciones o funciones de 2 variables. (Pero tratar de rastrear cómo funciona es probable que haga que su cabeza gire. Y al entregarlo, sin la derivación, simplemente reformateado ligeramente dará como resultado un código que seguramente confundirá y confundirá).
Puede reemplazar las 4 líneas que definen recursivamente factorial con cualquier otra función recursiva que desee.
fuente
function (n) { return builder(builder)(n);}
lugar debuilder(builder)
?Me pregunto si es útil intentar construir esto desde cero. Veamos. Aquí hay una función factorial recursiva básica:
Refactoricemos y creemos una nueva función llamada
fact
que devuelva una función anónima de cálculo factorial en lugar de realizar el cálculo en sí:Eso es un poco raro, pero no tiene nada de malo. Solo estamos generando una nueva función factorial en cada paso.
La recursividad en esta etapa todavía es bastante explícita. La
fact
función debe ser consciente de su propio nombre. Vamos a parametrizar la llamada recursiva:Eso es genial, pero
recurser
aún necesita saber su propio nombre. Vamos a parametrizar eso también:Ahora, en lugar de llamar
recurser(recurser)
directamente, creemos una función de contenedor que devuelva su resultado:Ahora podemos deshacernos del
recurser
nombre por completo; es solo un argumento para la función interna de Y, que puede reemplazarse con la función en sí:El único nombre externo al que todavía se hace referencia es
fact
, pero ahora debería estar claro que también se puede parametrizar fácilmente, creando la solución completa y genérica:fuente
recurser
. No es la menor idea de lo que está haciendo o por qué.recurser
función es el primer paso hacia este objetivo, porque nos da una versión recursiva de lafact
que nunca se hace referencia por su nombre.function Y(recurse) { return recurse(recurse); } let factorial = Y(creator => value => { return value == 0 ? 1 : value * creator(creator)(value - 1); });
. Y así es como lo digiero (no estoy seguro si es correcto): al no hacer referencia explícita a la función (no permitida como combinador ), podemos usar dos funciones parcialmente aplicadas / currificadas (una función creadora y la función de cálculo), con ¿Qué podemos crear funciones lambda / anónimas que logren recursivo sin necesidad de un nombre para la función de cálculo?La mayoría de las respuestas anteriores describen lo que el Y-Combinator es , pero no lo es para .
Los combinadores de punto fijo se utilizan para mostrar que el cálculo lambda se está completando . Este es un resultado muy importante en la teoría de la computación y proporciona una base teórica para la programación funcional .
Estudiar los combinadores de punto fijo también me ha ayudado a comprender realmente la programación funcional. Sin embargo, nunca he encontrado ningún uso para ellos en la programación real.
fuente
y-combinator en JavaScript :
Editar : aprendo mucho mirando el código, pero este es un poco difícil de tragar sin algunos antecedentes, lo siento. Con algunos conocimientos generales presentados por otras respuestas, puede comenzar a separar lo que está sucediendo.
La función Y es el "combinador y". Ahora eche un vistazo a la
var factorial
línea donde se usa Y. Observe que le pasa una función que tiene un parámetro (en este ejemplorecurse
) que también se usa más adelante en la función interna. El nombre del parámetro se convierte básicamente en el nombre de la función interna que le permite realizar una llamada recursiva (ya que utilizarecurse()
en su definición). El combinador y realiza la magia de asociar la función interna anónima con el nombre del parámetro de la función pasada a Y.Para la explicación completa de cómo Y hace la magia, revisó el artículo vinculado (no por mí, por cierto).
fuente
arguments.callee
no está permitido en modo estricto: developer.mozilla.org/en/JavaScript/…(function fact(n){ return n <= 1? 1 : n * fact(n-1); })(5)
Para los programadores que no se han encontrado con la programación funcional en profundidad, y no les importa comenzar ahora, pero son un poco curiosos:
El combinador Y es una fórmula que le permite implementar la recursividad en una situación en la que las funciones no pueden tener nombres pero pueden pasarse como argumentos, usarse como valores de retorno y definirse dentro de otras funciones.
Funciona pasándose la función a sí misma como argumento, para que pueda llamarse a sí misma.
Es parte del cálculo lambda, que en realidad es matemática pero es efectivamente un lenguaje de programación, y es bastante fundamental para la informática y especialmente para la programación funcional.
El valor práctico diario del combinador Y es limitado, ya que los lenguajes de programación tienden a permitirle nombrar funciones.
En caso de que necesite identificarlo en una alineación policial, se ve así:
Por lo general, puede detectarlo debido a la repetición
(λx.f (x x))
.Los
λ
símbolos son la letra griega lambda, que le da su nombre al cálculo lambda, y hay muchos(λx.t)
términos de estilo porque así es como se ve el cálculo lambda.fuente
U x = x x
,Y = U . (. U)
(abusando de la notación similar a Haskell). OIA, con combinadores adecuados,Y = BU(CBU)
. Por lo tanto,Yf = U (f . U) = (f . U) (f . U) = f (U (f . U)) = f ((f . U) (f . U))
.Recursión anónima
Un combinador de punto fijo es una función de orden superior
fix
que, por definición, satisface la equivalencia.fix f
representa una soluciónx
a la ecuación de punto fijoEl factorial de un número natural puede ser probado por
Utilizando
fix
, las pruebas constructivas arbitrarias sobre funciones generales / μ-recursivas se pueden derivar sin autorreferencialidad anónima.dónde
tal que
Esta prueba formal de que
utiliza metódicamente la equivalencia del combinador de punto fijo para reescrituras
Cálculo lambda
El formalismo de cálculo lambda sin tipo consiste en una gramática libre de contexto
donde
v
rangos sobre variables, junto con las reglas de reducción beta y etaLa reducción beta sustituye todas las ocurrencias libres de la variable
x
en el cuerpo de abstracción ("función")B
por la expresión ("argumento")E
. La reducción de Eta elimina la abstracción redundante. A veces se omite del formalismo. Una expresión irreducible , a la que no se aplica ninguna regla de reducción, está en forma normal o canónica .es taquigrafía para
(abstracción multiarity),
es taquigrafía para
(aplicación izquierda-asociatividad),
y
son alfa-equivalente .
La abstracción y la aplicación son las dos únicas "primitivas del lenguaje" del cálculo lambda, pero permiten la codificación de datos y operaciones arbitrariamente complejas.
Los números de la Iglesia son una codificación de los números naturales similares a los naturales Peano-axiomáticos.
Una prueba formal de que
usando la regla de reescritura de reducción beta:
Combinadores
En el cálculo lambda, los combinadores son abstracciones que no contienen variables libres. Más simple:
I
el combinador de identidadisomorfo a la función de identidad
Dichos combinadores son los operadores primitivos de los cálculos del combinador, como el sistema SKI.
La reducción beta no se normaliza fuertemente ; no todas las expresiones reducibles, "redexes", convergen a la forma normal bajo reducción beta. Un ejemplo simple es la aplicación divergente del
ω
combinador omegaa sí mismo:
Se prioriza la reducción de subexpresiones más a la izquierda ("cabezas"). El orden de aplicación normaliza los argumentos antes de la sustitución, el orden normal no. Las dos estrategias son análogas a la evaluación entusiasta, por ejemplo, C, y la evaluación perezosa, por ejemplo, Haskell.
diverge bajo la ansiosa reducción beta de orden aplicativo
ya que en semántica estricta
pero converge bajo una lenta reducción beta de orden normal
Si una expresión tiene una forma normal, la reducción beta de orden normal la encontrará.
Y
La propiedad esencial del
Y
combinador de punto fijo.es dado por
La equivalencia
es isomorfo a
El cálculo lambda sin tipo puede codificar pruebas constructivas arbitrarias sobre funciones generales / μ-recursivas.
(Multiplicación retrasada, confluencia)
Para el cálculo lambda sin tipo Churchian, se ha demostrado que existe una infinidad recursivamente enumerable de combinadores de punto fijo además
Y
.La reducción beta de orden normal hace que el cálculo lambda sin tipo no extendido sea un sistema de reescritura completo de Turing.
En Haskell, el combinador de punto fijo se puede implementar con elegancia
La pereza de Haskell se normaliza a una finidad antes de que se hayan evaluado todas las subexpresiones.
fuente
λ x . x
, ¿cómo estás hoy?Otras respuestas proporcionan una respuesta bastante concisa a esto, sin un hecho importante: no es necesario implementar un combinador de punto fijo en ningún lenguaje práctico de esta manera enrevesada y hacerlo no tiene ningún propósito práctico (excepto "mira, sé qué combinador en Y es"). Es un concepto teórico importante, pero de poco valor práctico.
fuente
Aquí hay una implementación de JavaScript del Y-Combinator y la función Factorial (del artículo de Douglas Crockford, disponible en: http://javascript.crockford.com/little.html ).
fuente
Un Y-Combinator es otro nombre para un condensador de flujo.
fuente
He escrito una especie de "guía de idiotas" para el Y-Combinator tanto en Clojure como en Scheme para ayudarme a comprenderlo. Están influenciados por el material en "The Little Schemer"
En el esquema: https://gist.github.com/z5h/238891
o Clojure: https://gist.github.com/z5h/5102747
Ambos tutoriales son códigos intercalados con comentarios y deben ser cortados y pegados en su editor favorito.
fuente
Como novato en los combinadores, el artículo de Mike Vanier (gracias Nicholas Mancuso) me pareció realmente útil. Me gustaría escribir un resumen, además de documentar mi comprensión, si pudiera ser de ayuda para otros, estaría muy contento.
De asqueroso a menos asqueroso
Usando factorial como ejemplo, usamos la siguiente
almost-factorial
función para calcular el factorial de númerox
:En el pseudocódigo anterior,
almost-factorial
toma la funciónf
y el númerox
(almost-factorial
está en curry, por lo que puede verse como tomar una funciónf
y devolver una función de 1 aridad).Cuando
almost-factorial
calcula factorial parax
, delega el cálculo de factorial parax - 1
funcionarf
y acumula ese resultado conx
(en este caso, multiplica el resultado de (x - 1) con x).Puede verse como
almost-factorial
tomas en una versión mala de la función factorial (que solo puede calcular hasta el númerox - 1
) y devuelve una versión menos mala de factorial (que calcula hasta el númerox
). Como en esta forma:Si repetidamente pasamos la versión menos mala de factorial a
almost-factorial
, eventualmente obtendremos nuestra función factorial deseadaf
. Donde se puede considerar como:Punto fijo
El hecho de que eso
almost-factorial f = f
significaf
es el punto fijo de la funciónalmost-factorial
.Esta fue una forma realmente interesante de ver las relaciones de las funciones anteriores y fue un momento aha para mí. (Lea la publicación de Mike sobre el punto fijo si no lo ha hecho)
Tres funciones
Para generalizar, tenemos un no-recursivo función
fn
(como nuestro casi-factorial), que tiene su punto fijo funciónfr
(como nuestro f), entonces lo queY
hace es cuando dasY
fn
,Y
devuelve la función de corrección del punto defn
.Entonces, en resumen (simplificado suponiendo que
fr
solo toma un parámetro;x
degenera ax - 1
,x - 2
... en recursión):fn
:def fn fr x = ...accumulate x with result from (fr (- x 1))
esta es la función casi útil , aunque no podemos usarlafn
directamentex
, será útil muy pronto. Este no recursivofn
utiliza una funciónfr
para calcular su resultado.fn fr = fr
,fr
Es el punto fijo defn
,fr
es la utilidad Funciton, podemos usarfr
enx
conseguir nuestro resultadoY fn = fr
,Y
Devuelve el punto fijo de una función,Y
dirige nuestra casi-útil funciónfn
en la utilidadfr
Derivado
Y
(no incluido)Me saltearé la derivación
Y
e iré a entenderY
. La publicación de Mike Vainer tiene muchos detalles.La forma de
Y
Y
se define como (en formato de cálculo lambda ):Si reemplazamos la variable
s
a la izquierda de las funciones, obtenemosDe hecho, el resultado de
(Y f)
es el punto fijo def
.¿Por qué
(Y f)
funciona?Dependiendo de la firma de
f
,(Y f)
puede ser una función de cualquier aridad, para simplificar, supongamos que(Y f)
solo toma un parámetro, como nuestra función factorial.desde entonces
fn fr = fr
, continuamosel cálculo recursivo termina cuando el más interno
(fn fr 1)
es el caso base yfn
no se usafr
en el cálculo.Mirando de
Y
nuevo:Entonces
Para mí, las partes mágicas de esta configuración son:
fn
efr
interdependen unos de otros:fr
'envuelve'fn
dentro, cada vez quefr
se usa para calcularx
, 'genera' ('levanta')fn
y delega el cálculo en esofn
(pasando en sí mismofr
yx
); por otro lado,fn
dependefr
y se usafr
para calcular el resultado de un problema menorx-1
.fr
se usa para definirfn
(cuando sefn
usafr
en sus operaciones), lo realfr
aún no está definido.fn
que define la lógica comercial real. Sobre la base defn
,Y
creafr
- una función auxiliar en una forma específica - para facilitar el cálculo parafn
en un recursivo manera.Me ayudó a entender de
Y
esta manera en este momento, espero que ayude.Por cierto, también encontré el libro Una introducción a la programación funcional a través del cálculo Lambda muy bueno, solo estoy en parte y el hecho de que no podía entender
Y
el libro me llevó a esta publicación.fuente
Aquí hay respuestas a las preguntas originales , compiladas del artículo (que vale la pena leer) mencionado en la respuesta de Nicholas Mancuso , así como otras respuestas:
Un Y-combinador es un "funcional" (o una función de orden superior, una función que opera en otras funciones) que toma un solo argumento, que es una función que no es recursiva, y devuelve una versión de la función que es recursivo
Algo recursivo =), pero una definición más profunda:
Un combinador: es solo una expresión lambda sin variables libres.
Variable libre: es una variable que no es una variable enlazada.
Variable enlazada: variable contenida dentro del cuerpo de una expresión lambda que tiene ese nombre de variable como uno de sus argumentos.
Otra forma de pensar en esto es que el combinador es una expresión lambda, en la que puede reemplazar el nombre de un combinador con su definición en todos los lugares donde se encuentre y hacer que todo funcione (entrará en un bucle infinito si combinador contiene referencia a sí mismo, dentro del cuerpo lambda).
Y-combinator es un combinador de punto fijo.
El punto fijo de una función es un elemento del dominio de la función que se asigna a sí mismo por la función.
Es decir,
c
es un punto fijo de la funciónf(x)
sif(c) = c
esto significa
f(f(...f(c)...)) = fn(c) = c
Los siguientes ejemplos suponen una tipificación fuerte + dinámica :
Combinador Y perezoso (orden normal):
esta definición se aplica a los lenguajes con evaluación perezosa (también: diferida, llamada por necesidad): estrategia de evaluación que retrasa la evaluación de una expresión hasta que se necesite su valor.
Lo que esto significa es que, para una función dada
f
(que es una función no recursiva), la función recursiva correspondiente se puede obtener primero computandoλx.f(x x)
y luego aplicando esta expresión lambda a sí misma.Combinador Y estricto (orden aplicativo):
esta definición se aplica a los lenguajes con una evaluación estricta (también: ansiosa, codiciosa): estrategia de evaluación en la que una expresión se evalúa tan pronto como está vinculada a una variable.
Es igual que el perezoso en su naturaleza, solo tiene
λ
envoltorios adicionales para retrasar la evaluación del cuerpo del lambda. He hecho otra pregunta , algo relacionada con este tema.Robadoprestado de la respuesta de Chris Ammerman : el combinador en Y generaliza la recursión, abstrae su implementación y, por lo tanto, la separa del trabajo real de la función en cuestión.A pesar de que Y-combinator tiene algunas aplicaciones prácticas, es principalmente un concepto teórico, cuya comprensión ampliará su visión general y, probablemente, aumentará sus habilidades analíticas y de desarrollo.
Como dijo Mike Vanier : es posible definir un combinador Y en muchos lenguajes estáticamente tipados, pero (al menos en los ejemplos que he visto) tales definiciones generalmente requieren algún tipo de piratería no obvia, porque el combinador Y en sí mismo no Tiene un tipo estático directo. Eso está más allá del alcance de este artículo, por lo que no lo mencionaré más
Y como lo mencionó Chris Ammerman : la mayoría de los lenguajes de procedimiento tienen tipeo estático.
Entonces responda a esta, no realmente.
fuente
El combinador y implementa la recursión anónima. Entonces en lugar de
tu puedes hacer
por supuesto, el combinador y solo funciona en lenguajes de llamada por nombre. Si desea utilizar esto en cualquier lenguaje normal de llamada por valor, necesitará el combinador z relacionado (el combinador y divergerá / bucle infinito).
fuente
Un combinador de punto fijo (u operador de punto fijo) es una función de orden superior que calcula un punto fijo de otras funciones. Esta operación es relevante en la teoría del lenguaje de programación porque permite la implementación de la recursión en forma de una regla de reescritura, sin el soporte explícito del motor de tiempo de ejecución del lenguaje. (src Wikipedia)
fuente
El operador this puede simplificar su vida:
Entonces evitas la función extra:
Finalmente llamas
fac(5)
.fuente
Creo que la mejor manera de responder esto es elegir un idioma, como JavaScript:
Ahora vuelva a escribirlo para que no use el nombre de la función dentro de la función, pero aún así lo llame de forma recursiva.
El único lugar donde
factorial
debe verse el nombre de la función es en el sitio de la llamada.Sugerencia: no puede usar nombres de funciones, pero puede usar nombres de parámetros.
Trabaja el problema. No lo busques. Una vez que lo resuelva, comprenderá qué problema resuelve el combinador y.
fuente