¿Qué le pasó a Fuzzy Logic?

10

La lógica difusa parecía un área activa de investigación en aprendizaje automático y minería de datos cuando estaba en la escuela de posgrado (principios de la década de 2000). Los sistemas de inferencia difusos, los medios c difusos, las versiones difusas de las diversas redes neuronales y las arquitecturas de máquinas de vectores de soporte se enseñaban en cursos de posgrado y se discutían en conferencias.

Desde que comencé a prestar atención a ML de nuevo (~ 2013), Fuzzy Logic parece haber desaparecido por completo del mapa y su ausencia del panorama actual de ML es notable dada toda la exageración de la IA.

¿Fue este el caso de un tema que simplemente pasó de moda, o hubo una limitación específica de lógica difusa e inferencia difusa que llevó a que los investigadores abandonaran el tema?


Para aclarar, según el comentario de jbowman: ¿Hubo algún evento o hallazgo que causó que FL pasara de moda, similar por ejemplo a las redes neuronales en los años 60, cuando pasaron de moda porque se demostró que no podían resolver XOR ? ¿O Fuzzy Systems fue superado por un paradigma en competencia?

Skander H.
fuente
No es una respuesta, sino solo una especulación: ¿parece tan cercano a la probabilidad que quizás eventualmente los investigadores de CS decidieron fusionar los dos conceptos?
Cliff AB
1
Es cierto que esto va a estar fuertemente basado en la opinión y probablemente esté fuera de tema, pero ahora que lo has preguntado, tengo curiosidad.
jbowman
1
@jbowman No sé si necesariamente se basa en la opinión. Hay una respuesta científica objetiva de por qué NNets pasó de moda en los años 60 (falla al resolver XOR): me pregunto si algo similar le sucedió a FL.
Skander H.
1
Todavía está bastante vivo en la parcelación cerebral y el mapeo cerebral en general, es solo que la gente no necesita gran parte de la operación lógica, pero la asignación difusa todavía está viva y pateando.
Firebug
Relacionado: stats.stackexchange.com/questions/72117/…
Sycorax dice Reinstate Monica

Respuestas:

3

Mi respuesta es técnicamente más relevante para conjuntos difusos en lugar de lógica difusa, pero los dos conceptos son prácticamente inseparables. Profundicé en los artículos de la revista académica sobre lógica difusa hace un par de años para escribir una serie de tutoriales sobre la implementación de conjuntos difusos en SQL Server . Aunque difícilmente puedo ser considerado un experto, estoy bastante familiarizado con la literatura y uso las técnicas regularmente para resolver problemas prácticos. La fuerte impresión que obtuve de la investigación publicada es que el potencial práctico de los conjuntos difusos aún no se ha aprovechado, principalmente debido a una avalancha de investigaciones sobre docenas de otras familias de técnicas que pueden resolver conjuntos complementarios de preguntas.

El concurrido mercado de ideas en ciencia de datos / aprendizaje automático, etc.

Ha habido un progreso tan rápido en Support Vector Machines, redes neuronales, bosques aleatorios, etc., que es imposible para los especialistas, analistas, científicos de datos, programadores o consumidores de sus productos mantenerse al día con todo. En mi serie de publicaciones de blog, hablo extensamente sobre cómo el desarrollo de algoritmos para conjuntos difusos y lógicos generalmente está más de 20 años por delante del software disponible, pero lo mismo se puede decir de muchos campos relacionados; Leí intensamente sobre redes neuronales y puedo pensar en decenas de arquitecturas neuronales valiosas que se desarrollaron hace décadas pero que nunca se pusieron en práctica ampliamente, y mucho menos codificadas en software fácilmente disponible. Dicho esto, la lógica difusa y los conjuntos están en una extraña desventaja en este mercado abarrotado de ideas, principalmente debido a su apodo, que fue controvertido cuando Lofti A. Zadeh lo acuñó. El objetivo de las técnicas difusas es simplemente aproximar ciertas clases de datos discretamente valorados en escalas continuas, pero términos como "lógica aproximada de valores continuos" y "conjuntos calificados" no son exactamente llamativos. Zadeh admitió que usó el término "difuso" en parte porque llamaba la atención, pero mirando hacia atrás, puede haber obtenido sutilmente el tipo de atención equivocado.

Cómo el término "Fuzz" fracasa

Para un científico de datos, analista o programador, es un término que puede evocar una vibra de "tecnología genial"; a aquellos interesados ​​en AI / minería de datos / etc. etc. solo en la medida en que puede resolver problemas comerciales, "difuso" suena como una molestia poco práctica. Para un gerente corporativo, un médico involucrado en investigación médica o cualquier otro consumidor que no lo sepa, puede evocar imágenes de animales de peluche, espectáculos de policías de los 70 o algo del refrigerador de George Carlin. Siempre ha habido una tensión en la industria entre los dos grupos, y este último a menudo frena en el primero de escribir código y realizar investigaciones simplemente por curiosidad intelectual y no por lucro; a menos que el primer grupo pueda explicar por qué estas técnicas difusas son rentables, la cautela del primero evitará su adopción.

Gestión de la incertidumbre y la familia de aplicaciones de conjuntos difusos

El objetivo de las técnicas de conjuntos difusos es eliminarfuzz que ya es inherente a los datos, en forma de valores discretos imprecisos que se pueden modelar mejor en escalas continuas aproximadas, al contrario de la percepción errónea generalizada de que "fuzz" es algo que se agrega, como un relleno especial en una pizza. Esa distinción puede ser simple, pero abarca una amplia variedad de aplicaciones potenciales, que van desde el procesamiento del lenguaje natural hasta la teoría de decisiones y el control de sistemas no lineales. La probabilidad no ha absorbido la lógica difusa como lo sugirió Cliff AB principalmente porque es solo un pequeño subconjunto de las interpretaciones que se pueden unir a los valores difusos. Las funciones de membresía difusas son bastante simples, ya que solo clasifican cuánto pertenece un registro a un conjunto particular mediante la asignación de uno o más valores continuos, generalmente en una escala de 0 a 1 (aunque para algunas aplicaciones I ' Hemos encontrado que -1 a 1 puede ser más útil). El significado que asignamos a esos números depende de nosotros, porque pueden significar cualquier cosa que queramos, como grados de creencia bayesianos, confianza en una decisión particular, distribuciones de posibilidades, activaciones de redes neuronales, varianza escalada, correlación, etc., etc. no solo valores PDF, EDF o CDF. Entro mucho más en detalle en mi serie de blogs y enesta publicación de CV , gran parte de la cual se obtuvo trabajando a través de mi recurso difuso favorito, George J. Klir, y los conjuntos difusos y lógica difusa: teoría y aplicaciones de Bo Yuan (1995). Entran en mucho más detalle sobre cómo derivar programas completos de "Gestión de incertidumbres" de conjuntos difusos.

Si la lógica difusa y los conjuntos fueran un producto de consumo, podríamos decir que no se ha actualizado debido a la falta de comercialización y evangelización del producto, más una elección paradójica de una marca. Mientras investigaba esto, no recuerdo haber topado con un solo artículo de revista académica que intentara desacreditar cualquiera de estas aplicaciones de manera similar al infame artículo de Minksy y Papert sobre perceptrones. Actualmente, existe una gran competencia en el mercado de ideas por la atención de desarrolladores, teóricos, científicos de datos y similares para productos que son aplicables a conjuntos similares de problemas, lo cual es un efecto secundario positivo del rápido progreso técnico. La desventaja es que hay mucha fruta de bajo perfil aquí que no se selecciona, especialmente en el ámbito del modelado de datos donde son más aplicables.

SQLServerSteve
fuente
2

La razón por la cual las ideas de lógica difusa han pasado de moda (en ML) no me queda clara. Bien puede ser un poco de muchas razones, ya sean técnicas, sociológicas, etc. Una cosa es segura es que las matemáticas de ML en los últimos años han estado dominadas por la probabilidad / estadística y la optimización, dos campos en los que la lógica difusa (o las ideas emitidas por la literatura difusa) pueden completar, pero en las que generalmente aportan más respuestas que preguntas. Otra ventaja de las probabilidades y la optimización es que, aunque puede haber diferentes tendencias / interpretaciones dentro de ellas (p. Ej., Bayesianas frente a frecuentistas), el marco formal / matemático básico es bastante estable para ellos (en mi opinión, es menos claro para la lógica difusa entendido en un sentido amplio).

  • Hüllermeier, E. (2015). ¿El aprendizaje automático necesita una lógica difusa? Conjuntos y sistemas difusos, 281, 292-299.

Creo que una de las ideas básicas de la lógica difusa, que consiste en modelar conceptos que son graduales y proporcionar herramientas de razonamiento (principalmente la lógica de extensión, pero no solo) asociada con ella, todavía está presente en algunas ideas de LA, incluidas las muy recientes. Solo tienes que buscarlo con cuidado, ya que es bastante raro. Dos ejemplos incluyen:

  • Farnadi, G., Bach, SH, Moens, MF, Getoor, L. y De Cock, M. (2017). Cuantificación suave en el aprendizaje relacional estadístico. Machine Learning, 106 (12), 1971-1991. (donde las referencias incluyen las de lógica difusa, incluido el documento seminal de Zadeh)
  • Cheng, W., Rademaker, M., De Baets, B. y Hüllermeier, E. (2010, septiembre). Predicción de órdenes parciales: clasificación con abstención. En conferencia europea conjunta sobre aprendizaje automático y descubrimiento de conocimiento en bases de datos (pp. 215-230). Springer, Berlín, Heidelberg.

En general, para responder a su pregunta sobre una base más personal, mi sensación es que no hay una percepción clara de lo que podría lograr la lógica difusa (en puntos de vista recientes de ML) que las probabilidades no podrían, y dado que esta última es mucho más antigua y claramente encaja mejor con el marco de ML de ver los datos emitidos por una población probabilística, era más natural ir con probabilidad y estadística que con lógica difusa. Esto también significa que si desea utilizar la lógica difusa en ML, debe presentar una buena razón convincente para hacerlo (por ejemplo, utilizando el hecho de que extienden la lógica al proporcionar funciones diferenciables para que pueda incluir reglas lógicas en el aprendizaje profundo técnicas).

Seb Destercke
fuente