¿AlphaZero es un ejemplo de AGI?

11

Del trabajo de investigación de DeepMind en arxiv.org:

En este artículo, aplicamos un algoritmo similar pero totalmente genérico, que llamamos AlphaZero , a los juegos de ajedrez y shogi, así como a Go, sin ningún conocimiento de dominio adicional, excepto las reglas del juego, lo que demuestra que un aprendizaje de refuerzo de propósito general Algoritmo puede lograr, tabula rasa, rendimiento sobrehumano en muchos dominios desafiantes.

¿Significa esto que AlphaZero es un ejemplo de AGI (Inteligencia Artificial General)?

game-ai definitions agi alphago Thomas
fuente

11

¡Buena pregunta!

AlphaZero, aunque es un hito importante, definitivamente no es un AGI :)

AlphaGo, aunque es fuerte en el juego de Go, es estrechamente fuerte ("IA fuerte-estrecha"), definida como la fuerza en un solo problema o tipo de problema (como Go y otros juegos de información perfectos y no casuales).

El AGI, como mínimo, debe ser tan fuerte como los humanos en todos los problemas trabajados o resueltos por los humanos.

El AGI a menudo se asocia con la superinteligencia , definida como inteligencia que supera los niveles humanos.

AGI no implica necesariamente superinteligencia, en el sentido de que consideraríamos un androide que puede realizar todas las actividades humanas con la misma capacidad que los humanos como una Inteligencia Artificial General .

Pero técnicamente, AlphaGo es una superinteligencia estrecha, ya que supera todo el rendimiento humano en un solo problema.

DukeZhou
fuente

No hay superinteligencias estrechas. Lo llamamos IA débil :). Ningún humano puede encontrar compilaciones semi-óptimas de Microsoft Word o Excel en su vida, mientras que las máquinas modernas pueden hacerlo en algunas horas.

Quonux

@Quonux Depende de la definición, sospecho. La definición de superinteligencia de Bostrom es más o menos análoga a la Inteligencia General Artificial, pero el término en sí, etimológicamente hablando, solo significa "inteligencia superior", literalmente "por encima de + inteligencia". Según esta definición básica, "IA fuerte-estrecha" podría ser sinónimo de "superinteligencia estrecha", ya que la definición original de "fuerte" era AGI, por lo que después de AlphaGo, los académicos comenzaron a usar el calificador "estrecho".

DukeZhou

@Quonux parte de mi punto aquí es que, con el advenimiento de AlphaGo, el término "débil" para IA que excede la capacidad humana en una sola tarea parece haber sido suplantado por "IA estrecha y fuerte".

DukeZhou

2

Suposiciones que pueden ser incorrectas

Hay dos supuestos identificables en el tono del artículo.

Todos los desafíos mentales pueden reducirse a un juego con reglas fijas.
Las máquinas mejores que los humanos son lo que los humanos realmente quieren o necesitan.

Hay otros dos identificables en la pregunta.

La inteligencia general existe en humanos ¹
Si existe en humanos, entonces es factible en computadoras.

Los cuatro pueden ser ciertos, pero ninguno de los cuatro es seguro.

Productividad de AlphaZero

Si nuestro tablero de ajedrez está en el estante del juego en nuestro armario, nuestro césped es largo y nuestro cortacésped está roto, AlphaZero, si está conectado a un robot humanoide, no tendría reglas de juego codificadas para la secuencia de tareas.

Escuchando la solicitud de su propietario,
Aprender a dominar a los títeres del robot,
Localizando e identificando todas nuestras herramientas y repuestos,
Arreglando el cortacésped, y
Dejándonos saber que el cortacésped está listo para usar.

Por lo tanto, no tiene ningún valor particular para el consumidor en ese escenario. No muy general.

Incluso si pudiera cortar el césped con un cortacésped que ya funcionara, sería valioso, ya que no requiere la capacidad de ganar nada, sino la capacidad de obedecer y exhibir la inteligencia subhumana requerida para no atropellar el macizo de flores.

Es notable que la gente inteligente de DeepMind eligiera usar la tabula rasa latina en lugar de la pizarra en blanco , pero no es tan impresionante como construir un programa de aprendizaje que pueda aprender a jugar bien tres juegos con solo las reglas codificadas y el juego real como entrada.

Para considerar estos programas de juegos realmente útiles en un espacio de productos, no se puede confiar en un interés sostenido en comprar software que siempre venza al comprador. Para que los productos de IA sean viables, las características de aprendizaje deben ser capaces de lo que se denomina coloquialmente sentido común, que requiere un conocimiento de dominio mucho más amplio y flexible que las reglas fijas de un juego. Podemos suponer que la mayoría de los investigadores que han logrado hitos en el aprendizaje del juego ganador están avanzando en esa dirección. Ellos también saben que su producción de investigación eventualmente debe ser productiva o conducir a una oferta SaaS comprable.

Lo que sería impresionante para los que están fuera del campo es si estos avances se pueden redirigir, en el espacio del centro de datos, para generar terapias genéticas correctivas para curar el cáncer o el herpes o revertir la diabetes o el Alzheimer. Entonces podríamos perdonar a los investigadores por no proporcionarnos una descarga que podría dominar a los títeres de un robot para limpiar nuestro baño. No queda claro en el documento que AlphaZero haya demostrado adecuadamente que exhibe: "Rendimiento sobrehumano en muchos dominios desafiantes".

Lo que han hecho sigue siendo impresionante y en la línea en que otros también han progresado. Pocos de nosotros nos atreveríamos a tratar de inventar un juego que estos programas genéricos de aprendizaje no aprendan rápido y nos derroten en unas pocas instancias del juego.

Avances vistos en perspectiva

Ciertamente, al realizar operaciones aritméticas, ordenar correo y ahora jugar, los inventos de la humanidad extienden las habilidades del humano desnudo, ausente de sus herramientas. Ese progreso coloca a los sistemas informáticos firmemente dentro del ámbito de una herramienta. Una azada trasera también es sobrehumana. Intenta colocar un kilómetro de tubería sin una.

Por el contrario, la humanidad desempeña el papel de proveedor de atención médica para las computadoras. Si se enferman o fallan, nos vemos obligados a expulsar sus virus y gusanos o reemplazar sus partes fallidas. De lo contrario, nuestros hogares y negocios caerán en desorden.

La tecnología, como en todas las cosas, debe verse en perspectiva.

Sería prudente para los humanos estar menos cautivados con los juegos y superarse unos a otros y más centrados en el comportamiento social colaborativo dirigido a resolver problemas sociales y económicos con sus herramientas recién inventadas y hacerlo de una manera que no cree nuevos problemas o invitaciones. Nuevas atrocidades.

Notas al pie

Que lo que se ha descrito como inteligencia general existe en humanos es discutible sobre la base de evidencia de lo contrario. Muchos citarían estas estrategias y tendencias como evidencia de límites para los humanos inteligentes.

La disuasión nuclear como estrategia de paz
Una completa falta de moderación en el consumo de recursos energéticos naturales finitos y críticos.
Aumento continuo de la densidad de patrones de adicción a nivel mundial
Causando la sexta extinción masiva en la tierra

Douglas Daseeco
fuente

Gracias por la edición, es mejor de esta manera (al menos para mí), con un mayor enfoque en las partes técnicas de la respuesta. Quizás haya una pregunta diferente acerca de cuán perfectamente racional o de alto rendimiento debe ser un AGI. Del mismo modo, a qué estándares de comportamiento individual o grupal queremos sujetar a los humanos, aunque eso no sería para este sitio a menos que la pregunta fuera específicamente sobre comparaciones con inteligencias artificiales.

Neil Slater el

¿AlphaZero es un ejemplo de AGI?

Respuestas: