Del trabajo de investigación de DeepMind en arxiv.org:
En este artículo, aplicamos un algoritmo similar pero totalmente genérico, que llamamos AlphaZero , a los juegos de ajedrez y shogi, así como a Go, sin ningún conocimiento de dominio adicional, excepto las reglas del juego, lo que demuestra que un aprendizaje de refuerzo de propósito general Algoritmo puede lograr, tabula rasa, rendimiento sobrehumano en muchos dominios desafiantes.
¿Significa esto que AlphaZero es un ejemplo de AGI (Inteligencia Artificial General)?
fuente
Suposiciones que pueden ser incorrectas
Hay dos supuestos identificables en el tono del artículo.
Hay otros dos identificables en la pregunta.
Los cuatro pueden ser ciertos, pero ninguno de los cuatro es seguro.
Productividad de AlphaZero
Si nuestro tablero de ajedrez está en el estante del juego en nuestro armario, nuestro césped es largo y nuestro cortacésped está roto, AlphaZero, si está conectado a un robot humanoide, no tendría reglas de juego codificadas para la secuencia de tareas.
Por lo tanto, no tiene ningún valor particular para el consumidor en ese escenario. No muy general.
Incluso si pudiera cortar el césped con un cortacésped que ya funcionara, sería valioso, ya que no requiere la capacidad de ganar nada, sino la capacidad de obedecer y exhibir la inteligencia subhumana requerida para no atropellar el macizo de flores.
Es notable que la gente inteligente de DeepMind eligiera usar la tabula rasa latina en lugar de la pizarra en blanco , pero no es tan impresionante como construir un programa de aprendizaje que pueda aprender a jugar bien tres juegos con solo las reglas codificadas y el juego real como entrada.
Para considerar estos programas de juegos realmente útiles en un espacio de productos, no se puede confiar en un interés sostenido en comprar software que siempre venza al comprador. Para que los productos de IA sean viables, las características de aprendizaje deben ser capaces de lo que se denomina coloquialmente sentido común, que requiere un conocimiento de dominio mucho más amplio y flexible que las reglas fijas de un juego. Podemos suponer que la mayoría de los investigadores que han logrado hitos en el aprendizaje del juego ganador están avanzando en esa dirección. Ellos también saben que su producción de investigación eventualmente debe ser productiva o conducir a una oferta SaaS comprable.
Lo que sería impresionante para los que están fuera del campo es si estos avances se pueden redirigir, en el espacio del centro de datos, para generar terapias genéticas correctivas para curar el cáncer o el herpes o revertir la diabetes o el Alzheimer. Entonces podríamos perdonar a los investigadores por no proporcionarnos una descarga que podría dominar a los títeres de un robot para limpiar nuestro baño. No queda claro en el documento que AlphaZero haya demostrado adecuadamente que exhibe: "Rendimiento sobrehumano en muchos dominios desafiantes".
Lo que han hecho sigue siendo impresionante y en la línea en que otros también han progresado. Pocos de nosotros nos atreveríamos a tratar de inventar un juego que estos programas genéricos de aprendizaje no aprendan rápido y nos derroten en unas pocas instancias del juego.
Avances vistos en perspectiva
Ciertamente, al realizar operaciones aritméticas, ordenar correo y ahora jugar, los inventos de la humanidad extienden las habilidades del humano desnudo, ausente de sus herramientas. Ese progreso coloca a los sistemas informáticos firmemente dentro del ámbito de una herramienta. Una azada trasera también es sobrehumana. Intenta colocar un kilómetro de tubería sin una.
Por el contrario, la humanidad desempeña el papel de proveedor de atención médica para las computadoras. Si se enferman o fallan, nos vemos obligados a expulsar sus virus y gusanos o reemplazar sus partes fallidas. De lo contrario, nuestros hogares y negocios caerán en desorden.
La tecnología, como en todas las cosas, debe verse en perspectiva.
Sería prudente para los humanos estar menos cautivados con los juegos y superarse unos a otros y más centrados en el comportamiento social colaborativo dirigido a resolver problemas sociales y económicos con sus herramientas recién inventadas y hacerlo de una manera que no cree nuevos problemas o invitaciones. Nuevas atrocidades.
Notas al pie
Que lo que se ha descrito como inteligencia general existe en humanos es discutible sobre la base de evidencia de lo contrario. Muchos citarían estas estrategias y tendencias como evidencia de límites para los humanos inteligentes.
fuente