¿Es la prueba de Turing, o cualquiera de sus variantes, una prueba confiable de inteligencia artificial?

35

La prueba de Turing fue la primera prueba de inteligencia artificial y ahora está un poco desactualizada. La prueba Total Turing pretende ser una prueba más moderna que requiere un sistema mucho más sofisticado. ¿Qué técnicas podemos usar para identificar una inteligencia artificial (IA débil) y una inteligencia general artificial (IA fuerte)?

Rob Murray
fuente
66
Definitivamente requiere un enfoque estadístico con varios participantes. Conocí a algunos humanos que no pasarían la prueba de Turing.
SF.
1
Depende de cómo se defina la inteligencia.
baranskistad

Respuestas:

16

El punto retórico de la Prueba de Turing es que coloca la 'prueba' de 'humanidad' en resultados observables , en lugar de en componentes internos . Si desea comportarse de la misma en la interacción con una IA como lo haría con una persona, ¿cómo puede usted saber la diferencia entre ellos?

Pero eso no significa que sea confiable, porque la inteligencia tiene muchos componentes diferentes y hay muchos tipos de tareas intelectuales. La prueba de Turing, en algunos aspectos, se trata de la reacción de las personas al comportamiento, que no es del todo confiable: recuerde que muchas personas pensaron que ELIZA , un chatbot muy simple, era un excelente oyente y se involucró profundamente emocionalmente muy rápidamente. Hace recordar el Ikea comercial acerca de tirar una lámpara , en el que el vínculo emocional viene desde el observador humano (y la música), más que de la lámpara.

Las pruebas de Turing para actividades económicas específicas son mucho más interesantes en la práctica: si se puede escribir una IA que reemplace a un controlador Uber, por ejemplo, lo que eso implicará es mucho más claro que si alguien puede crear un chatbot conversacional.

Matthew Graves
fuente
10

El problema de la prueba de Turing es que prueba la capacidad de las máquinas para parecerse a los humanos. No necesariamente todas las formas de IA tienen que parecerse a los humanos. Esto hace que la prueba de Turing sea menos confiable. Sin embargo, sigue siendo útil ya que es una prueba real. También es digno de mención que hay un premio por pasar o acercarse más a pasar la Prueba de Turing, el Premio Loebner .

La definición de inteligencia de un agente inteligente establece que un agente es inteligente si actúa para maximizar el valor esperado de una medida de desempeño basada en la experiencia y el conocimiento pasados. (parafraseado de Wikipedia ). Esta definición se usa con más frecuencia y no depende de la capacidad de parecerse a los humanos. Sin embargo, es más difícil probar esto.

Wythagoras
fuente
7

La prueba clásica de Turing ciertamente tiene limitaciones. Debido a que todavía no lo veo mencionado aquí, te sugiero que leas sobre The Chinese Room , que es una de las razones más comúnmente citadas por las cuales la Prueba de Turing no llega a determinar la verdadera 'conciencia'. Sin embargo, también notaría que el mismo Turing, en el documento original que propuso la Prueba de Turing , se reconoció explícitamente que la prueba no era una prueba para detectar la conciencia :

Propongo considerar la pregunta "¿Pueden pensar las máquinas?" Esto debería comenzar con definiciones del significado de los términos "máquina" y "pensar". Las definiciones pueden enmarcarse para reflejar en la medida de lo posible el uso normal de las palabras, pero esta actitud es peligrosa, si el significado de las palabras "máquina" y "pensar" se encuentra examinando cómo se usan comúnmente. Es difícil escapar a la conclusión de que el significado y la respuesta a la pregunta "¿Pueden pensar las máquinas?" debe buscarse en una encuesta estadística como una encuesta de Gallup. Pero esto es absurdo. En lugar de intentar tal definición, reemplazaré la pregunta por otra, que esté estrechamente relacionada con ella y se exprese en palabras relativamente inequívocas.

La nueva forma del problema puede describirse en términos de un juego que llamamos "juego de imitación".

Este juego de imitación es la prueba que ahora conocemos hoy (y también la inspiración para el nombre de una película reciente protagonizada por Benedict Cumberbatch y Keira Knightley).

eric.mitchell
fuente
1
Gran respuesta. También comparto la opinión de que el cambio de "Juego de imitación" a "Prueba de Turing" ha llevado a algunos conceptos erróneos sobre las ramificaciones. (Los pornobots pasan la prueba de Turing todo el tiempo;)
DukeZhou
5

Hay muchas definiciones de Inteligencia Artificial en la naturaleza. Todas estas definiciones son parte de una (o más) de las áreas. Hay cuatro dominios principales, y la imagen a continuación arrojará algo de luz sobre esto.

ingrese la descripción de la imagen aquí



La prueba de Turing gira en torno al lado izquierdo de la cardinalidad, que se ocupa principalmente de cómo piensan o actúan los humanos. Pero, sabemos que esto no es todo. Turing Test no tiene mucho que ofrecer cuando se trata de lo que AI es en un sentido general.
La prueba de Turing, como dice Wikipedia, fue creada para probar máquinas que exhiben un comportamiento equivalente o indistinguible del de un humano. La inteligencia artificial es mucho más de lo que los humanos pueden hacer o cómo actúan. Hay muchos actos humanos que se consideran poco inteligentes y, a veces, también inhumanos.
El argumento de la sala china se centra en algo muy importante cuando se trata de "Conciencia v / s Simulación de conciencia". John Searle argumentó allí que es posible que una máquina (o humano) siga una gran cantidad de reglas predefinidas (algoritmo), para completar la tarea, sin pensar o poseer la mente. Las IA débiles son buenas para simular la capacidad de comprender, pero realmente no entienden lo que están haciendo. No exhiben "autoconciencia" y no forman representación sobre sí mismos. "Quiero esos v / s, sé que quiero eso" son dos cosas diferentes.

Como afirma Theory of Mind, una buena IA no solo debe formar una representación sobre el mundo en el que está trabajando, sino también sobre otros agentes y entidades en el mundo. Estos dos conceptos de autoconciencia y teoría de la mente trazan una delgada línea entre la IA débil y la fuerte.

Cuando se trata de la Prueba de Turing, falla por muchos motivos y también lo hace la Prueba de Turing total, que agrega otra capa a la prueba. La mayoría de los investigadores creen que la prueba de Turing es solo una distracción del objetivo principal, algo que les impide realizar un trabajo fructífero. Considere esto, suponga que pregunta un problema aritmético difícil para distinguir entre humano y máquina. Si la máquina quiere fingir que es humana, entonces mentirá. Esto no es lo que queremos. Ir a la prueba de Turing establece el límite superior de la IA que se puede crear. También hacer que la IA actúe y se comporte como humanos no es una muy buena idea. Los humanos no son muy buenos para tomar decisiones correctas todo el tiempo. Esta es la razón por la que leemos sobre guerras en nuestros libros de historia. Las decisiones que tomamos a menudo son parciales, tienen orígenes egoístas, etc.

No creo que haya una prueba para probar una IA. Esto se debe a que la IA tiene muchas definiciones, muchos tipos. Se puede etiquetar si una IA es débil o fuerte mientras se buscan respuestas a preguntas como "Quiero esas v / s, sé que quiero eso", "Quién soy y qué estoy haciendo exactamente (desde la perspectiva de la máquina)", más algunas otras preguntas que mencioné anteriormente.

Ugnes
fuente
3

Depende de cómo se realice la prueba. Por ejemplo, cuando las personas afirmaron que una máquina había superado con éxito la prueba de Turing hace unos años, el criterio era bastante débil. Solo tuvo que engañar al 30% de las personas durante 5 minutos. Eso no es una gran prueba. Para poner esto en perspectiva, es probable que no detecte esquizofrenia, autismo, problemas de aprendizaje o demencia con este criterio.

A pesar de la exageración, las IA actuales se pueden detectar el 100% del tiempo usando preguntas bastante simples.

cientifico
fuente
Buen punto. "Dado un número suficiente de preguntas ..." (Por supuesto, en la prueba Voight-Kampff parece bastante efectivo con un número limitado de preguntas;)
DukeZhou
2

¿Es la prueba de Turing, o cualquiera de sus variantes, una prueba confiable de inteligencia artificial?

Miopía

Sí, si uno define el término Inteligencia Artificial en términos del Juego de Imitación de Alan Turing o una de sus variantes. El enfoque puede ser, al mismo tiempo, válido y muy limitado como definición de inteligencia, ya que las personas interpretaron la palabra antes de que surgiera la IA.

Inteligencia comprobada

En consecuencia, hay una gran cantidad de enfoques alternativos para medir la inteligencia, artificial o de otro tipo.

  • Convertirse en un gran maestro de ajedrez
  • Autor de un programa de ajedrez ganador
  • Recibiendo un premio internacional altamente selectivo
  • Creando una estrategia que gane una guerra o una paz
  • Superar las miles de rondas de eliminación en los negocios o la política para convertirse en presidente
  • Autor de artículos brillantes, artículos, guiones, conferencias, discursos, libros o poemas que generan cambios significativos en el paradigma humano.
  • Mostrar resultados de nivel de genio en una prueba de Mensa
  • Convertirse en una de las personas más ricas del mundo

Medición normal de inteligencia normal

Pero estas son mediciones de inteligencia excepcional de algún tipo, principalmente porque los líderes en estas áreas han aplicado inteligencia confiable sobre múltiples dominios de tal manera que condujo a un éxito notable a través de múltiples escenarios de la vida real. La fiabilidad es un atributo de la persona que posee la inteligencia, no la prueba de la inteligencia en sí.

Estas son medidas de inteligencia más mundanas, pero quizás más válidas y confiables.

  • Criar niños sanos y amorosos como verificables a través de entrevistas cuidadosas a amigos y asociados de los miembros de la familia.
  • Remedio repetido y exitoso de muchas condiciones de diversos tipos que una vez se identificaron como rotas de alguna manera tangible y medible y se descubrió que se corrigieron de manera medible como resultado de la aplicación de la comprensión de inteligencia, el análisis y la acción correctiva.
  • La inteligencia conversacional se puede medir a través de los participantes en la conversación atribuyendo su propio éxito a las ideas y ejemplos establecidos por el conversador

¿Cuáles son los objetivos finales verdaderamente deseados?

Quizás la característica principal de la prueba de Turing es que es artificial. Si la inteligencia artificial es lo que queremos del software de IA, entonces eso es lo que recibiremos. Sin embargo, es probable que queramos algo considerablemente más o considerablemente menos.

Queremos más, ya que sería bueno que algunas computadoras pudieran ser nuestro amigo, nuestro mentor y un empleado no remunerado con habilidades excepcionales que conduzcan a nuestro éxito personal en términos de ingresos, influencia, popularidad o legado.

Queremos menos en el sentido de que queremos que algunas computadoras realicen tareas específicas del dominio y permanezcan como herramientas totalmente subordinadas, tal vez con algo de personalidad y calidez, como un barco u otro dispositivo complejo al que le damos nombres humanos, pero sin la imprevisibilidad de las capacidades de largo alcance. de la inteligencia humana.

Douglas Daseeco
fuente