¿Es la prueba de Turing, o cualquiera de sus variantes, una prueba confiable de inteligencia artificial?

35

La prueba de Turing fue la primera prueba de inteligencia artificial y ahora está un poco desactualizada. La prueba Total Turing pretende ser una prueba más moderna que requiere un sistema mucho más sofisticado. ¿Qué técnicas podemos usar para identificar una inteligencia artificial (IA débil) y una inteligencia general artificial (IA fuerte)?

turing-test strong-ai intelligent-agent weak-ai Rob Murray
fuente

66

Definitivamente requiere un enfoque estadístico con varios participantes. Conocí a algunos humanos que no pasarían la prueba de Turing.

SF.

1

Depende de cómo se defina la inteligencia.

baranskistad

16

El punto retórico de la Prueba de Turing es que coloca la 'prueba' de 'humanidad' en resultados observables , en lugar de en componentes internos . Si desea comportarse de la misma en la interacción con una IA como lo haría con una persona, ¿cómo puede usted saber la diferencia entre ellos?

Pero eso no significa que sea confiable, porque la inteligencia tiene muchos componentes diferentes y hay muchos tipos de tareas intelectuales. La prueba de Turing, en algunos aspectos, se trata de la reacción de las personas al comportamiento, que no es del todo confiable: recuerde que muchas personas pensaron que ELIZA , un chatbot muy simple, era un excelente oyente y se involucró profundamente emocionalmente muy rápidamente. Hace recordar el Ikea comercial acerca de tirar una lámpara , en el que el vínculo emocional viene desde el observador humano (y la música), más que de la lámpara.

Las pruebas de Turing para actividades económicas específicas son mucho más interesantes en la práctica: si se puede escribir una IA que reemplace a un controlador Uber, por ejemplo, lo que eso implicará es mucho más claro que si alguien puede crear un chatbot conversacional.

Matthew Graves
fuente

10

El problema de la prueba de Turing es que prueba la capacidad de las máquinas para parecerse a los humanos. No necesariamente todas las formas de IA tienen que parecerse a los humanos. Esto hace que la prueba de Turing sea menos confiable. Sin embargo, sigue siendo útil ya que es una prueba real. También es digno de mención que hay un premio por pasar o acercarse más a pasar la Prueba de Turing, el Premio Loebner .

La definición de inteligencia de un agente inteligente establece que un agente es inteligente si actúa para maximizar el valor esperado de una medida de desempeño basada en la experiencia y el conocimiento pasados. (parafraseado de Wikipedia ). Esta definición se usa con más frecuencia y no depende de la capacidad de parecerse a los humanos. Sin embargo, es más difícil probar esto.

Wythagoras
fuente

7

La prueba clásica de Turing ciertamente tiene limitaciones. Debido a que todavía no lo veo mencionado aquí, te sugiero que leas sobre The Chinese Room , que es una de las razones más comúnmente citadas por las cuales la Prueba de Turing no llega a determinar la verdadera 'conciencia'. Sin embargo, también notaría que el mismo Turing, en el documento original que propuso la Prueba de Turing , se reconoció explícitamente que la prueba no era una prueba para detectar la conciencia :

Propongo considerar la pregunta "¿Pueden pensar las máquinas?" Esto debería comenzar con definiciones del significado de los términos "máquina" y "pensar". Las definiciones pueden enmarcarse para reflejar en la medida de lo posible el uso normal de las palabras, pero esta actitud es peligrosa, si el significado de las palabras "máquina" y "pensar" se encuentra examinando cómo se usan comúnmente. Es difícil escapar a la conclusión de que el significado y la respuesta a la pregunta "¿Pueden pensar las máquinas?" debe buscarse en una encuesta estadística como una encuesta de Gallup. Pero esto es absurdo. En lugar de intentar tal definición, reemplazaré la pregunta por otra, que esté estrechamente relacionada con ella y se exprese en palabras relativamente inequívocas.

La nueva forma del problema puede describirse en términos de un juego que llamamos "juego de imitación".

Este juego de imitación es la prueba que ahora conocemos hoy (y también la inspiración para el nombre de una película reciente protagonizada por Benedict Cumberbatch y Keira Knightley).

eric.mitchell
fuente

1

Gran respuesta. También comparto la opinión de que el cambio de "Juego de imitación" a "Prueba de Turing" ha llevado a algunos conceptos erróneos sobre las ramificaciones. (Los pornobots pasan la prueba de Turing todo el tiempo;)

DukeZhou

5

Hay muchas definiciones de Inteligencia Artificial en la naturaleza. Todas estas definiciones son parte de una (o más) de las áreas. Hay cuatro dominios principales, y la imagen a continuación arrojará algo de luz sobre esto.

La prueba de Turing gira en torno al lado izquierdo de la cardinalidad, que se ocupa principalmente de cómo piensan o actúan los humanos. Pero, sabemos que esto no es todo. Turing Test no tiene mucho que ofrecer cuando se trata de lo que AI es en un sentido general.
La prueba de Turing, como dice Wikipedia, fue creada para probar máquinas que exhiben un comportamiento equivalente o indistinguible del de un humano. La inteligencia artificial es mucho más de lo que los humanos pueden hacer o cómo actúan. Hay muchos actos humanos que se consideran poco inteligentes y, a veces, también inhumanos.
El argumento de la sala china se centra en algo muy importante cuando se trata de "Conciencia v / s Simulación de conciencia". John Searle argumentó allí que es posible que una máquina (o humano) siga una gran cantidad de reglas predefinidas (algoritmo), para completar la tarea, sin pensar o poseer la mente. Las IA débiles son buenas para simular la capacidad de comprender, pero realmente no entienden lo que están haciendo. No exhiben "autoconciencia" y no forman representación sobre sí mismos. "Quiero esos v / s, sé que quiero eso" son dos cosas diferentes.

Como afirma Theory of Mind, una buena IA no solo debe formar una representación sobre el mundo en el que está trabajando, sino también sobre otros agentes y entidades en el mundo. Estos dos conceptos de autoconciencia y teoría de la mente trazan una delgada línea entre la IA débil y la fuerte.

Cuando se trata de la Prueba de Turing, falla por muchos motivos y también lo hace la Prueba de Turing total, que agrega otra capa a la prueba. La mayoría de los investigadores creen que la prueba de Turing es solo una distracción del objetivo principal, algo que les impide realizar un trabajo fructífero. Considere esto, suponga que pregunta un problema aritmético difícil para distinguir entre humano y máquina. Si la máquina quiere fingir que es humana, entonces mentirá. Esto no es lo que queremos. Ir a la prueba de Turing establece el límite superior de la IA que se puede crear. También hacer que la IA actúe y se comporte como humanos no es una muy buena idea. Los humanos no son muy buenos para tomar decisiones correctas todo el tiempo. Esta es la razón por la que leemos sobre guerras en nuestros libros de historia. Las decisiones que tomamos a menudo son parciales, tienen orígenes egoístas, etc.

No creo que haya una prueba para probar una IA. Esto se debe a que la IA tiene muchas definiciones, muchos tipos. Se puede etiquetar si una IA es débil o fuerte mientras se buscan respuestas a preguntas como "Quiero esas v / s, sé que quiero eso", "Quién soy y qué estoy haciendo exactamente (desde la perspectiva de la máquina)", más algunas otras preguntas que mencioné anteriormente.

Ugnes
fuente

3

Depende de cómo se realice la prueba. Por ejemplo, cuando las personas afirmaron que una máquina había superado con éxito la prueba de Turing hace unos años, el criterio era bastante débil. Solo tuvo que engañar al 30% de las personas durante 5 minutos. Eso no es una gran prueba. Para poner esto en perspectiva, es probable que no detecte esquizofrenia, autismo, problemas de aprendizaje o demencia con este criterio.

A pesar de la exageración, las IA actuales se pueden detectar el 100% del tiempo usando preguntas bastante simples.

cientifico
fuente

Buen punto. "Dado un número suficiente de preguntas ..." (Por supuesto, en la prueba Voight-Kampff parece bastante efectivo con un número limitado de preguntas;)