¿La capacidad de reconocimiento de patrones de las CNN está limitada al procesamiento de imágenes?

21

¿Se puede usar una red neuronal convolucional para el reconocimiento de patrones en un dominio problemático donde no hay imágenes preexistentes, por ejemplo, representando datos abstractos gráficamente? ¿Sería eso siempre menos eficiente?

Este desarrollador dice que el desarrollo actual podría ir más allá, pero no si hay un límite fuera del reconocimiento de imágenes.

dynrepsys
fuente
1
Veo al menos dos preguntas aquí. ¿Qué te parece la separación? Además, la pregunta tendría una calidad mucho mayor si pudiera ampliar lo que ha buscado con la pregunta del título.
Eric Platon el
@EricPlaton lo apretó un poco. Mi pregunta principal es sobre la naturaleza de la relación entre CNN e imágenes. ¿Cuál sería su sugerencia para la segunda pregunta?
dynrepsys
Gracias, la pregunta es buena para mí (aunque debería eliminar mi respuesta ahora ~). En cuanto a la segunda pregunta, ¿qué tal un enfoque de "cuál es la captura"? "¿Siempre es menos eficiente?" todavía está bien si alguien puede llegar a un contraejemplo.
Eric Platon
Mediante "¿Se puede usar una red neuronal convolucional para el reconocimiento de patrones en un dominio problemático donde no hay imágenes preexistentes, por ejemplo, representando datos abstractos gráficamente?" ¿Está preguntando si podemos representar algún dato como una imagen y aplicar una CNN? ¿Le gusta leer un conjunto de datos de 100 funciones y representarlo como una imagen de 10x10?
rcpinto

Respuestas:

10

Las redes convolucionales (CNN) dependen de la convolución matemática (por ejemplo, convoluciones 2D o 3D), que se usa comúnmente para el procesamiento de señales. Las imágenes son un tipo de señal, y la convolución se puede usar igualmente en sonido, vibraciones, etc. Entonces, en principio, las CNN pueden encontrar aplicaciones para cualquier señal, y probablemente más.

En la práctica, ya existe trabajo en PNL (como lo menciona Matthew Graves), donde algunas personas procesan texto con CNN en lugar de redes recursivas. Algunos otros trabajos se aplican al procesamiento de sonido (no hay referencia aquí, pero todavía tengo trabajos inéditos en curso)


Contenido original: en respuesta a la pregunta del título original, que ha cambiado ahora. Tal vez necesite eliminar este .

La investigación en redes adversas (y relacionadas) muestra que incluso las redes profundas pueden ser engañadas fácilmente , lo que les lleva a ver un perro (o cualquier objeto) en lo que parece ser un ruido aleatorio cuando un humano lo mira (el artículo tiene ejemplos claros).

Otro problema es el poder de generalización de una red neuronal. Las redes convolucionales han asombrado al mundo con su capacidad de generalizar mucho mejor que otras técnicas. Pero si la red solo recibe imágenes de gatos, solo reconocerá gatos (y probablemente verá gatos en todas partes, como por resultados adversos de la red). En otras palabras, incluso los CN tienen dificultades para generalizar demasiado más allá de lo que aprendieron.

El límite de reconocimiento es difícil de definir con precisión. Simplemente diría que la diversidad de los datos de aprendizaje supera el límite (supongo que más detalles deberían conducir a un lugar más apropiado para la discusión).

Eric Platon
fuente
5

La respuesta simple es "no, no se limitan a imágenes": las CNN también se utilizan para el procesamiento del lenguaje natural. (Ver aquí para una introducción).

Todavía no los he visto aplicados a datos gráficos, pero no los he mirado; Hay algunas cosas obvias que probar y por eso soy optimista de que funcionaría.

Matthew Graves
fuente
3

La red neuronal convolucional se puede aplicar no solo para el reconocimiento de imágenes, sino también para el análisis y reconocimiento de video, el procesamiento del lenguaje natural, en los juegos (por ejemplo, Go ) o incluso para el descubrimiento de fármacos al predecir la interacción entre moléculas y proteínas biológicas wiki .

Por lo tanto, puede usarse para diversos problemas mediante el uso de capas convolucionales y de submuestreo conectadas a capas más completamente conectadas. Son más fáciles de entrenar, porque tienen menos parámetros que las redes completamente conectadas con el mismo número de unidades ocultas. UFLDL

kenorb
fuente
3

Se puede usar una red neuronal convolucional donde los patrones estén localmente correlacionados y traducibles (como en shiftable). Este es el caso porque las CNN contienen filtros que buscan ciertos patrones locales en todas partes en la entrada. Encontrarás patrones locales y traducibles en imágenes, texto, series de tiempo, etc.

No tiene mucho sentido usar CNN si sus datos se parecen más a una bolsa de características con un orden irrelevante. En ese caso, es posible que tenga problemas para detectar patrones que contienen características que están más separadas en su vector de entrada. No encontrará patrones locales y traducibles en sus datos si puede reordenar los puntos de datos de los vectores de entrada sin perder información.

BlindKungFuMaster
fuente