¿Se pueden usar / entrenar algoritmos de aprendizaje automático (CNN?) Para diferenciar entre pequeñas diferencias en detalles entre imágenes?

8

Me preguntaba si los algoritmos de aprendizaje automático (CNN) se pueden usar / entrenar para diferenciar entre pequeñas diferencias en los detalles entre las imágenes (como ligeras diferencias en los tonos de rojo u otros colores, o la presencia de pequeños objetos entre imágenes muy similares). )? ¿Y luego clasificar las imágenes en función de estas diferencias? Si este es un esfuerzo difícil con nuestros algoritmos de aprendizaje automático actuales, ¿cómo se puede resolver? ¿Usaría más datos (más imágenes) ayudaría?

También agradecería si las personas pudieran proporcionar referencias a investigaciones que se hayan centrado en esto, si es posible.

Acabo de comenzar a aprender el aprendizaje automático, y esto es algo que me he estado preguntando de mi investigación.

Gracias.

El puntero
fuente

Respuestas:

4

Atento recurrentes comparadores (2017, Pranav Shyam, Shubham Gupta, Ambedkar Dukkipati) es un documento interesante que ayuda a responder la pregunta que se está preguntando, junto con una publicación de blog que ayuda a describirlo en términos más fáciles.

La forma en que se implementa es en realidad bastante intuitiva. Si alguna vez has jugado un juego de "lo que es diferente" con dos imágenes, generalmente lo que harías es mirar hacia atrás y adelante entre las imágenes para ver cuál es la diferencia. ¡La red que crearon los investigadores hace exactamente eso! Mira una imagen y luego recuerda características importantes sobre esas imágenes y mira la otra imagen y va y viene.

jugo
fuente
2

Existen redes construidas para aprender a diferenciar entre clases, incluso si se ven muy parecidas. Por lo general, se utiliza una pérdida de triplete en esas redes para conocer la diferencia entre el objetivo, una muestra positiva y una negativa.

Por ejemplo, esas redes se utilizan para realizar verificaciones de identidad con imágenes faciales, el algoritmo aprende las diferencias entre diferentes personas en lugar de reconocer a las personas.

Palabras clave: función discriminativa, pérdida de triplete, red siamesa, aprendizaje único.

Estos trabajos son interesantes:

Louis Lac
fuente