Detección de objetos versus reconocimiento de objetos

8

Tengo una ligera confusión que diferencia entre el reconocimiento de objetos y la detección de objetos. Algunas personas dicen que la detección de objetos es un subtema del reconocimiento de objetos. ¿Alguien puede aclarar la diferencia entre estos dos temas?

Según entiendo:

El reconocimiento de objetos responde a la pregunta "¿Cuál es el objeto en la imagen" Mientras que la detección de objetos responde a la pregunta "¿Dónde está ese objeto"?

Espero que alguien pueda ilustrar la diferencia al proporcionar generosamente un ejemplo para cada uno.

usuario2867655
fuente
Esta respuesta puede ayudar: stackoverflow.com/a/34691321/1546088
acgtyrant

Respuestas:

11

Como que respondiste tu propia pregunta.

Reconocimiento de objetos: ¿ qué objeto se representa en la imagen?

  • entrada : una imagen que contiene objetos desconocidos

    Posiblemente, la posición del objeto se puede marcar en la entrada, o la entrada puede ser solo una imagen clara del objeto (no ocluido).

  • salida : posición (es) y etiqueta (s) (nombres) de los objetos en la imagen

    Las posiciones de los objetos se adquieren desde la entrada o se determinan en función de la imagen de entrada.

    Al etiquetar objetos, generalmente hay un conjunto de categorías / etiquetas que el sistema "conoce" y entre las cuales el sistema puede diferenciar (por ejemplo, el objeto es perro, carro, caballo, vaca o pájaro).

Detección de objetos: ¿ dónde está este objeto en la imagen?

  • entrada: una imagen clara de un objeto, o algún tipo de modelo de un objeto (por ejemplo, pato) y una imagen (posiblemente) que contiene el objeto de interés

  • salida: posición, o un cuadro delimitador del objeto de entrada si existe en la imagen (por ejemplo, el pato está en la esquina superior izquierda de la imagen)

penelope
fuente
0

Detección de objetos basada en el punto de interés de cualquier imagen dada; Por ejemplo, el pájaro en la imagen y el reconocimiento habló sobre la información específica sobre el pájaro, como el nombre, el tipo y otras características de un punto de interés particular.

usuario35925
fuente
¿Puede por favor ampliar un poco esta respuesta ya que no está exactamente claro cómo aborda la pregunta? Al menos esa es mi percepción.
A_A
Reconocimiento de objetos: en cualquier imagen debe detectar todos los objetos (una clase restringida de objetos depende de su conjunto de datos), Localizarlos con un cuadro delimitador y etiquetar ese cuadro delimitador con una etiqueta. Reconocimiento de objetos. Detección de objetos: es como el reconocimiento de objetos, pero en esta tarea solo tiene dos clases de clasificación de objetos, lo que significa cuadros delimitadores de objetos y cuadros delimitadores sin objetos. Por ejemplo, Detección de automóviles: debe detectar todos los automóviles en una imagen determinada con sus cuadros delimitadores
usuario35925
El reconocimiento de objetos responde a la pregunta "¿Cuál es el objeto en la imagen?" Mientras que la detección de objetos responde a la pregunta "¿Dónde está ese objeto?". Problema de recuperación de imagen, es decir, el problema de buscar imágenes digitales en grandes bases de datos.
user35925
Gracias pero no estaba preguntando por mí personalmente. La respuesta apareció en mi lista de revisión y pensé que valdría la pena ampliarla un poco más de lo que podría haber dejado como comentario. Una publicación de respuesta suele ser un poco más elaborada. Todo lo mejor.
A_A
0

tarde, pero aquí está la respuesta. fuente: https://www.learnopencv.com/selective-search-for-object-detection-cpp-python/

Un algoritmo de reconocimiento de objetos identifica qué objetos están presentes en una imagen. Toma la imagen completa como entrada y genera etiquetas de clase y probabilidades de clase de los objetos presentes en esa imagen. Por ejemplo, una etiqueta de clase podría ser "perro" y la probabilidad de clase asociada podría ser del 97%.

Por otro lado, un algoritmo de detección de objetos no solo le dice qué objetos están presentes en la imagen, sino que también genera cuadros delimitadores (x, y, ancho, alto) para indicar la ubicación de los objetos dentro de la imagen

Asif Mohammed
fuente