Medición del tamaño del objeto utilizando la red neuronal profunda

10

Tengo un gran conjunto de datos de vehículos con la verdad real de sus longitudes (más de 100k muestras). ¿Es posible entrenar una red profunda para medir / estimar la longitud del vehículo? No he visto ningún documento relacionado con la estimación del tamaño del objeto utilizando una red neuronal profunda.

Naji
fuente
1
Muy buena pregunta ¡Bienvenido a AI!
DukeZhou
(Nota para el moderador): esta es una respuesta de marcador de posición para hacer una pregunta a OP ya que no puedo comentar ¿Sus datos configuran imágenes o texto? hisairnessag3 está en el camino correcto al portar los píxeles / enfoque métrico de OpenCV a un DNN de detección de objetos
Adnan S

Respuestas:

4

¡Si! Esto sin duda se puede hacer. Dado que tiene un conjunto de datos etiquetado, ¡eso lo hace aún más simple!

Echaría un vistazo a este proyecto y eso debería llevarte a donde necesitas ir.

Los detalles de implementación deberían ser bastante sencillos. Avísame si puedo ayudarte más.

hisairnessag3
fuente
1
No es necesario explicar por qué alguien rechaza la votación. Muchos programadores no tienen tiempo suficiente para mirar los comentarios, miran los votos para ver si la respuesta vale la pena o no. Si vuelve a leer la pregunta, encontrará que la pregunta es específicamente sobre el uso de DNN y nada más. el proyecto que compartió es sobre el uso de Opencv ... si lee los comentarios debajo de la publicación que compartió, encontrará que la gente pregunta sobre DNN, pero la publicación en sí no usa DNN. Por cierto, no soy la persona que rechazó su respuesta
BH85
2
No es necesario pero es útil. Si busca a cualquier profundidad, no encontrará proyectos ni documentos sobre este caso de uso particular para DNN. Dicho esto, hice referencia al proyecto más cercano posible con la esperanza de iniciar OP. Además, respondí la pregunta. La pregunta era si esto se podía hacer.
hisairnessag3
¡Gracias por tu respuesta! Creo que mejoraría con una pequeña explicación de cómo / por qué es posible. Al menos un bosquejo de la arquitectura sería muy útil.
Ben N
1

Sí, es posible, pero primero tendrá que reconocer algún objeto en la imagen, ya sea 1) el vehículo en sí, y luego informar el tamaño conocido de ese vehículo, o 2) un objeto conocido que está a la misma distancia de la cámara que el automóvil ( un bordillo, una señal de alto, la cabeza del conductor, un pony shetland ... lo que sea), y luego use ese objeto para calibrar el tamaño del automóvil que está muy cerca de él.

Cualquier automóvil en una imagen estará a una distancia desconocida de la cámara, haciendo que el objeto del automóvil parezca más grande o más pequeño de una foto a otra. Si no reconoce el automóvil o al menos un objeto de referencia que tiene un tamaño conocido, el tamaño físico del automóvil no estará calibrado; no tendrá base para su estimación de tamaño.

Si se desconoce el automóvil, incluso si tiene pistas visuales (hay un objeto de referencia presente o se conoce la distancia de la cámara al automóvil), la extensión desconocida del gran angular del lente de la cámara puede distorsionar la forma de un automóvil desconocido (altura vs ancho), lo que complica aún más su capacidad de estimar sus dimensiones aparentes.

Cachondo
fuente
¿Puede la matrícula del vehículo ser ese objeto conocido utilizado para calibrar el tamaño del automóvil? Las placas de matrícula son típicamente del mismo tamaño.
Naji
1
Tendría que tener cuidado con las suposiciones que hace que las placas son del mismo tamaño. Por ejemplo, una placa australiana y una placa estadounidense son de diferentes tamaños. Si esto no es un problema para su aplicación (solo se ejecutará en un país), puede asumir un tamaño de referencia para la placa. Sin embargo, aún debe tener cuidado, ya que la placa puede no estar orientada normalmente hacia usted. Si el automóvil está a 45 grados, el ancho de la placa ocupará menos píxeles que a 0, incluso a la misma distancia.
pshlady
1

Creo que este documento puede ayudarlo: Estimación de cuadro de delimitación en 3D usando aprendizaje profundo y geometría

Usó 1 VGG-19 (pre-entrenado en ImageNet) para aprender el tamaño de los autos

cryax dsa
fuente
Al igual que usted, supuse que se trata de inferir un cuadro delimitador 3D donde los datos se representan en una imagen 2D. El proyecto mencionado por hisairnessag3 parece abordar solo el cuadro delimitador 2D sin un comportamiento inferencial aprendido sobre la naturaleza 3D que la imagen podría contener.
Jim
Este documento estima el tamaño y la orientación del automóvil utilizando una imagen recortada en 2D (solo contiene el objeto deseado).
cryax dsa