¿Puede una única red neuronal manejar el reconocimiento de dos tipos de objetos, o debería dividirse en dos redes más pequeñas?

9

En particular, una computadora incrustada (con recursos limitados) analiza la transmisión de video en vivo desde una cámara de tráfico, tratando de elegir buenos cuadros que contengan los números de matrícula de los autos que pasan. Una vez que se localiza una placa, el marco se entrega a una biblioteca de OCR para extraer el registro y usarlo más.

En mi país, hay dos tipos de placas de uso común: rectangular (la típica) y cuadrada, en realidad, algo rectangular pero "más alta que más ancha", con el registro dividido en dos filas.

(hay algunos tipos más, pero no los tengamos en cuenta; son un pequeño porcentaje y generalmente pertenecen a vehículos que están fuera de nuestro interés).

Debido a los recursos limitados y la necesidad de un procesamiento rápido en tiempo real, el tamaño máximo de la red (número de celdas y conexiones) que el sistema puede manejar es fijo.

¿Sería mejor dividir esto en dos redes más pequeñas, cada una de las cuales reconoce un tipo de placas de registro, o la red única más grande manejará mejor los dos tipos?

SF.
fuente

Respuestas:

6

Bueno, no sé qué tipo de características le está dando a su red neuronal. Sin embargo, en general, iría con una sola red neuronal. Parece que no tiene limitaciones en los recursos para capacitar a su red y el único problema son los recursos mientras aplica su red.

La cuestión es que probablemente los dos problemas tienen cosas en común (por ejemplo, ambos tipos de placas son rectangulares). Esto significa que si usa dos redes, cada una tiene que resolver el mismo subproblema (la parte común) nuevamente. Si usa solo una red, la parte común del problema requiere menos celdas / pesos para resolver y los pesos / celdas restantes pueden emplearse para un mejor reconocimiento.

Al final, si estuviera en tu lugar, los probaría a ambos. Creo que esa es la única forma de estar realmente seguros de cuál es la mejor solución. Cuando hablamos teóricamente, es posible que no incluyamos algunos factores.

Didam I
fuente