Estoy trabajando en una red de convolución para el reconocimiento de imágenes, y me preguntaba si podría ingresar imágenes de diferentes tamaños (aunque no muy diferentes).
En este proyecto: https://github.com/harvardnlp/im2markup
Ellos dicen:
and group images of similar sizes to facilitate batching
Entonces, incluso después del preprocesamiento, las imágenes siguen siendo de diferentes tamaños, lo que tiene sentido ya que no recortarán parte de la fórmula.
¿Hay algún problema al usar diferentes tamaños? Si es así, ¿cómo debería abordar este problema (dado que las fórmulas no encajan todas en el mismo tamaño de imagen)?
Cualquier aportación será muy apreciada
fuente