¿Cómo calcular el mAP (precisión media promedio) para la tarea de detección de las tablas de clasificación de Pascal VOC? http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 Dicho esto, en la página 11 :
La visión por computadora es un subcampo de la informática que se ocupa del análisis y la comprensión de imágenes. Esto incluye la detección de objetos como rostros en imágenes o segmentar imágenes.
¿Cómo calcular el mAP (precisión media promedio) para la tarea de detección de las tablas de clasificación de Pascal VOC? http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 Dicho esto, en la página 11 :
El documento Profundizando en convoluciones describe GoogleNet que contiene los módulos de inicio originales: El cambio al inicio v2 fue que reemplazaron las convoluciones 5x5 por dos convoluciones sucesivas 3x3 y la agrupación aplicada: ¿Cuál es la diferencia entre Inception v2 e Inception...
Para la detección, una forma común de determinar si la propuesta de un objeto era correcta es Intersección sobre Unión (IoU, IU). Esto toma el conjunto de píxeles de objetos propuestos y el conjunto de píxeles verdaderos de objetos B y calcula:UNUNAsisiB yoo U( A , B ) = A ∩ BA ∪...
Si echamos un vistazo al 90-99% de los artículos publicados usando una CNN (ConvNet). La gran mayoría de ellos usa el tamaño de filtro de números impares : {1, 3, 5, 7} para los más utilizados. Esta situación puede generar algún problema: con estos tamaños de filtro, generalmente la operación de...
Estas dos operaciones de convolución son muy comunes en el aprendizaje profundo en este momento. Leí sobre la capa convolucional dilatada en este artículo: WAVENET: UN MODELO GENERATIVO PARA AUDIO CRUDO y De-convolution se encuentra en este documento: Redes completamente convolucionales para la...
Estoy creando prototipos de una aplicación y necesito un modelo de lenguaje para calcular la perplejidad en algunas oraciones generadas. ¿Hay algún modelo de lenguaje entrenado en Python que pueda usar fácilmente? Algo simple como model = LanguageModel('en') p1 = model.perplexity('This is a well...
Me gustaría verificar los archivos JPG si fueron manipulados para cambiar el contenido. Lo que considero NO photoshopped: Recortar Giratorio (Escalada) Resolución de imagen Los cambios automáticos que pueden hacer los teléfonos inteligentes Lo que considero photoshopping: Agregar una nueva...
Estoy tratando de implementar un algoritmo donde, dada una imagen con varios objetos en una tabla plana, se desea la salida de máscaras de segmentación para cada objeto. A diferencia de las CNN, el objetivo aquí es detectar objetos en un entorno desconocido. ¿Cuáles son los mejores enfoques para...
¿Hay algún documento publicado que muestre diferencias en los métodos de regularización para redes neuronales, preferiblemente en diferentes dominios (o al menos diferentes conjuntos de datos)? Lo pregunto porque actualmente tengo la sensación de que la mayoría de las personas parecen usar solo el...
En este artículo altamente citado , los autores dan la siguiente discusión sobre el número de parámetros de peso. No tengo muy claro por qué tiene parámetros C 2 . Creo que debería ser 49 C ya que cada uno de los canales de entrada C comparte el mismo filtro, que tiene 49 parámetros.49...
Estoy usando un descriptor HOG, junto con un clasificador SVM, para reconocer a los humanos en imágenes. Estoy usando los envoltorios de Python para OpenCV. He utilizado el excelente tutorial en pymagesearch , que explica lo que hace el algoritmo y proporciona sugerencias sobre cómo establecer los...
Quiero extraer parámetros de una imagen usando una red neuronal. Ejemplo: Dada una imagen de una pared de ladrillos, el NN debe extraer el ancho y la altura de los ladrillos, el color y la aspereza. Puedo generar imágenes para parámetros dados para entrenar el NN y quiero usarlo para extraer los...