En el artículo Super-resolución de imagen única fotorrealista utilizando una red generativa adversaria de Christian Ledig et al., La distancia entre imágenes (utilizada en la función de pérdida) se calcula a partir de mapas de características extraídos de la red VGG19. Los dos utilizados en el artículo son (un poco confusos) llamados VGG22 y VGG54.
¿Qué son estos mapas de características?
¿Qué significan las designaciones "22" y "54"?
deep-learning
cnn
gan
Lafayette
fuente
fuente
Respuestas:
Al leer el artículo, parece que definen VGG54 como la pérdida calculada a partir de la distancia euclidiana entreϕ5 , 4 mapas de funciones derivados de imágenes de alta y baja resolución utilizando la red VGG19. Dóndeϕi , j se define como " el mapa de características obtenido por la j-ésima convolución (después de la activación) y antes de la i-ésima capa de agrupación máxima dentro de la red VGG19 ".
fuente