¿Qué son las características de cuello de botella?

11

En la publicación del blog Construyendo modelos poderosos de clasificación de imágenes usando muy pocos datos , se mencionan las características de cuello de botella. ¿Cuáles son las características del cuello de botella? ¿Cambian con la arquitectura que se usa? ¿Son el resultado final de las capas convolucionales antes de la capa completamente conectada? ¿Por qué se llaman así?

Abhishek Bhatia
fuente
[Vea esto también] ( ai.stackexchange.com/questions/4864/… )
Anurag Singh

Respuestas:

9

En la publicación del blog Construyendo modelos poderosos de clasificación de imágenes usando muy pocos datos , se mencionan las características de cuello de botella. ¿Cuáles son las características del cuello de botella?

Está claramente escrito en el enlace que le dio a las "características de cuello de botella" del modelo VGG16: los últimos mapas de activación antes de las capas completamente conectadas .

¿Cambian con la arquitectura que se usa?

Por supuesto. Lo más probable es que el autor haya usado un modelo pre-entrenado (entrenado en una gran cantidad de datos y ahora solo se usa como un extractor de funciones)

¿Son el resultado final de las capas convolucionales antes de la capa completamente conectada?

Si.

¿Por qué se llaman así?

Dado el tamaño de entrada a VGG, los mapas de características de dimensiones HxW se están volviendo dos veces más pequeños después de cada operación de grupo máximo. HxW es el más pequeño en la última capa convolucional.

FunkyKowal
fuente
6

Primero, necesitamos hablar sobre el aprendizaje de transferencia. Imagina que entrenaste una red neuronal a través de un conjunto de datos de imágenes para detectar gatos, puedes usar parte del entrenamiento que has realizado para trabajar en otra detección de otra cosa. Eso se conoce como transferencia de aprendizaje.

Para realizar el aprendizaje de transferencia, eliminará la última capa completamente conectada del modelo y conectará sus capas allí. El resultado del modelo "truncado" serán las características que llenarán su "modelo". Esas son las características del cuello de botella.

VGG16 es un modelo de preentrenamiento sobre catálogo de ImageNet que tiene muy buena precisión. En la publicación que compartió, está utilizando ese modelo como base para detectar gatos y perros con mayor precisión.

Las características del cuello de botella dependen del modelo. En este caso, estamos usando VGG16. Hay otros modelos pre-entrenados como VGG19, ResNet-50

Es como si estuviera cortando un modelo y agregando sus propias capas. Principalmente, la capa de salida para decidir lo que desea detectar, la salida final.

letyrodri
fuente