¿No aprenderían varios filtros en una capa convolucional el mismo parámetro durante el entrenamiento?

11

Basado en lo que he aprendido, utilizamos múltiples filtros en una capa de convección de una CNN para aprender diferentes detectores de características. Pero dado que estos filtros se aplican de manera similar (es decir, deslizados y multiplicados a las regiones de la entrada), ¿no aprenderían los mismos parámetros durante el entrenamiento? Por lo tanto, el uso de múltiples filtros sería redundante?

cjbayron
fuente

Respuestas:

6

Tuve la misma confusión al entender este hecho. La confusión surge para los principiantes porque la explicidad del libro no menciona que los filtros son diferentes.

ya que estos filtros se aplican de manera similar

Los filtros se aplican de manera similar, pero el valor de la celda en la matriz es diferente entre sí. Entonces extraen diferentes características de la imagen.

¿No aprenderían los mismos parámetros durante el entrenamiento?

No, no aprenden el mismo parámetro ya que los filtros son diferentes ahora. Por lo tanto, el uso de filtros múltiples no es redundante.

hombre de Acero
fuente
Gracias por responder. ¿Qué los hace exactamente diferentes? ¿Cómo nos aseguramos de que aprendan diferentes parámetros durante el entrenamiento? ¿Son sus valores iniciales?
cjbayron
1
diferentes valores de cada celda los hacen diferentes. Al igual que algunos detectarán líneas inclinadas, algunos detectarán líneas curvas de 45 grados, etc. Así que todos son diferentes.
ironman
1
Sí, entiendo que diferentes valores hacen que los filtros detecten diferentes características. Pero, ¿cómo aprenden estos filtros de manera diferente durante el entrenamiento?
cjbayron
3
Si todos los filtros comienzan de la misma manera, permanecerán así. La inicialización aleatoria significa que comienzan de manera diferente y desde allí aprenden cosas diferentes. Busque ruptura de simetría en redes neuronales para obtener más información.
Aaron