Estaba leyendo el artículo Aprendizaje residual profundo para el reconocimiento de imágenes y tuve dificultades para comprender con 100% de certeza lo que implica un bloqueo residual computacionalmente. Leyendo su periódico tienen la figura 2:
que ilustra lo que se supone que es un Bloque residual. ¿El cálculo de un bloque residual es simplemente el mismo que:
¿O es otra cosa?
En otras palabras, tal vez tratar de hacer coincidir la notación del artículo es:
¿es eso cierto?
Observe que después de la suma del círculo, la palabra ReLU aparece en el papel, por lo que la salida de un Bloque residual (que denoté con ) debería ser:
con una no linealidad adicional ReLU .
Respuestas:
Sí, eso es cierto, puede echar un vistazo a su modelo de café para ver cómo se implementa.
fuente