¿Qué transmite el número de filtros en una capa de convolución?
¿Cómo afecta este número el rendimiento o la calidad de la arquitectura? Quiero decir, ¿deberíamos optar siempre por un mayor número de filtros? ¿Qué hay de bueno de ellos? y ¿Cómo asigna la gente un número diferente de filtros para diferentes capas? Me refiero a mirar esta pregunta: ¿Cómo determinar el número de operadores convolucionales en CNN?
La respuesta especificó 3 capas de convolución con diferentes números de filtros y tamaños. Nuevamente en esta pregunta: número de mapas de características en redes neuronales convolucionales.
Puedes ver en la imagen que tenemos 28 * 28 * 6 filtros para la primera capa y 10 * 10 * 16 filtros para la segunda capa conv. ¿Cómo se les ocurren estos números? ¿Es esto a través de prueba y error? Gracias por adelantado
16
Respuestas:
¿Qué transmite el número de filtros en una capa de convolución? - Normalmente me gusta pensar en los filtros como detectores de funciones. Aunque depende del dominio del problema, la importancia # de los detectores de características intuitivamente es la cantidad de características (como bordes, líneas, partes de objetos, etc.) que la red puede aprender potencialmente. También tenga en cuenta que cada filtro genera un mapa de características. Los mapas de funciones le permiten aprender los factores explicativos dentro de la imagen, por lo que cuantos más filtros significan más aprende la red (no necesariamente es bueno todo el tiempo; la saturación y la convergencia son lo más importante)
¿Cómo afecta este número al rendimiento o la calidad de la arquitectura? - No creo que encuentre una buena respuesta para este tipo de preguntas, ya que todavía estamos tratando de formalizar lo que está sucediendo dentro del cuadro negro DL. Intuitivamente, una vez más, aprenderá una función no lineal más robusta cuanto más bancos de filtros tenga, sin embargo, el rendimiento dependerá del tipo de tarea y las características de los datos. Por lo general, desea saber qué tipo de datos está tratando para determinar los # parámetros en su arquitectura (incluido el filtro). ¿Cuántos filtros necesito? es más como preguntar qué tan complejas (especialmente) son las imágenes en mi conjunto de datos. No hay ninguna noción formal que relacione # filtros con el rendimiento. Todo es experimental e iterativo. Un montón de rastro y error seguro.
fuente