Me preguntaba si en algunas circunstancias es posible que ANN tenga un mejor rendimiento si elimina algunas conexiones como, por ejemplo:
¿Construir un ANN tomando dos ANN's de múltiples capas A y B en paralelo (mismos nodos de entrada y salida) agregando algunas conexiones de "comunicación" entre las capas ocultas de A y B?
¿Podría uno obtener mejores resultados de generalización?
¿Se utiliza de alguna manera en la práctica o siempre se usan redes totalmente conectadas de varias capas?
classification
neural-networks
Jim Delgado
fuente
fuente
Como regla general, las redes pequeñas y / o dispersas se generalizan mejor. Puede dejar que su algoritmo de entrenamiento elimine las conexiones innecesarias dentro de una red de tamaño fijo mediante la aplicación de alguna forma de caída de peso, o puede aplicar un algoritmo que tenga como objetivo optimizar la arquitectura / topología de la red mediante la eliminación de entradas innecesarias, nodos ocultos o conexiones.
Eche un vistazo a estas referencias para obtener ideas y puntos de partida para futuras investigaciones, o analice el uso de algoritmos evolutivos para diseñar, podar y optimizar arquitecturas.
fuente
En la mayoría de los casos, si elimina conexiones innecesarias, obtendrá una mejor red. Es fácil sobreentrenar (sobreajustar) la red, en cuyo caso funcionará mal en el conjunto de datos de validación.
La poda de conexiones innecesarias probablemente reducirá la probabilidad de sobreentrenamiento. Consulte: http://en.wikipedia.org/wiki/Overfitting .
fuente
Sí, es posible. Podemos considerar la conexión entre unidades computacionales, número de capas ocultas, unidades por capa oculta, etc. como hiperparámetros. Es posible encontrar valores óptimos para estos parámetros realizando una serie de experimentos.
Por ejemplo:
Puede dividir su conjunto de datos de la siguiente manera: Conjunto de entrenamiento 60% de datos, Validación cruzada 20% de datos, Prueba 20% de datos,
Luego entrene su NN utilizando el conjunto de datos de entrenamiento y el parámetro de ajuste utilizando el conjunto de datos de validación cruzada.
Finalmente, puede usar su conjunto de datos de prueba para evaluar el rendimiento de su NN.
fuente