Sé que una arquitectura de red neuronal se basa principalmente en el problema en sí y los tipos de entrada / salida, pero aún así, siempre hay un "cuadrado" cuando se comienza a construir uno. Entonces, mi pregunta es: dado un conjunto de datos de entrada de MxN (M es el número de registros, N es el número de características) y una C posibles clases de salida, ¿hay una regla general sobre cuántas capas / unidades deberíamos comenzar?
neural-network
tembloroso
fuente
fuente
Respuestas:
Esta pregunta se ha respondido en detalle en CrossValidated: ¿Cómo elegir el número de capas y nodos ocultos en una red neuronal de avance?
Sin embargo, déjame agregar mis propios dos centavos:
No existe una regla mágica para elegir la mejor arquitectura de red neuronal, pero si puede encontrar una arquitectura que alguien haya usado para resolver un problema similar, este suele ser un excelente punto de partida.
Los mejores lugares para buscar son ejemplos oficiales o no oficiales que utilizan bibliotecas de redes neuronales populares como Keras, PyTorch o Tensorflow, y arquitecturas descritas en la literatura académica. Keras / examples en github es un gran recurso.
Estas arquitecturas probablemente se eligieron después de muchas pruebas y errores, por lo que la mayor parte del trabajo se habrá realizado por usted.
fuente
Leí un artículo que exploraba la idea de usar redes neuronales para diseñar otras redes neuronales, explorando qué configuración de nodos y capas era la más eficiente. Aquí está la página donde puede descargar un PDF https://arxiv.org/abs/1611.02120
fuente
Siguiendo la respuesta de @ Imran, encontré este artículo en uno de los comentarios de la publicación CrossValidated a la que se vinculó. Además de un intento de encontrar la arquitectura correcta usando Modelos Genéticos (en lugar de usar una regla general), la sección 2.1 brinda algunos límites teóricos sobre cuántas unidades ocultas deberían estar en un sistema de una / dos capas ocultas.
EDITAR: he probado este teorema y descubrí que usar modelos genéticos es tan bueno como seleccionar una arquitectura aleatoria.
fuente