Preguntas etiquetadas con networks

10
La mejor manera de inicializar el estado LSTM

Me preguntaba cuál es la mejor manera de inicializar el estado para LSTM. Actualmente solo lo inicializo a todos ceros. Realmente no puedo encontrar nada en línea sobre cómo inicializarlo. Una cosa que estaba pensando hacer es hacer que el estado inicial sea un parámetro entrenable. ¿Algún...

10
¿Cuál es la pérdida de peso?

Estoy comenzando con el aprendizaje profundo, y tengo una pregunta cuya respuesta no pude encontrar, tal vez no he buscado correctamente. He visto esta respuesta , pero aún no está claro cuál es la pérdida de pérdida de peso y cómo se relaciona con la función de