Preguntas etiquetadas con gradient-descent

Gradient Descent es un algoritmo para encontrar el mínimo de una función. Calcula iterativamente derivadas parciales (gradientes) de la función y desciende en pasos proporcionales a esas derivadas parciales. Una aplicación importante de Gradient Descent es ajustar un modelo parametrizado a un conjunto de datos: la función a minimizar es una función de error para el modelo.

12
¿Cuántas celdas LSTM debo usar?

¿Existen reglas generales (o reglas reales) relacionadas con la cantidad mínima, máxima y "razonable" de celdas LSTM que debo usar? Específicamente me relaciono con BasicLSTMCell de TensorFlow y la num_unitspropiedad. Suponga que tengo un problema de clasificación definido por: t - number of time...