Preguntas etiquetadas con mini-batch-gradient-descent

¿La ventana deslizante conduce a un sobreajuste en LSTM?

¿Prepararé mi LSTM si lo entreno a través del enfoque de ventana deslizante? ¿Por qué la gente no parece usarlo para LSTM? Para un ejemplo simplificado, suponga que tenemos que predecir la secuencia de caracteres: A B C D E F G H I J K L M N O P Q R S T U V W X Y Z ¿Es malo (o mejor?) Si sigo...

lstm backpropagation mini-batch-gradient-descent