La división de validación en la función de ajuste del modelo secuencial de Keras se documenta de la siguiente manera en https://keras.io/models/sequential/ :
validation_split: flota entre 0 y 1. Fracción de los datos de entrenamiento que se utilizarán como datos de validación. El modelo separará esta fracción de los datos de entrenamiento, no se entrenará en ellos y evaluará la pérdida y cualquier métrica del modelo en estos datos al final de cada época. Los datos de validación se seleccionan de las últimas muestras en los datos x e y proporcionados, antes de barajar.
Tenga en cuenta la última línea:
Los datos de validación se seleccionan de las últimas muestras en los datos x e y proporcionados, antes de barajar.
¿Significa que los datos de validación siempre son fijos y se toman de la parte inferior del conjunto de datos principal?
¿Hay alguna forma de seleccionar al azar una fracción dada de datos del conjunto de datos principal?
fuente
train_test_split
y ahora confirmas que este es un mejor método, ya que obtendrá al azar datos de prueba / validación del conjunto de datos.shuffle
parámetro, usted también utilizarshuffle
en el.fit
de un modelo Keras?