Estoy buscando una referencia al documento donde se introdujo la validación cruzada k-fold (en lugar de solo una buena referencia académica para el tema). Quizás esté demasiado atrás en la bruma del tiempo para identificar inequívocamente el primer artículo, por lo que cualquier documento inicial en el que se utilizó la idea sería de interés.
Los primeros que conozco son
PA Lachenbruch y MR Mickey, "Estimación de las tasas de error en el análisis discriminante", Technometrics, vol. 10, no. 1, págs. 1-12, febrero de 1968.
y
A. Luntz y V. Brailovsky, "Sobre la estimación de los caracteres obtenidos en el procedimiento estadístico de reconocimiento (en ruso)", Techicheskaya Kibernetica, vol. 3, 1969.
pero por lo que puedo decir, solo cubren la validación cruzada de dejar uno fuera (mi ruso técnico no es todo lo que podría ser; o).
fuente
Respuestas:
Un artículo que podría valer la pena consultar es
Stone M. Opción de validación cruzada y evaluación de predicciones estadísticas. J. Royal Stat. Soc., 36 (2), 111-147, 1974.
He visto referencias a
Mosteller F. y Tukey JW Análisis de datos, incluidas estadísticas. En Manual de Psicología Social. Addison-Wesley, Reading, MA, 1968.
como una descripción clara y temprana de la validación cruzada de -pliegues, pero no tengo este manuscrito.k
El papel de 1931
Larson S. La contracción del coeficiente de correlación múltiple. J. Educat. Psychol., 22: 45-55,1931.
se menciona, por ejemplo, Stone, como un ejemplo temprano en el que un conjunto de validación seleccionado al azar se deja de lado para una evaluación posterior del modelo.
fuente