¿Quién inventó la validación cruzada k-fold?

Estoy buscando una referencia al documento donde se introdujo la validación cruzada k-fold (en lugar de solo una buena referencia académica para el tema). Quizás esté demasiado atrás en la bruma del tiempo para identificar inequívocamente el primer artículo, por lo que cualquier documento inicial en el que se utilizó la idea sería de interés.

Los primeros que conozco son

PA Lachenbruch y MR Mickey, "Estimación de las tasas de error en el análisis discriminante", Technometrics, vol. 10, no. 1, págs. 1-12, febrero de 1968.

A. Luntz y V. Brailovsky, "Sobre la estimación de los caracteres obtenidos en el procedimiento estadístico de reconocimiento (en ruso)", Techicheskaya Kibernetica, vol. 3, 1969.

pero por lo que puedo decir, solo cubren la validación cruzada de dejar uno fuera (mi ruso técnico no es todo lo que podría ser; o).

cross-validation references Dikran Marsupial
fuente

¿Asumo que estás familiarizado con la ley de Stigler ? (Debe interpretarse de manera un poco más amplia que lo indicado) :)

cardenal

¡Aprendo algo nuevo cada día! Una referencia temprana servirá si se desconoce el inventor original. Sospecho que es una de esas cosas que se ha inventado independientemente varias veces, pero la historia es interesante.

Dikran Marsupial

Respuestas:

Un artículo que podría valer la pena consultar es

Stone M. Opción de validación cruzada y evaluación de predicciones estadísticas. J. Royal Stat. Soc., 36 (2), 111-147, 1974.

He visto referencias a

Mosteller F. y Tukey JW Análisis de datos, incluidas estadísticas. En Manual de Psicología Social. Addison-Wesley, Reading, MA, 1968.

como una descripción clara y temprana de la validación cruzada de -pliegues, pero no tengo este manuscrito. $k$

El papel de 1931

Larson S. La contracción del coeficiente de correlación múltiple. J. Educat. Psychol., 22: 45-55,1931.

se menciona, por ejemplo, Stone, como un ejemplo temprano en el que un conjunto de validación seleccionado al azar se deja de lado para una evaluación posterior del modelo.

NRH
fuente

La referencia de Mosteller y Tukey parece un buen comienzo +1 (¡presumo que es Tukey en lugar de Turquía!; O)

Dikran Marsupial

@DikranMarsupial, Ja, disculpas a Tukey. Copié y pegué la referencia y no noté el nombre mal escrito. Sí, definitivamente es Tukey.

NRH

Mosteller y Tukey: books.google.pl/…

liori