Acabo de recibir una copia de Los elementos del aprendizaje estadístico de Hastie, Tibshirani y Friedman. En el capítulo 2 (Descripción general del aprendizaje supervisado), sección 4 (Teoría de decisión estadística), ofrece una derivación de la función de regresión.
Supongamos que denota un vector de entrada aleatorio con valor real, e una variable de salida aleatoria con valor real, con distribución conjunta . Buscamos una función para predecir valores dados de la entrada . Esta teoría requiere una función de pérdida para penalizar los errores en la predicción, y con mucho, el más común y conveniente es la pérdida de error al cuadrado: . Esto nos lleva a un criterio para elegir ,
lo esperado (cuadrado) error de predicción.
Entiendo completamente la configuración y la motivación. Mi primera confusión es: ¿quiere decir o ? Segundo, nunca he visto la notación . ¿Alguien que me haya explicado su significado? ¿Es solo que ? Por desgracia, mi confusión no termina ahí,
Al condicionar , podemos escribir como
Me falta la conexión entre estos dos pasos, y no estoy familiarizado con la definición técnica de "condicionamiento". ¡Avísame si puedo aclarar algo! Creo que la mayor parte de mi confusión ha surgido de una notación desconocida; Estoy seguro de que, si alguien puede dividir esta derivación en un inglés simple, lo entenderé. Gracias estadísticas.
fuente