Estoy trabajando en el libro de ESL de Hastie, y estoy teniendo un momento difícil con la pregunta 2.3. La pregunta es la siguiente:
Estamos considerando una estimación vecina más cercana en el origen, y la ecuación indica la distancia media desde el origen hasta el punto de datos más cercano. No tengo idea de por dónde empezar en términos de tratar de derivar esto.
Sé que la mayoría de los puntos de datos están más cerca del límite del espacio muestral que de cualquier otro punto de datos (maldición de dimensionalidad), pero tengo problemas para traducir esto al sentido de Álgebra Lineal / Probabilidad.
¡Gracias!
Respuestas:
Por definición de la mediana, tenemos que podemos reescribe como que es equivalente al resultado deseado.
EDITAR: Intento de respuesta al estilo " ELI5 ", en tres partes.
Para el caso 1D con un solo punto, la distancia se distribuye uniformemente en , por lo que la mediana será .[0,1] 12
En 1D, la distribución para el mínimo más de puntos es el primer caso a la potencia -ésima.n n
En dimensiones, la distancia no está distribuida uniformemente, pero .p r rp
fuente