¿La "estimación de la densidad del núcleo" es una convolución de qué?

25

Estoy tratando de comprender mejor la estimación de la densidad del kernel.

Usando la definición de Wikipedia: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition

fh^(x)=1ni=1nKh(xxi)=1nhi=1nK(xxih)

Tomemos como una función rectangular que da si está entre y y contrario, y (tamaño de la ventana) es 1.K()1x0.50.50h

Entiendo que la densidad es una convolución de dos funciones, pero no estoy seguro de saber cómo definir estas dos funciones. Uno de ellos debería (probablemente) ser una función de los datos que, para cada punto en R, nos dice cuántos puntos de datos tenemos en esa ubicación (principalmente ). Y la otra función probablemente debería ser alguna modificación de la función del núcleo, combinada con el tamaño de la ventana. Pero no estoy seguro de cómo definirlo.0

¿Alguna sugerencia?

A continuación se muestra un código R de ejemplo que (sospecho) replica los ajustes que definí anteriormente (con una mezcla de dos gaussianos ), en los que espero ver una "prueba" de que las funciones que se enredarán son como sospechamos .n=100

# example code:
set.seed(2346639)
x <- c(rnorm(50), rnorm(50,2))
plot(density(x, kernel='rectangular', width=1, n = 10**4))
rug(x)

ingrese la descripción de la imagen aquí

Tal Galili
fuente
3
Su alfombra en la parte inferior le da una intuición aproximada. Imagine que cada valor de a es un pico con un peso asociado . Ahora unte cada espiga usando la forma y el ancho de su núcleo, de modo que la espiga se transforme para tomar la misma forma y ancho, con una altura tal que el área de abajo sea . Agregue los resultados y tendrá una estimación de la densidad del núcleo. i = 1 n 1 / n 1 / nxii=1n1/n1/n
Nick Cox
Hola Nick, gracias por el comentario. Hasta aquí en la intuición que ya tengo, es la transformación formal en la forma de la circunvolución que tenía curiosidad de ver :) (¡Estoy ansioso por ver la respuesta de Whuber!)
Tal Galili

Respuestas:

27

Corresponde a cualquier lote de datos es su "función de densidad empírica"X=(x1,x2,,xn)

fX(x)=1ni=1nδ(xxi).

Aquí, es una "función generalizada". A pesar de ese nombre, no es una función en absoluto: es un nuevo objeto matemático que solo puede usarse dentro de integrales. Su propiedad definitoria es que para cualquier función de soporte compacto que sea continua en una vecindad de ,δg0

Rδ(x)g(x)dx=g(0).

(Los nombres para incluyen la medida "atómica" o "punto" y la " función delta de Dirac " . En el siguiente cálculo, este concepto se extiende para incluir funciones que son continuas solo desde un lado).δgg

Justificando esta caracterización de es la observación de quefX

xfX(y)dy=x1ni=1nδ(yxi)dy=1ni=1nxδ(yxi)dy=1ni=1nRI(yx)δ(yxi)dy=1ni=1nI(xix)=FX(x)

donde es el CDF empírico habitual e es la función característica habitual (igual a donde su argumento es verdadero y caso contrario). (Me salteo un argumento limitante elemental necesario para pasar de funciones de soporte compacto a funciones definidas sobre ; porque solo ser definido para valores dentro del rango de , que es compacto, esto no es un problema).FXI10RIX

La convolución de con cualquier otra función se da, por definición, comofX(x)k

(fXk)(x)=RfX(xy)k(y)dy=R1ni=1nδ(xyxi)k(y)dy=1ni=1nRδ(xyxi)k(y)dy=1ni=1nk(xix).

Dejando (que es lo mismo que para los núcleos simétricos, y la mayoría de los núcleos son simétricos) obtenemos el resultado reclamado: la fórmula de Wikipedia es una convolución.k(x)=Kh(x)Kh(x)

whuber
fuente
1
La situación en dos dimensiones se explica (en términos más coloquiales) y se ilustra en el sitio SIG en gis.stackexchange.com/questions/14374/… .
whuber
1
Querido Whuber, ¡acabo de leer tu respuesta con deleite! Muchas gracias por la explicación y los detalles, sus respuestas (esta y las demás en general) son realmente inspiradoras. Tuyo, Tal
Tal Galili
1
@ Jan Su comprensión no es del todo correcta. No existe una "densidad" empírica en el sentido de una medida continua finita. La función del indicador de los datos se integra a cero (ya sea que use la integración de Lebesgue o la integración de Riemann no hace ninguna diferencia). La función generalizada no es una función en absoluto: es un nuevo objeto matemático que solo puede usarse dentro de integrales. La distribución empírica es un objeto matemático que, cuando se integra contra cualquier función integrable devuelve la suma (sobre todos los datos ) de los valoresδg,xig(xi).
Whuber
1
@whuber Gracias. La oración La función generalizada δ no es una función en absoluto: es un nuevo objeto matemático que solo puede usarse dentro de integrales. Lo dejó más claro. en punto como siempre. ;)
Jan Vainer
1
@ Jan Gracias por tu ayuda: he incorporado esa idea en esta respuesta.
Whuber