He leído (por ejemplo, aquí ) que el núcleo Epanechnikov es óptimo, al menos en un sentido teórico, al hacer la estimación de la densidad del núcleo. Si esto es cierto, ¿por qué el gaussiano aparece con tanta frecuencia como el núcleo predeterminado, o en muchos casos el único núcleo, en las bibliotecas de estimación de densidad?
nonparametric
kernel-smoothing
John Rauser
fuente
fuente
kdensity
.Respuestas:
La razón por la cual el núcleo Epanechnikov no se usa universalmente por su óptima teórica puede ser que el núcleo Epanechnikov no sea teóricamente óptimo . Tsybakov critica explícitamente el argumento de que el núcleo Epanechnikov es "teóricamente óptimo" en las páginas 16-19 de Introducción a la estimación no paramétrica (sección 1.2.4).
Tratando de resumir, bajo algunos supuestos en el núcleoK y una densidad fija p uno tiene que el error cuadrado integrado medio es, de la forma
La principal crítica de Tsybakov parece estar minimizando los núcleos no negativos, ya que a menudo es posible obtener estimadores de mejor rendimiento, que incluso son no negativos, sin restringirlos a núcleos no negativos.
El primer paso del argumento para el núcleo Epanechnikov comienza minimizando(1) sobre h y todos los núcleos no negativos (en lugar de todos los núcleos de una clase más amplia) para obtener un ancho de banda "óptimo" para K
y el núcleo "óptimo" (Epanechnikov)
cuyo error cuadrado medio integrado es:
Sin embargo, estas no son opciones viables, ya que dependen del conocimiento (a través dep′′ ) de la densidad desconocida p , por lo tanto, son cantidades "oráculo".
Una propuesta dada por Tsybakov implica que el MISE asintótico para el oráculo Epanechnikov es:
Tsybakov dice que (2) a menudo se afirma que es el mejor MISE alcanzable, pero luego muestra que uno puede usar núcleos de orden 2 (para lo cualSK=0 ) para construir estimadores de núcleo, para cadaε>0 , de modo que
A pesar de que p n no es necesariamente no negativa, uno todavía tiene el mismo resultado para el estimador positivo parte, p + n : = max ( 0 , p n ) (que se garantiza que sea no negativo incluso si K no es):p^n p+n:=max(0,p^n) K
Por lo tanto, paraε suficientemente pequeño, existen estimadores verdaderos que tienen un MISE asintótico más pequeño que el oráculo de Epanechnikov , incluso utilizando los mismos supuestos en la densidad desconocida p .
En particular, uno tiene como resultado que el mínimo del MISE asintótico para unap fija sobre todos los estimadores del núcleo (o partes positivas de los estimadores del núcleo) es 0 . Por lo tanto, el oráculo de Epanechnikov ni siquiera está cerca de ser óptimo, incluso en comparación con los estimadores verdaderos.
La razón por la cual las personas presentaron el argumento a favor del oráculo de Epanechnikov en primer lugar es que a menudo se argumenta que el núcleo en sí mismo no debería ser negativo porque la densidad en sí misma no es negativa. Pero como señala Tsybakov, uno no tiene que suponer que el núcleo no es negativo para obtener estimadores de densidad no negativos, y al permitir otros núcleos se pueden estimadores de densidad no negativos que (1) no son oráculos y (2) funcionan arbitrariamente mejor que el oráculo de Epanechnikov para unap fija . Tsybakov usa esta discrepancia para argumentar que no tiene sentido argumentar a favor de la optimización en términos de una p fija , sino solo para las propiedades de optimización que son uniformes sobre una clasede densidades. También señala que el argumento todavía funciona cuando se usa MSE en lugar de MISE.
EDITAR: Ver también Corolario 1.1. en la p.25, donde se muestra que el núcleo Epanechnikov es inadmisible según otro criterio. A Tsybakov realmente parece no gustarle el núcleo Epanechnikov.
fuente
El núcleo gaussiano se usa, por ejemplo, en la estimación de densidad a través de derivados:
Esto se debe a que el núcleo Epanechnikov tiene 3 derivados antes de que sea idénticamente cero, a diferencia del gaussiano que tiene infinitos derivados (no nulos). Vea la sección 2.10 en su enlace para más ejemplos.
fuente