Splines vs regresión del proceso gaussiano

14

Sé que la regresión de procesos gaussiana (GPR) es una alternativa al uso de splines para ajustar modelos no lineales flexibles. Me gustaría saber en qué situaciones una sería más adecuada que la otra, especialmente en el marco de regresión bayesiano.

Ya he visto ¿Cuáles son las ventajas / desventajas de usar splines, splines suavizados y emuladores de procesos gaussianos? pero no parece haber nada sobre GPR en esta publicación.

ved
fuente
Diría que GP es un enfoque más basado en datos para ajustar una función no lineal. Las estrías están típicamente restringidas al enésimo polinomio. Los GP pueden modelar funciones más complejas que los polinomios (aunque no es 100% seguro).
Vladislavs Dovgalecs

Respuestas:

14

Estoy de acuerdo con la respuesta de @j __.

Sin embargo, me gustaría destacar el hecho de que las splines son solo un caso especial de regresión / kriging del Proceso Gaussiano .

Si toma un cierto tipo de núcleo en la regresión del proceso gaussiano, obtendrá exactamente el modelo de ajuste de spline.

Este hecho está demostrado en este artículo por Kimeldorf y Wahba (1970) . Es bastante técnico, ya que utiliza el enlace entre los núcleos utilizados en kriging y Reproducing Kernel Hilbert Spaces (RKHS).

Popular
fuente
2
Como ejemplo, en el caso unidimensional, el modelo GP para la famosa spline de suavizado es simplemente un ruido blanco gaussiano doblemente integrado. Craig Ansley y Robert Kohn lo han utilizado para diseñar algoritmos eficientes a fines de la década de 1980. Creo que esta equivalencia puede entenderse parcialmente sin sumergirse en las matemáticas profundas de RKHS.
Yves
Esta es una muy buena respuesta.
Astrid
6

Es una pregunta muy interesante: el equivalente entre procesos gaussianos y splines suavizados se ha demostrado en Kimeldorf y Wahba 1970. La generalización de esta correspondencia en el caso de interpolación restringida se ha desarrollado en Bay et al. 2016

Bay y col. 2016. Generalización de la correspondencia de Kimeldorf-Wahba para la interpolación restringida. Revista Electrónica de Estadística.

En este documento, se ha discutido la ventaja del enfoque bayesiano.

maatouk Hassan
fuente
2

Estoy de acuerdo con el comentario de @ xeon, también GPR pone una distribución de probabilidad sobre un número infinito de funciones posibles y la función media (que es como una spline) es solo la estimación de MAP, pero también tiene una variación al respecto. Esto permite grandes oportunidades, como el diseño experimental (elegir datos de entrada que sean de máxima información). Además, si desea realizar la integración (cuadratura) del modelo, un médico de cabecera tendrá un resultado gaussiano que le permitirá dar confianza a su resultado. Al menos con los modelos estándar de spline esto no es posible.

En la práctica, GPR da un resultado más informativo (en mi experiencia), pero los modelos spline parecen ser más rápidos en mi experiencia.

j__
fuente