TLDR: ¿Las estrías de regresión de placa delgada tienen una interpretación probabilística / bayesiana?
Dados pares de entrada-salida , ; Quiero estimar una función siguiente manera donde es una función del núcleo y es un vector de características de tamaño . Los coeficientes y se pueden encontrar resolviendo donde las filas de \ Phi están dadas por
y, con algún abuso de notación, la entrada de la matriz del núcleo es . Esto da
Suponiendo que es una función de núcleo definida positiva, esta solución puede verse como el mejor predictor imparcial lineal para el siguiente modelo bayesiano:
donde y denota un proceso gaussiano. Ver por ejemplo https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2665800/
Mi pregunta es la siguiente. Supongamos que dejo y , es decir, la ranura delgada de la placa regresión. Ahora, no es una función semidefinida positiva y la interpretación anterior no funciona. ¿El modelo anterior y su solución aún tienen una interpretación probabilística en el caso de que sea semidefinido positivo?
Respuestas:
Deje que el modelo de la pregunta se escriba como donde es un GP no observado con índice y es un término de ruido normal con varianza . Por lo general, se supone que el GP es centrado, estacionario y no determinista. Tenga en cuenta que el término puede considerarse como un GP (determinista) con kernel donde
Aquí hay dos ejemplos de IRF para . En primer lugar, considere un proceso de Wiener con su condición inicial reemplazada por una condición inicial difusa : es normal con una varianza infinita. Una vez que se conoce un valor , se puede predecir el IRF como es el GP de Wiener. En segundo lugar, considere un proceso Wiener integrado dado por la ecuación donde es un proceso de Wiener. Para obtener un GP ahora necesitamos dos parámetros escalares: dos valores y parad=1 ζ(x) ζ(0)=0 ζ(0) ζ(x)
Para una dimensión general , considere un espacio lineal de funciones definidas en . Llamamos a un incremento relativo a una colección finita de ubicaciones y pesos reales tales que Considere como el espacio nulo de nuestros ejemplos. Para el primer ejemplo podemos tomar, por ejemplo, con y arbitraria yd F Rd F s xi∈Rd s νi
El cálculo de la predicción del IRF es casi el mismo que en la pregunta, con reemplazado por , pero con ahora formando una base de . La restricción adicional debe agregarse en el problema de optimización, lo que garantizará que . Todavía podemos agregar más funciones básicas que no están en si es necesario; esto tendrá el efecto de agregar un GP determinista, digamos al IRFk(x,x′) g(x,x′) ϕi(x) F Φ⊤α=0 α⊤Kα≥0 F ψ(x)⊤γ ζ(x) en (2).
La spline de placa delgada depende de un número entero tal que , el espacio contiene polinomios de bajo grado, con una dimensión depende de y . Se puede demostrar que si es la siguiente función para luego define un wrt condicionalmente positivo . La construcción se refiere a un operador diferencialm m>2d F p(m) m d E(r) r≥0
Estadísticas de Cressie N para datos espaciales . Wiley 1993.
Mardia KV, Kent JT, Goodall CR y Little JA. Kriging y splines con información derivada. Biometrika (1996), 83,1, pp. 207-221.
Modelos Wahba G Spline para datos de observación . SIAM 1990.
Wang, Y Alisar Splines, Métodos y Aplicaciones . Chapman y Hall, 2011.
fuente