¿Cómo funciona la interpolación de Kriging?

10

Estoy trabajando en un problema en el que necesito usar Kriging para predecir el valor de algunas variables en función de algunas variables circundantes. Quiero implementar su código por mí mismo. Entonces, revisé demasiados documentos para entender cómo funciona, pero estaba muy confundido. En general, entiendo que es un promedio ponderado, pero no pude entender completamente el proceso de calcular el peso y luego predecir el valor de una variable.

¿Alguien puede explicarme en términos simples los aspectos matemáticos de estos métodos de interpolación y cómo funciona?

Dania
fuente
3
Implementar código es una gran herramienta de aprendizaje, pero no se puede recomendar para trabajar en problemas reales. Cuando obtenga el código escrito, depurado y probado, descubrirá que necesita un orden de magnitud más esfuerzo para proporcionar herramientas complementarias para el análisis de datos exploratorios espaciales, la variografía, la validación cruzada del variograma, la búsqueda de vecindarios y la publicación posterior. procesamiento de los resultados kriged. Un compromiso razonable y efectivo sería comenzar con un código de trabajo, como GSLib o GeoRGLM , y modificarlo.
whuber
Muchas gracias, es una gran idea, pero también quiero entender el aspecto matemático de Kriging, ¿tiene un recurso que lo explique claramente en términos simples? Gracias.
Dania

Respuestas:

15

Esta respuesta consiste en una sección introductoria que escribí recientemente para un artículo que describe una extensión espacio-temporal (modesta) de "Universal Kriging" (Reino Unido), que es una generalización modesta de "Kriging ordinario". Tiene tres subsecciones: la teoría proporciona un modelo estadístico y supuestos; Estimación revisa brevemente la estimación de parámetros de mínimos cuadrados; y Prediction muestra cómo kriging encaja en el marco de Mínimos cuadrados generalizados (GLS). Me he esforzado por adoptar una notación familiar para los estadísticos, especialmente los visitantes de este sitio, y para usar conceptos bien explicados aquí.

Para resumir, kriging es la mejor predicción imparcial lineal (BLUP) de un campo aleatorio. Lo que esto significa es que el valor predicho en cualquier ubicación no muestreada se obtiene como una combinación lineal de los valores y covariables observados en las ubicaciones muestreadas. El valor (desconocido, aleatorio) tiene una correlación asumida con los valores de la muestra (y los valores de la muestra están correlacionados entre sí). Esta información de correlación se traduce fácilmente en la varianza de la predicción. Uno elige los coeficientes en la combinación lineal (los "pesos de kriging") que hacen que esta varianza sea lo más pequeña posible, sujeta a una condición de sesgo cero en la predicción. Los detalles siguen.


Teoría

El Reino Unido comprende dos procedimientos, uno de estimación y otro de predicción, llevados a cabo en el contexto de un modelo GLS para un área de estudio. Los supone modelo GLS que los datos de muestra son el resultado de desviaciones aleatorias alrededor de una tendencia y que esas desviaciones están correlacionados. Se entiende por tendencia en el sentido general de un valor que puede determinarse mediante una combinación lineal de p coeficientes desconocidos (parámetros) β = ( β 1 , β 2 , ... , βzyo, (yo=1,2,...,norte)pag . (A lo largo de esta publicación, el primer ' denota la transposición de la matriz y todos los vectores se consideran vectores de columna).β=(β1,β2,...,βpag)

En cualquier lugar dentro de un área de estudio hay disponible una tupla de atributos numéricos denominados "variables independientes" o "covariables". (Por lo general, y 1 = 1 es un "término constante", y 2 e y 3 pueden ser coordenadas espaciales, y el y i adicionaly=(y1,y2,...,ypag)y1=1y2y3yyopuede representar información espacial, así como otra información auxiliar que esté disponible en todas las ubicaciones en el área de estudio, como la porosidad de un acuífero o la distancia a un pozo de bombeo.) En cada ubicación de datos , además de sus covariables y i = ( y i 1 , y i 2 , ... , y i p ) , la observación asociada z i se considera la realización de una variable aleatoria Z i . En contraste, el y iyoyyo=(yyo1,yyo2,...,yyopag)zyoZyoyyose consideran valores determinados por o que caracterizan los puntos o pequeñas regiones representadas por las observaciones (los datos "apoyan"). Los no se consideran realizaciones de variables aleatorias y se requiere que no estén relacionados con las propiedades de ninguno de los Z i .yyoZyo

La combinación lineal expresa el valor esperado de Z i en términos de los parámetros β , que es el valor de la tendencia en el lugar i . El proceso de estimación utiliza los datos para encontrar los valores de beta i que representan los parámetros desconocidos beta i

mi[Zyo]=yyoβ=yyo1β1+yyo2β2++yyopagβpag
Zyoβyoβ^yoβyo, mientras que el proceso de predicción utiliza los datos en las ubicaciones para calcular un valor en una ubicación no muestreada, que aquí se indexa como i = 0 . Los objetivos de estimación son parámetros fijos ( es decir , no aleatorios), mientras que el objetivo de predicción es aleatorio, porque el valor z 0 incluye una fluctuación aleatoria alrededor de su tendencia y 0 β . Por lo general, las predicciones se realizan para múltiples ubicaciones utilizando los mismos datos variando la ubicación 0yo=1,2,...,norteyo=0 0z0 0y0 0β0 0. Por ejemplo, a menudo se hacen predicciones para trazar una superficie a lo largo de una cuadrícula regular de puntos adecuados para contornear.

Estimacion

El kriging clásico asume las fluctuaciones aleatorias tiene valores esperados de cero y se conocen sus covarianzas. Escribe la covarianza entre Z i y Z j como c i j . Usando esta covarianza, la estimación se realiza usando GLS. Su solución es la siguiente: β = H z , H = ( Y ' C - 1 Y ) - 1 Y ' C - 1 donde z = ( z 1ZyoZyoZjCyoj

β^=Hz, H=(YC-1Y)-1YC-1
es elvector n de las observaciones, Y = ( y i j ) (la "matriz de diseño") es lamatriz n por p cuyas filas son los vectores y i , 1 i n , y C = ( c i j ) es lamatriz de covarianza n- by- n que se supone que es invertible (Draper y Smith (1981), sección 2.11). losz=(z1,z2,...,znorte)norteY=(yyoj)nortepagyyo,1yonorteC=(Cyoj)nortenorte por n matriz H , que proyecta los datos z en el parámetro estimaciones beta , se llama la “matriz sombrero.” La formulación de β como la aplicación de la matriz de sombrero a los datos explícitamente muestra cómo las estimaciones de los parámetros dependen linealmente de los datos. Las covarianzas C = ( c i j ) se calculan clásicamente utilizando un variograma que proporciona la covarianza en términos de las ubicaciones de los datos, aunque no es importante cómo se calcula realmente la covarianza.pagnorteHzβ^β^C=(Cyoj)

Predicción

UK predice de manera similar por medio de una combinación lineal de los datos z 0 = λ 1 z 1 + λ 2 z 2 + + λ n z n = λ ' z . Los λ i se denominan "pesos de kriging" para la predicción de z 0 . El Reino Unido cumple esta predicción de z 0 al cumplir dos criterios. Primero, la predicción debe ser imparcial, lo que se expresa al requerir que la combinación lineal de las variables aleatoriasz0 0

z^0 0=λ1z1+λ2z2++λnorteznorte=λz.
λyoz0 0z0 0 es igual a Z 0 en promedio: 0 = E [ Z 0 - Z 0 ] = E [ λ ' Z - Z 0 ] . Esta expectativa se toma sobre ladistribuciónconjunta n + 1 -variable de Z 0 y Z = ( Z 1 , Z 2 , ... , Z n )ZyoZ0 0
0 0=mi[Z^0 0-Z0 0]=mi[λZ-Z0 0].
norte+1Z0 0Z=(Z1,Z2,...,Znorte). La linealidad de la expectativa junto con el supuesto de tendencia (1) implica:
0 0=mi[λZ-Z0 0]=λmi[Z]-mi[Z0 0]=λ(Yβ)-y0 0β=(λY-y0 0)β=β(Yλ-y0 0)

no importa lo que sea . Este será el caso siempre queβ

Y^λ=y0 0.

λZ^0 0-Z0 0

Vunar(Z^0 0-Z0 0)=mi[(Z^0 0-Z0 0)2]=mi[(λZ-Z0 0)2]=C00-2λC0 0+λCλ
C0 0=(C01,C02,...,C0 0norte)Z0 0Zyo, yo1C00Z0 0

λpagμY^λ=y0 0norte+pag

(CYY0 0)(λμ)=(C0 0y0 0)
0 0pagpag1nortenorteλ
λ=Hy0 0+C-1(1-YH)C0 0.

(Los lectores familiarizados con la regresión múltiple pueden encontrar instructivo comparar esta solución con la solución basada en covarianza de las ecuaciones normales de mínimos cuadrados ordinarios , que se ve casi exactamente igual, pero sin términos multiplicadores de Lagrange).

λ[Hy0 0]Z0 0z^0 0

whuber
fuente
1
Muchas gracias whuber, esto es exactamente lo que estoy buscando. Has resuelto este problema por mí, ahora entiendo Kriging. Realmente aprecio tu ayuda, muchas gracias.
Dania
Y^
Y=(yjyo)pagnorteyyo,1yonorte