Estoy trabajando en un problema en el que necesito usar Kriging para predecir el valor de algunas variables en función de algunas variables circundantes. Quiero implementar su código por mí mismo. Entonces, revisé demasiados documentos para entender cómo funciona, pero estaba muy confundido. En general, entiendo que es un promedio ponderado, pero no pude entender completamente el proceso de calcular el peso y luego predecir el valor de una variable.
¿Alguien puede explicarme en términos simples los aspectos matemáticos de estos métodos de interpolación y cómo funciona?
spatial
interpolation
kriging
Dania
fuente
fuente
Respuestas:
Esta respuesta consiste en una sección introductoria que escribí recientemente para un artículo que describe una extensión espacio-temporal (modesta) de "Universal Kriging" (Reino Unido), que es una generalización modesta de "Kriging ordinario". Tiene tres subsecciones: la teoría proporciona un modelo estadístico y supuestos; Estimación revisa brevemente la estimación de parámetros de mínimos cuadrados; y Prediction muestra cómo kriging encaja en el marco de Mínimos cuadrados generalizados (GLS). Me he esforzado por adoptar una notación familiar para los estadísticos, especialmente los visitantes de este sitio, y para usar conceptos bien explicados aquí.
Para resumir, kriging es la mejor predicción imparcial lineal (BLUP) de un campo aleatorio. Lo que esto significa es que el valor predicho en cualquier ubicación no muestreada se obtiene como una combinación lineal de los valores y covariables observados en las ubicaciones muestreadas. El valor (desconocido, aleatorio) tiene una correlación asumida con los valores de la muestra (y los valores de la muestra están correlacionados entre sí). Esta información de correlación se traduce fácilmente en la varianza de la predicción. Uno elige los coeficientes en la combinación lineal (los "pesos de kriging") que hacen que esta varianza sea lo más pequeña posible, sujeta a una condición de sesgo cero en la predicción. Los detalles siguen.
Teoría
El Reino Unido comprende dos procedimientos, uno de estimación y otro de predicción, llevados a cabo en el contexto de un modelo GLS para un área de estudio. Los supone modelo GLS que los datos de muestra son el resultado de desviaciones aleatorias alrededor de una tendencia y que esas desviaciones están correlacionados. Se entiende por tendencia en el sentido general de un valor que puede determinarse mediante una combinación lineal de p coeficientes desconocidos (parámetros) β = ( β 1 , β 2 , ... , βzyo, ( I = 1 , 2 , . . . , N ) pag . (A lo largo de esta publicación, el primer ' denota la transposición de la matriz y todos los vectores se consideran vectores de columna).β= ( β1, β2, ... , βpag)′ ′
En cualquier lugar dentro de un área de estudio hay disponible una tupla de atributos numéricos denominados "variables independientes" o "covariables". (Por lo general, y 1 = 1 es un "término constante", y 2 e y 3 pueden ser coordenadas espaciales, y el y i adicionaly =( y1, y2, ... , ypag)′ y1= 1 y2 y3 yyo puede representar información espacial, así como otra información auxiliar que esté disponible en todas las ubicaciones en el área de estudio, como la porosidad de un acuífero o la distancia a un pozo de bombeo.) En cada ubicación de datos , además de sus covariables y i = ( y i 1 , y i 2 , ... , y i p ) ′ , la observación asociada z i se considera la realización de una variable aleatoria Z i . En contraste, el y iyo yyo= ( yyo 1, yyo 2, ... , yyo p)′ zyo Zyo yyo se consideran valores determinados por o que caracterizan los puntos o pequeñas regiones representadas por las observaciones (los datos "apoyan"). Los no se consideran realizaciones de variables aleatorias y se requiere que no estén relacionados con las propiedades de ninguno de los Z i .yyo Zyo
La combinación lineal expresa el valor esperado de Z i en términos de los parámetros β , que es el valor de la tendencia en el lugar i . El proceso de estimación utiliza los datos para encontrar los valores de beta i que representan los parámetros desconocidos beta i
Estimacion
El kriging clásico asume las fluctuaciones aleatorias tiene valores esperados de cero y se conocen sus covarianzas. Escribe la covarianza entre Z i y Z j como c i j . Usando esta covarianza, la estimación se realiza usando GLS. Su solución es la siguiente: β = H z , H = ( Y ' C - 1 Y ) - 1 Y ' C - 1 donde z = ( z 1Zyo Zyo Zj Cyo j
Predicción
UK predice de manera similar por medio de una combinación lineal de los datos z 0 = λ 1 z 1 + λ 2 z 2 + ⋯ + λ n z n = λ ' z . Los λ i se denominan "pesos de kriging" para la predicción de z 0 . El Reino Unido cumple esta predicción de z 0 al cumplir dos criterios. Primero, la predicción debe ser imparcial, lo que se expresa al requerir que la combinación lineal de las variables aleatoriasz0 0
no importa lo que sea . Este será el caso siempre queβ
(Los lectores familiarizados con la regresión múltiple pueden encontrar instructivo comparar esta solución con la solución basada en covarianza de las ecuaciones normales de mínimos cuadrados ordinarios , que se ve casi exactamente igual, pero sin términos multiplicadores de Lagrange).
fuente