¿Por qué tiene que proporcionar un modelo de variograma cuando está kriging?

9

Soy muy nuevo en estadísticas espaciales y veo muchos tutoriales,

Pero realmente no entiendo por qué tiene que proporcionar un modelo de variograma cuando realiza la corrección.

Estoy usando el paquete gstat en R, y este es el ejemplo que dan:

library(sp)
data(meuse)
coordinates(meuse) = ~x+y
data(meuse.grid)
str(meuse.grid)
gridded(meuse.grid) = ~x+y
m <- vgm(.59, "Sph", 874, .04)
print(m)
# ordinary kriging:
x <- krige(log(zinc)~1, meuse, meuse.grid, model = m)

¿Alguien puede explicar en un par de líneas por qué primero tiene que proporcionar vgm? ¿Y cómo se configuran los parámetros?

¡Gracias de antemano! Kasper

Kasper
fuente
Para kriging simple, el estimador es AZUL solo si la covarianza media y espacial se conocen de antemano. En kriging ordinario, se estima el variograma a partir de los datos y luego se hace la interpolación. Vea la viñeta del gstatpaquete R de los mismos datos de meuse.
Andy W
Hola Andy, gracias por tu comentario. Descubrí en la viñeta que también se puede corregir sin un modelo de variograma. Hice lo siguiente: krige (residuales ~ 1, temp_plot_spatial, y, nmin = 5, nmax = 10), entonces krige con solo mirar un mínimo de 5 vecinos y un máximo de 10. ¿Tiene algún sentido? El resultado fue amable: dropbox.com/s/7lxvfiyfl7ekhb4/…
Kasper
Creo que tengo un problema con el modelado del variograma: ¿y si asume que la correlación no tiene nada que ver con la distancia sino con los vecinos más cercanos?
Kasper
"¿y si asumes que la correlación no tiene nada que ver con la distancia sino con los vecinos más cercanos?" - eso no es kriging entonces, está más en línea con la clasificación knn. El código krige(residuals~1 ,temp_plot_spatial, y, nmin=5, nmax=10)estima variogramas locales. Por ejemplo, no tiene un variograma en todo el espacio de estudio, pero calcule un nuevo modelo para cada ubicación que intente predecir. El modelo local solo toma los 10 valores más cercanos (ya que no especifica una distancia máxima, siempre debe tomar 10 valores, por lo que nmindebe ser superfluo).
Andy W
1
Entonces estimar variogramas locales es algo lógico. Si varían de acuerdo con ciertas características, incluir otros predictores en el modelo también es una opción. IDW podría considerarse el tipo más simple de modelo de kriging, por lo que IDW no debería ser mejor que estimar realmente el variograma a partir de los datos.
Andy W

Respuestas:

9

Introducción y resumen

La Ley de Geografía de Tobler afirma

Todo está relacionado con todo lo demás, pero las cosas cercanas están más relacionadas que las distantes.

Kriging adopta un modelo de esas relaciones en las que

  • Las "cosas" son valores numéricos en ubicaciones en la superficie de la tierra (o en el espacio), generalmente representadas como un plano euclidiano.

  • Se supone que estos valores numéricos son realizaciones de variables aleatorias.

  • "Relacionado" se expresa en términos de las medias y covarianzas de estas variables aleatorias.

(Una colección de variables aleatorias asociadas con puntos en el espacio se denomina "proceso estocástico"). El variograma proporciona la información necesaria para calcular esas covarianzas.

¿Qué es Kriging?

Kriging es específicamente la predicción de cosas en lugares donde no se han observado. Para hacer que el proceso de predicción sea matemáticamente manejable, Kriging limita las posibles fórmulas para que sean funciones lineales de los valores observados. Eso hace que el problema sea finito para determinar cuáles deberían ser los coeficientes. Estos se pueden encontrar al requerir que el procedimiento de predicción tenga ciertas propiedades. Intuitivamente, una propiedad excelente es que las diferencias entre el predictor y el valor verdadero (pero desconocido) deberían tender a ser pequeñas: es decir, el predictor debería ser preciso . Otra propiedad que es muy promocionada pero que es más cuestionable es que, en promedio, el predictor debe ser igual al valor verdadero: debe ser preciso .

(La razón por la que insistir en una precisión perfecta es cuestionable, pero no necesariamente mala, es que generalmente hace que cualquier procedimiento estadístico sea menos preciso: es decir, más variable. Al disparar a un objetivo, ¿preferiría dispersar los golpes de manera uniforme alrededor del borde y rara vez golpea el centro o ¿aceptaría resultados que se enfocan justo al lado, pero no exactamente, del centro? El primero es preciso pero impreciso, mientras que el segundo es inexacto pero preciso).

Estos supuestos y criterios, es decir, las covarianzas son formas apropiadas de cuantificar la relación, que una predicción lineal funcionará y que el predictor debe ser lo más preciso posible sujeto a ser perfectamente exacto, conducen a un sistema de ecuaciones que tiene un Solución única siempre que las covarianzas se hayan especificado de manera coherente . El predictor resultante se llama "BLUP": el mejor predictor imparcial lineal.

Donde entra el Variograma

Encontrar estas ecuaciones requiere operacionalizar el programa que se acaba de describir. Esto se hace escribiendo las covarianzas entre el predictor y las observaciones consideradas como variables aleatorias. El álgebra de las covarianzas hace que las covarianzas entre los valores observados entren también en las ecuaciones de Kriging.

En este punto llegamos a un callejón sin salida, porque esas covarianzas son casi siempre desconocidas. Después de todo, en la mayoría de las aplicaciones hemos observado solo una realización de cada una de las variables aleatorias: nuestro conjunto de datos, que constituye solo un número en cada ubicación distinta. Ingrese el variograma: esta función matemática nos dice cuál debería ser la covarianza entre dos valores. Está limitado a garantizar que estas covarianzas sean "consistentes" (en el sentido de que nunca darán un conjunto de covarianzas que sean matemáticamente imposibles: no todas las colecciones de medidas numéricas de "relación" formarán matrices de covarianzas reales ). Es por eso que un variograma es esencial para Kriging.

Referencias

Debido a que la pregunta inmediata ha sido respondida, me detendré aquí. Los lectores interesados ​​pueden aprender cómo se estiman e interpretan los variogramas consultando buenos textos como Geoestadística de Minería de Journel & Huijbregts (1978) o Geoestadística Aplicada de Isaaks & Srivastava (1989). (Tenga en cuenta que el proceso de estimación introduce dos objetos llamados "variogramas": un variograma empírico derivado de los datos y un variograma modelo que se ajusta a él. Todas las referencias al "variograma" en esta respuesta son al modelo. La llamada a vgmla pregunta devuelve una representación por computadora de un variograma modelo.) Para un enfoque más moderno en el que la estimación de variograma y Kriging se combinen adecuadamente, vea Diggle &Geoestadística basada en modelos (2007) (que también es un manual extendido para los Rpaquetes GeoRy GeoRglm).


Comentarios

Por cierto, ya sea que esté utilizando Kriging para la predicción o algún otro algoritmo, la caracterización cuantitativa de la relación proporcionada por el variograma es útil para evaluar cualquier procedimiento de predicción. Observe que todos los métodos de interpolación espacial son predictores desde este punto de vista, y muchos de ellos son predictores lineales, como IDW (Inverse Distance Weighted). El variograma se puede usar para evaluar el valor promedio y la dispersión (desviación estándar) de cualquiera de los métodos de interpolación. Por lo tanto, tiene una aplicabilidad más allá de su uso en Kriging.

whuber
fuente
Gracias por esta respuesta detallada. Hago la misma pregunta que antes, ¿qué pasa si no puedo suponer que la correlación espacial es independiente de la ubicación? ¿Es correcto que modelar el variograma no sea útil, ya que tendría que hacer un modelo del variograma para todas las ubicaciones? ¿Entonces es mejor usar IDW?
Kasper
Cuando no puede asumir la estacionariedad de segundo orden del proceso, varias opciones incluyen (1) recopilar múltiples realizaciones del proceso (cuando varía con el tiempo); (2) estimar variogramas sobre subregiones locales (cuando hay muchos datos); y (3) suponiendo un modelo paramétrico de cómo cambia el variograma con la ubicación (como en los modelos GARCH para procesos 1D). Mis últimos comentarios abordan directamente la desaconsejabilidad de recurrir a algo como IDW: si puede o no estimar el variograma, en principio existe y, por lo tanto, IDW suele ser subóptimo.
Whuber