¿Decidir qué método de interpolación usar para volver a muestrear datos ráster?

40

¿Existen reglas estrictas sobre qué métodos de interpolación son adecuados para cada tipo de datos ráster?

novedoso
fuente
1
¿Qué estás interpolando? ¿El objetivo es simplemente visualizar o medir realmente algún tipo de distribución? Sin embargo, para no hacerte ilusiones, prácticamente no hay reglas duras o rápidas.
Andy W
44
@ninesided: ¿Está seguro de que quería indicar datos "ráster"? La respuesta que aceptó se refiere únicamente a los métodos de interpolación de datos vectoriales (puntuales y de línea).
whuber
55
El título de la pregunta es un poco ambiguo. Las palabras interpolación y remuestreo significan dos cosas ligeramente diferentes. Interpolar es tomar una muestra de puntos de datos discretos (ráster o vector) y calcular una superficie continua a partir de eso. El remuestreo consiste en tomar un grupo de puntos (nuevamente, ráster o vector), aplicarles algún tipo de algoritmo y generar un nuevo conjunto de puntos. Entonces, creo que la interpolación se puede ver como un tipo de remuestreo.
Don Meltz
2
En mi humilde opinión el título está mal. "volver a muestrear datos ráster" me hace pensar que usted tiene un ráster y desea producir un nuevo ráster más grande / más pequeño a partir de él. Si desea producir un ráster interpolando puntos vectoriales, "remuestreo" es el término incorrecto.
oscuro
3
@nidesided: dado que elegiste mi respuesta como la respuesta a tu pregunta, supongo que estabas buscando interpolar un conjunto de puntos discretos en una superficie de trama continua. La mayoría de las personas interpreta la palabra remuestreo como una conversión de un ráster a otro, según algún algoritmo. No creo que estés equivocado al usar la palabra porque creo que la interpolación es una forma de remuestreo. Es solo que la mayoría no lo ve así. No profeso ser un experto en esta área, por lo que las correcciones a mi suposición son bienvenidas.
Don Meltz

Respuestas:

11

Estoy de acuerdo en que no hay reglas duras y rápidas, pero hay algunas pautas para varios métodos de interpolación. Por ejemplo, IDW es mejor cuando tienes puntos bastante densos para empezar. Kriging es un procesador intensivo, generalmente utilizado en modelado de suelos / geología. La ranura generalmente se usa cuando se desea una superficie lisa, por ejemplo, datos de temperatura. Algunos métodos mantienen el ráster resultante pasando por los puntos originales, mientras que otros no.

Aunque está centrado en ArcGIS, se puede encontrar una buena descripción general de los diferentes métodos en el documento de 4 páginas

Interpolación de superficies en ArcGIS Spatial Analyst

Don Meltz
fuente
41

Una aclaración a la pregunta indica que se buscan métodos de remuestreo de una trama . Muchos están en uso en comunidades de imágenes y fotográficas . Sin embargo, para el trabajo SIG, varios métodos sencillos son de uso común:

  • Muestreo de vecino más cercano . A cada celda del nuevo ráster se le asigna el valor de la celda más cercana (centro a centro) en el ráster original. Use esto para datos categóricos como el uso del suelo y otras clasificaciones.

  • Interpolación bilineal . A cada celda del nuevo ráster se le asigna un promedio basado en las cuatro celdas originales más cercanas. El promedio es lineal en las direcciones horizontal y vertical. (La fórmula resultante, sin embargo, no es lineal; en realidad es cuadrática.) Esto es bueno para el suavizado de uso general, pero el promedio que ocurre generalmente recorta un poco los picos y valles locales.

  • Convolución cúbica . Esto es similar en espíritu a la interpolación bilineal, pero puede extrapolar ligeramente los valores de las celdas cercanas. Lo hace de una manera destinada a reproducir promedios locales y variabilidad en la nueva cuadrícula; en particular, el recorte de extremos locales no debería ser tan severo. (Una consecuencia negativa, evidente como un error en ArcGIS de ESRI, es que los valores en la nueva cuadrícula pueden extenderse más allá del rango de la anterior, lo que hace que algunos de los nuevos extremos no se representen correctamente. Pero esto es una cuestión de datos solo visualización.) La compensación es que la convolución cúbica tarda un poco más de tiempo en calcularse que la interpolación bilineal.

Discuto los dos últimos métodos con algún detalle en http://www.quantdec.com/SYSEN597/GTKAV/section9/map_algebra.htm

Para cálculos rápidos y únicos, generalmente estoy contento de realizar la interpolación bilineal (para datos continuos) o la interpolación del vecino más cercano (para datos categóricos). Para todos los demás, especialmente cuando se preparan conjuntos de datos maestros o cuando se anticipan manipulaciones extensas, recomiendo usar convolución cúbica (además de pensar en ordenar las operaciones para minimizar la propagación del error de coma flotante).

whuber
fuente
Algunos consejos adicionales útiles aparecen en los comentarios en gis.stackexchange.com/questions/17328/… .
whuber
18

Según ESRI, los métodos de interpolación disponibles (disponibles como herramientas en Spatial Analyst y otras extensiones) se comparan de la siguiente manera: (Citando)

La herramienta IDW (ponderación de distancia inversa) utiliza un método de interpolación que estima los valores de celda promediando los valores de los puntos de datos de muestra en la vecindad de cada celda de procesamiento. Cuanto más cerca esté un punto del centro de la célula que se estima, mayor influencia o peso tendrá en el proceso de promedio.

Kriging es un procedimiento geoestadístico avanzado que genera una superficie estimada a partir de un conjunto disperso de puntos con valores z. Más que otros métodos de interpolación compatibles con ArcGIS Spatial Analyst, se debe realizar una investigación exhaustiva del comportamiento espacial del fenómeno representado por los valores z antes de seleccionar el mejor método de estimación para generar la superficie de salida.

La interpolación de vecino natural encuentra el subconjunto más cercano de muestras de entrada a un punto de consulta y les aplica pesos basados ​​en áreas proporcionadas para interpolar un valor (Sibson, 1981). También se conoce como Sibson o interpolación de "robo de área".

La herramienta Spline utiliza un método de interpolación que estima los valores utilizando una función matemática que minimiza la curvatura de la superficie general, lo que da como resultado una superficie lisa que pasa exactamente a través de los puntos de entrada.

Spline with Barriers La herramienta Spline with Barriers utiliza un método similar a la técnica utilizada en la herramienta Spline, con la principal diferencia de que esta herramienta respeta las discontinuidades codificadas tanto en las barreras de entrada como en los datos del punto de entrada.

Las herramientas Topo to Raster y Topo to Raster by File utilizan una técnica de interpolación diseñada específicamente para crear una superficie que represente más estrechamente una superficie de drenaje natural y conserve mejor tanto las crestas como las redes de flujo de los datos de contorno de entrada.

El algoritmo utilizado se basa en el de ANUDEM, desarrollado por Hutchinson et al en la Universidad Nacional de Australia.

La tendencia es una interpolación polinómica global que ajusta una superficie lisa definida por una función matemática (un polinomio) a los puntos de muestra de entrada. La superficie de tendencia cambia gradualmente y captura patrones de escala gruesa en los datos.

También puede consultar este artículo: http://proceedings.esri.com/library/userconf/proc95/to100/p089.html

Jakub Sisak GeoGraphics
fuente
1
¡+1 por elegir algo de la ayuda de ESRI para citar que realmente tiene sentido y es correcto!
whuber
Si pudiera actualizar el enlace al proceso, el que publicó ya no está disponible (página no encontrada). Alternativamente, puede colocar un título o alguna información que nos permita buscarlo en la página de ESRI.
Renata Dis
2

Otros dos métodos serían Promedio4 y Promedio16. Hacen lo que parecen y toman el promedio de las 4 o 16 celdas circundantes.

El caso de uso aquí es principalmente para datos DEM. No lo usaría en una imagen de trama (especialmente color de 3 bandas)

No está ponderado por la distancia, pero no creo que lo use para el ráster (solo vector) ya que la distancia en un dataset ráster es un poco más subjetiva

Siempre pensé que Median4 y Median16 serían buenas maneras de eliminar caídas y picos de datos de DEM, aunque no conozco ningún paquete que lo permita.

Mark Ireland
fuente
2
Su sugerencia de usar medianas del vecindario para detectar valores atípicos locales en los DEM es buena, Mark. El paquete GRID / Spatial Analyst de ESRI ha incluido medianas del vecindario durante mucho tiempo, sé que IDRISI puede hacerlo, y probablemente también GRASS y Manifold. Pero este método sería una mala elección para volver a muestrear una cuadrícula. Del mismo modo, los otros métodos que menciona no tendrían buenas propiedades: suavizan efectivamente los datos originales a la resolución de la cuadrícula original y, por lo tanto, no deben considerarse para volver a muestrear.
whuber