Cálculo de la dirección del flujo y delimitación de cuencas a partir de datos DEM proyectados y no proyectados

28

Esta es una pregunta teórica derivada de algunas discusiones con colegas sobre el tema de las implicaciones con la delineación de cuencas con datos proyectados (por ejemplo, Albers Equal Area) versus no proyectados (NAD 83) derivados de un DEM de 10 m que está en NAD 83.

Algunos han declarado que no es un problema ya que los valores calculados a partir de datos no proyectados simplemente se ajustan si decides proyectar.

Sin embargo, no estoy seguro de que sea así, ya que existen diferencias inherentes entre los datos en un sistema de coordenadas geográficas y los datos proyectados. Intenté con un ejemplo siguiendo la rutina comenzando con datos DEM no proyectados, luego probé el mismo sitio con datos DEM proyectados. Se realizaron los pasos para ambos (todo el trabajo realizado en ArcGIS 9.3.1) utilizando datos de 10 m DEM.

Una ejecución se realizó utilizando un DEM en NAD 83, y la segunda ejecución se realizó proyectando el mismo DEM en USA_Contiguous_Albers_Equal_Area_Conic_USGS_version.

  • derivar la dirección del flujo utilizando la herramienta de geoprocesamiento FlowDirection_sa
  • derivar la acumulación de flujo utilizando la herramienta FlowDirection_sa
  • ajuste el punto de fluidez utilizando una distancia de 50 metros
  • delinear la cuenca utilizando la herramienta Watershed_sa

Al comparar los dos pude notar una diferencia visual entre la visualización de las cuadrículas de Dirección de flujo.

NOTA: Después de más investigaciones posteriores, creo que el efecto de trazado de bandas se debe a que no se utiliza un remuestreo CUBIC sino que, por error, se usa el valor predeterminado NEAREST en la herramienta ArcGIS Project Raster. Sin embargo, no creo que esto proporcione ningún tipo de resolución para este debate ...

Direcciones de flujo usando DEM no proyectado

ingrese la descripción de la imagen aquí

Direcciones de flujo usando DEM proyectado

ingrese la descripción de la imagen aquí

Entiendo que la comparación visual no es 100% científica, pero puede ser un buen punto de partida.

En consecuencia, había una diferencia entre el punto de fluidez y la forma en que se ajustaba para cada ejecución. Y, hubo una diferencia definitiva en las cuencas hidrográficas derivadas dada la forma en que la herramienta de ajuste del punto de fluidez decidió ajustar en función de los respectivos conjuntos de datos proyectados / no proyectados. La cuenca hidrográfica que se muestra en verde es la cuenca hidrográfica derivada utilizando el DEM proyectado y los datos derivados de elevación derivados derivados posteriores. La cuenca hidrográfica que se muestra en el contorno morado es la cuenca derivada utilizando los datos DEM no proyectados.

La cuenca

ingrese la descripción de la imagen aquí

Me he encontrado con estos otros dos hilos del foro SIG (enlaces a continuación) que discuten este tema en los antiguos foros de ESRI, pero todavía no tengo claro cómo funciona la herramienta de Dirección de flujo en relación con los datos proyectados y no proyectados (entiendo sin embargo, el concepto de flujo hidrológico y dirección del flujo). Si cada celda aún tiene el mismo valor de elevación en un DEM proyectado frente a un DEM no proyectado (¿es esto correcto?), ¿Por qué hay una diferencia en un ráster de dirección de flujo derivado de los datos proyectados versus uno derivado de los datos de DEM en NAD83?

http://forums.esri.com/Thread.asp?c=93&f=995&t=292503

http://forums.esri.com/Thread.asp?c=93&f=995&t=290652

Además, ¿alguna diferencia teóricamente sería menos problemática si se delinean en una latitud más alta, como el Parque Nacional Shenandoah en Virginia, en lugar de hacer delineaciones en el estado de Texas?

Hablé con un experto en cartografía que pensó que la distorsión este-oeste que obtienes al alejarte del ecuador podría ser un problema (como en algunos mapas, Canadá está extremadamente hinchado y distorsionado), en eso si eres más que A 10 grados de latitud del ecuador, pensaron que los datos proyectados son el camino a seguir si le preocupa la precisión.

Una gran incógnita es el nivel de incertidumbre con las cuencas delineadas utilizando datos no proyectados que estamos tratando de manejar. Hay una diferencia, pero ¿cuál es la magnitud?

Gracias a cualquiera que pueda proporcionar una respuesta directa a esta discusión, o simplemente alguna información útil sobre esto.

Editar

El problema principal que nos interesa / preocupa es si habrá problemas de precisión con las cuencas delineadas como resultado de comenzar el proceso utilizando un DEM no proyectado.

Entonces, si entiendo la respuesta, las cuencas delineadas deberían estar bien en términos de representar el área de drenaje para un punto de fluidez. Sin embargo, parece que si las direcciones de flujo son incorrectas, se producirá algún error en la cuenca final delineada.

Este es un tema muy interesante y realmente importante: aún no he visto un informe o documentación que indique que está bien usar datos proyectados por la ONU para delinear cuencas hidrográficas. A través de las conferencias técnicas de la Conferencia de usuarios de ESRI dirigidas por el ingeniero desarrollador principal de la extensión Spatial Analyst (que alberga las herramientas de hidrología), me dijeron que también debería usar una proyección de área igual (como área igual de Albers).

Además, no parece haber ningún estándar autoritativo de "biblia" sobre cómo hacer esto, solo parece que es un enfoque de facto casi reconocido para proyectar los datos antes de calcular sus derivadas de elevación.

En ninguna parte he podido encontrar una respuesta concisa y directa sobre cómo esto afecta el cálculo de la dirección del flujo y, posteriormente, la delineación de una cuenca hidrográfica.

Y, si termina trabajando con cuencas hidrográficas delineadas utilizando datos DEM no proyectados y luego proyecta esas cuencas hidrográficas, ¿no está la inexactitud todavía allí (por ejemplo, en términos de determinar un área de cuenca hidrográfica o alguna otra característica, como proporciones de cobertura del suelo, etc.)?

Además, supongo que proyectar un ráster de dirección de flujo derivado de un DEM no proyectado tampoco corrige los errores ya que los datos de origen no se proyectaron ...

gracias - apreciamos cualquier idea adicional que pueda proporcionar

EDITAR - 20110331

@whuber:

Gracias por esta extensa discusión. Hemos estado investigando este problema más y hemos encontrado algunas referencias que sugieren que en realidad es mejor no proyectar el DEM antes de obtener el directorio de flujo, la acumulación de flujo y la delineación.

Una respuesta por correo electrónico de una fuente anónima (pero que es una persona bastante respetable), cuando se planteó la pregunta de 1.) proyecto DEM 2.) producir derivados O 1.) producir derivados 2.) el proyecto DEM dijo:

En pocas palabras, depende de la derivada. Para las derivadas continuas que se visualizarán, debe derivar y luego proyectar; esto reduce el riesgo de que los artefactos de límite de mosaico sean mejorados o introducidos (por el algoritmo de proyección) y luego pasen a la derivada si proyectara el DEM primero. La excepción a esto es cuando también usa la distancia o el área como base para el cálculo de la derivada. Por supuesto, esto es relativo a cuán grandes son las distancias / áreas y qué tan lejos puede alejarse del ecuador de manera aceptable. Así que imagine que para derivados como pendiente o sombreado, que dependen del tamaño de la celda, hay consecuencias. Estas derivadas serán más precisas en el ecuador, y la precisión se degradará significativamente más allá de los 60 grados norte o sur. En ambos casos, supongo que el DEM cubre un área muy grande (más ancha que 1,5 zonas UTM) y un enfoque tradicional basado en mosaicos donde los mosaicos son arbitrarios o se ajustan a los estándares existentes, como los límites de las hojas cuádruples de USGS. Entonces, decir que la implicación es que gran parte de este pensamiento es anterior a los datasets de mosaico, sobre los cuales no puedo comentar. La principal preocupación para mí sería querer saber qué tan bien coinciden los mosaicos DEM. Si están bien emparejados (como NED), entonces espero que las cosas funcionen bien, con derivados derivados de mosaicos (como funciones aplicadas al dataset de mosaico) y luego se muestran sobre la marcha. Si no coinciden bien, entonces la basura entra, la basura sale. Volviendo a su pregunta original, creo que si solo se trata de límites de cuenca,

Continuaron diciendo:

La razón por la que me apegaría a la metodología no proyectada es porque estamos usando rásteres que son en sí mismos un derivado de DEM (que generalmente no tenemos, pero pensamos en la nube de puntos LiDAR). Para los rásteres que cubren áreas muy grandes, como los continentes con niveles de resolución relativamente finos, proyectar a algo como Albers resultará en la pérdida o introducción de información, cuando el ráster usa celdas de tamaño regular (como lo hacen los rásteres de Esri). Eso significa que herramientas como la acumulación de flujo producirán resultados basados ​​en información parcial o interpolada. Básicamente, todos los algoritmos de proyección aplicados a los rásteres causarán problemas tan pronto como haya una expansión o contracción de más de la distancia de un ancho de píxel (proyecciones como Albers pueden introducir errores al introducir nuevos píxeles entre dos viejos). Derivar de estos significa que el potencial de error acumulativo es alto.

Esto parece sugerir lo contrario: que la proyección introduce más ruido, a menos que supere los 60 grados de latitud.

También hemos encontrado algunas fuentes publicadas que han sugerido que un enfoque no proyectado es aceptable para cuencas hidrográficas más pequeñas (últimos 2 párrafos de la sección 1.6) de Distributed Hydrologic Modeling for GIS (Vieux, 2004): http: //www.springerlink. com / content / x877238532533g20 / fulltext.pdf

Entonces, al final, se reduce a una cuestión de 1.) donde estás trabajando en la superficie de la tierra 2.) la escala en la que estás trabajando, y 3.) si el ruido introducido por una proyección eso preservará mejor los atributos que afectan el algoritmo de dirección del flujo es menor que la distorsión introducida por los datos no proyectados (el beneficio aumenta a medida que avanza hacia los polos) para determinar si debe proyectar algo como conforme, o si no importa.

Cuando comienzas a profundizar en este tema, parece que el consenso más amplio es proyectar, pero hay algunos que parecen decir que no es una regla difícil y rápida.

oro turco
fuente
¿Las diferencias entre proyectado / no proyectado son mayores cuando se trabaja en una latitud realmente alta?
Kirk Kuykendall
@usuario Si tiene una buena ilustración y aún no tiene la reputación de publicarla, hágalo disponible en la Web y proporcione la URL. A menudo, un moderador lo convertirá en una imagen incrustada en su nombre. (Sin embargo, esta es una pregunta tan interesante que espero que adquiera rápidamente la reputación necesaria a través de votos positivos solo en la pregunta. :-)
whuber
1
No estoy de acuerdo con algunas de las conclusiones de 20110331. (1) es correcto; (2) es irrelevante; (3) es correcto, pero creo que se basa en la incomprensión de lo que hacen las proyecciones y cómo funcionan. La proyección per se no "introduce ruido" pero el método de remuestreo sí. Sin embargo, eso se puede controlar y limpiar, por lo que AFAIC no es un problema cuando haces las cosas bien. El consejo que cita es generalmente bueno, pero sucumbe a una percepción errónea que tuve antes de llevar a cabo el análisis en mi respuesta: incluso cuando "solo son límites de cuenca", puede importar si se proyecta o no.
whuber
1
(Continuación) Estoy de acuerdo en que no hay "reglas estrictas" aquí, pero definitivamente hay principios y hay una buena base para un análisis cuantitativo para tomar decisiones de procesamiento informadas y efectivas para cualquier conjunto de datos y objetivo de investigación. Traté de mostrar esos principios en la edición de mi respuesta. Al final los principios se mantendrán firmes; si los comprende, debe confiar en ellos y en su propio pensamiento, no en ninguna autoridad o "consenso".
whuber

Respuestas:

19

Tiene razón en que las distorsiones en la proyección pueden sesgar las estimaciones de la dirección del flujo (y la acumulación del flujo). (Usar datos "no proyectados" equivale a usar la proyección de Plate Carree altamente distorsionante).

Sin embargo, para delinear simplemente las cuencas, en realidad hay un pequeño problema: aunque las direcciones de flujo y las cantidades de flujo serán incorrectas, la proyección no hará que el agua parezca fluir hacia áreas a las que no va. Cuesta abajo sigue cuesta abajo.

Mediante ejemplos simples, no es difícil ver de dónde proviene el sesgo . Considere dos puntos separados 141 metros, uno al noreste del otro e inmediatamente en pendiente. La dirección del flujo, por lo tanto, se debe al noreste. En coordenadas, el punto de descenso está desplazado 100 metros en la dirección xy 100 metros en la dirección y. Si está en (digamos) latitud 60 grados utilizando datos no proyectados, los desplazamientos se verán en realidad como 200 metros en la dirección xy 100 metros en la dirección y. (200 = 100 / cos (60).) Eso se traduce en un rumbo de 63 grados al este del norte en lugar de 45 grados. En muchos algoritmos de dirección de flujo / acumulación de flujo / delineación solo son posibles 8 direcciones cardinales. Por lo tanto, en lugar de indicar un flujo noreste, la cuadrícula podría cambiar esto a un flujo debido hacia el este.

(Los 63 grados se calculan trigonométricamente en función de la distorsión relativa en la proyección entre la dirección de la distorsión máxima y la dirección de la distorsión mínima. Esto comienza a cuantificar el efecto del uso de datos no proyectados).

Una buena manera de visualizar esto es dibujar las 8 direcciones de la brújula correctamente en una hoja de goma. Estire la goma hacia los lados (con más estiramiento para latitudes más altas): cuanto más se estira, más las flechas tienden a apuntar de este a oeste. En esas direcciones, los ángulos se reducen, mientras que hacia el norte y el sur se expanden. Mientras tanto, las elevaciones en la cuadrícula permanecen sin cambios. El resultado es que tanto la pendiente como el aspecto de la tierra están distorsionados, porque dependen de la tasa de cambio de elevación con respecto a las coordenadas posicionales .

direcciones cardinales

Direcciones distorsionadas

Debido a esto , en realidad habrá más problemas en Virginia que en Texas. Su cartógrafo es correcto . (Sin embargo, no sé de dónde proviene el límite de 10 grados. Suena razonable, pero las reglas generales como esta deben evaluarse a la luz de sus requisitos de precisión. En algunos casos puede escapar sin proyección y en otros usted podría querer mucha más precisión).

La mayoría de estos problemas se vuelven irrelevantes cuando adopta un flujo de trabajo adecuado. Comience proyectando sus datos con la mejor proyección conforme que pueda encontrar (porque no hay distorsiones de los ángulos relativos). Calcular el flujo y cualquier otra cosa que involucre la información de dirección Luego, desproyecte (o reproyecte) los resultados de vuelta a cualquier sistema de coordenadas que desee usar para el análisis o mapeo de seguimiento. Por ejemplo, para calcular áreas de las cuencas delineadas, reproyecte con una proyección de área igual. El punto es que la reproyección es lo suficientemente simple como para que pueda permitirse, y debería, cambiar las proyecciones según sea necesario para acomodar los cálculos y el mapeo que está realizando : no está atrapado en una sola proyección de compromiso.

Editar

Una adición a la pregunta original se centra en la delineación de cuencas hidrográficas. Abordemos esto. Para hacerlo, necesitamos entender cómo se estiman las direcciones de flujo.

El método ArcGIS para calcular pendientes y aspectos está documentado :

La dirección del flujo está determinada por la dirección del descenso más pronunciado desde cada celda.

Específicamente, deje que x [0,0] designe el valor en una celda y deje que x [i, j] designe el valor en las columnas de la celda i a la derecha y j filas debajo. Además de algunos casos especiales relacionados con sumideros y lazos de resolución, el algoritmo selecciona la mayor de las ocho estimaciones de pendiente direccional (x [0,0] -x [i, j]) / Sqrt [i ^ 2 + j ^ 2] donde | i | <= 1 y | j | <= 1 y supone que esa es la dirección del flujo. Estos números son razones: los numeradores son diferencias en la elevación y los denominadores son distancias calculadas a través del teorema de Pitágoras en cualquier coordenada que esté en uso.

Al volver a proyectar la cuadrícula, suceden dos cosas: (1) las celdas se mueven (y se distorsionan cuando esto sucede) y, por lo tanto, (2) los valores de la cuadrícula (elevaciones) se vuelven a muestrear en la red de celdas para la nueva cuadrícula. Pueden ocurrir pequeños cambios en la elevación debido al remuestreo y esto podría inducir cambios ocasionales en la dirección estimada del flujo. Típicamente, tales cambios deberían ser raros, así que ignorémoslos. Estos cambios serán eclipsados ​​por los cambios inducidos por distorsiones métricas en la reproyección. Por ejemplo, al volver a proyectar desde Plate Carree (esencialmente un sistema de coordenadas geográficas) a una proyección conforme, la dirección este-oeste se reducirá por el coseno de la latitud. En el espacio (a lo largo de una fila) donde una celda solía encajar, las celdas 1 / cos (latitud) ahora tienen que encajar. Esto típicamente aumentarácualquier estimación de pendiente aparente en cualquier dirección que tenga un componente este-oeste (es decir, las direcciones NE, E, SE, SW, W y NW). Mientras que antes tales pendientes podrían no parecer las más grandes y, por lo tanto, no fueron seleccionadas por el algoritmo ArcGIS, al hacerse más grandes ahora podrían seleccionarse como la dirección del flujo. En consecuencia, en muchos lugares, una dirección de flujo norte o sur se convertirá en NE, NW, SE o SW, y una dirección NE podría convertirse en E, etc.

Los efectos de cualquier reproyección se pueden predecir utilizando un cálculo similar: debe conocer las distorsiones direccionales que ocurren al pasar de una a otra.

Consideremos lo que significa "estar en la cuenca" de un "punto de fluidez" x . Acordemos que cualquier ubicación y "se encuentra en la cuenca de x " significa que si la superficie estuviera desnuda, sin fricción, impermeable y lisa, y si el agua fluyera sin dispersarse (flujo puramente advectivo), entonces fluiría de y a x . De todos modos, eso es lo que hace el SIG al calcular la acumulación de flujo (que está en el corazón de la delineación de cuencas hidrográficas).

En la mayoría de las ubicaciones, cuando el punto de fluidez x se encuentra a lo largo de un lecho de la corriente , las distorsiones de la reproyección no hacen una diferencia esencial: hacen que cambie la ruta de flujo aparente de y a x , pero finalmente el agua llega al mismo lecho de la corriente de todos modos, aunque quizás por una ruta ligeramente diferente. Si se produce cualquier discrepancia, que debe ser porque ya sea (a) la trayectoria de flujo llega más gradiente abajo a lo largo de la corriente de x (y así y ya no se considera que en la cuenca de x ), (a ') los puntos y' que fluía en puntos aguas abajo de x ahora fluye hacia x(y ahora están incluidos en la cuenca de x ) o (b) la nueva ruta de flujo pasa a una corriente diferente (que es realmente un caso especial de (a) y (a ')). La primera (a y a ') puede suceder mucho, pero creará diferencias principalmente para los puntos de fluidez a lo largo de los segmentos de la corriente, no dentro de partes de cuencas hidrográficas bordeadas por corrientes confluentes. El segundo cambio puede ocurrir cada vez que una ruta de flujo se ejecuta cerca de un espacio en una cresta. Mientras que en una proyección podría haberse dirigido a un lado de la brecha, en otro podría, debido a las ligeras diferencias en la distorsión, dirigirse al otro lado. Sospecho que esto es relativamente raro y debería afectar principalmente a pequeñas cuencas secundarias a lo largo de la periferia de cualquier cuenca hidrográfica importante.

Por lo tanto, en última instancia, la naturaleza cualitativa de la estructura de la cuenca hidrográfica debería cambiar poco, pero cuantitativamente (en términos de área relativa) podría cambiar notablemente tras la reproyección.

¿Qué hacer entonces? Si está atascado con este algoritmo de solo ocho direcciones, la clave es obtener las direcciones relativas correctas. Por definición, esto requiere el uso de una proyección conforme, o al menos una que esté muy cerca de la conformidad. Pero, debido a que las proyecciones conformales no pueden ser (exactamente) de área igual, para el trabajo de área grande no desea usar proyecciones conformales para calcular áreas de cuencas hidrográficas. La solución es lo que propuse originalmente:

  • Calcule las direcciones de flujo y delinee las cuencas hidrográficas utilizando una proyección conforme.

  • Calcule las áreas (y el porcentaje de cobertura del suelo, etc.) de las cuencas hidrográficas delineadas utilizando (por supuesto) una proyección de área igual.

(Tenga en cuenta que esto no garantiza cálculos precisos de acumulación de flujo . Esos requieren buenas estimaciones de las áreas y al mismo tiempo obtener las direcciones correctas del flujo. Un enfoque es reconocer que tanta incertidumbre, falsificación y suposición están llegando a este punto de que podríamos estar dividiendo pelos. Otro enfoque, que vale la pena considerar al hacer cálculos a nivel de continente, es que uno puede hacer acumulaciones de flujo en una proyección conforme pero ajustar las entradas (la cantidad de "lluvia" que cae en la cuenca ) según la distorsión de área. Esto es más fácil de lo que parece cuando se usan proyecciones conformales simples como Mercator o Stereographic, donde la distorsión de área es fácil de calcular matemáticamente.

Para los cálculos de área pequeña, siempre existen proyecciones que están tan cerca de ser conforme e igual área que no tiene que molestarse en usar dos proyecciones (por ejemplo, para áreas que se ajustan dentro de una sola zona UTM, use las coordenadas UTM). Esto realmente importa para las áreas de estudio que son del tamaño de un estado o país o continente.

Debido a que un GCS está razonablemente libre de distorsión solo cerca del ecuador (donde (lat, lon) es aproximadamente conforme e igual área), una buena regla general es no hacer sus cálculos de cuadrícula en coordenadas lat-lon .

Todavía no he cubierto todos los matices (por ejemplo, se producirán pequeños cambios casi aleatorios en las direcciones de flujo estimadas cuando gire uniformemente una cuadrícula, excepto por múltiplos de 90 grados, pasé por alto toda discusión sobre sumideros y áreas planas, y no tengo No mencioné algoritmos alternativos (no ArcGIS), pero espero que este análisis ayude a aclarar los aspectos clave de la situación.

whuber
fuente
por favor vea mi respuesta adicional en mi publicación original, gracias!
turkishgold
¿Cuándo es la ceremonia de la mejor respuesta? ¡Voy a votar por eso!
julien