Herramientas de estadísticas espaciales: análisis de agrupamiento en datos ráster

9

Tengo un problema aparentemente simple, pero no puedo encontrar una metodología clara para usar.

Tengo la tarea de delimitar "áreas urbanas" por polígonos convexos vectoriales, utilizando el conjunto de datos de la Población del Mundo Cuadrícula de CIESIN

Este conjunto de datos proporciona valores de densidad de población en todo el mundo, como un archivo ráster. El problema es, como ya lo ha adivinado, que los valores de densidad están cambiando mucho y que la definición de "urbano" es bastante relativa.

Intenté usar un enfoque clásico y calculé las pendientes como si los valores de densidad fueran altitudes, pero los valores de las pendientes también eran muy dispares y espacialmente complejos, intrincados.

He examinado algoritmos de agrupamiento espacial, herramientas LISA (Local Indocators of Spatial Association), con ArcGIS y GeoDa, pero estoy bastante perdido entre herramientas muy específicas. Algunos de los métodos solo funcionan en formas vectoriales, por lo que se necesita una reclasificación y una vectorización (cálculo largo).

¿Me pueden ayudar a refinar el conjunto de métodos y herramientas para usar? Gracias !

Laurent Jégou
fuente
2
¿Cuál es exactamente su definición de "urbano"? Por cierto, no esperaría que todas las áreas urbanas sean descritas adecuadamente por polígonos convexos . Muchos tienen formas controladas por características geográficas (montañas, costas y ríos) que son altamente no convexas.
whuber
La definición no se da, no es una constante. Creo que el objetivo es encontrar áreas sustancialmente más densas con respecto a su entorno, que varía. Entonces, la idea sobre estadísticas espaciales y LISA. Tienes razón acerca de la convexidad, debería haber escrito "no auto-intersectando y no intersectando otros polígonos".
Laurent Jégou
Como complemento, encontré un módulo R completo dedicado a las herramientas de aglomeración espacial: spdep.
Laurent Jégou

Respuestas:

4

Trabajé un poco en esto para mi maestría http://ian01.geog.psu.edu/papers/mscthesis.pdf , básicamente trabajé en los cambios de gradiente, pero la discusión puede ayudarte con esto.

Ian Turton
fuente
Gracias, lo leeré pronto, pero eso es prometedor :-)
Laurent Jégou
He probado el método de la segunda derivada Sobel doble que describe en la tesis, en una zona de prueba limitada, ¡y es muy interesante! Los núcleos urbanos claros están aislados, a pesar de tener valores de densidad muy diferentes. Muchas gracias :) Por cierto, utilicé un software gratuito y de código abierto para calcular las circunvoluciones y las matemáticas de trama: Opticks.
Laurent Jégou
Una medida de luz artificial sería un buen indicador de las condiciones urbanas. Una búsqueda en Google debería encontrar ejemplos de estudios.
b_dev
@indiehacker: lo miré pero depende culturalmente, Francia, por ejemplo, es mucho más oscura que el Reino Unido.
Ian Turton
6

Desde el punto de vista de la densidad de población, un "área urbana" generalmente debería satisfacer solo unos pocos criterios axiomáticos :

  1. Su límite no debe incluir ningún punto de densidad (relativamente) alta en comparación con la densidad máxima dentro de su interior.

  2. Debe estar simplemente conectado (sin "agujeros").

  3. Su densidad de población promedio debe exceder algún umbral preespecificado.

El axioma (1) es el más natural: si un punto límite tuviera una alta densidad, simplemente moveríamos el límite hacia afuera para incluir ese punto dentro del área urbana. Me gustaría sugerir que "relativo" significa una proporción del máximo , como una décima o centésima o lo que sea. Axiom (2) evita excluir parques y otras regiones de baja densidad que ocurren naturalmente en las ciudades. Axiom (3) , que debido a que depende de un umbral es algo arbitrario, elimina las aldeas pequeñas y compactas.

En realidad, hay al menos otro elemento de arbitrariedad: cualquier mapa cuadriculado de densidad de población promedia implícitamente poblaciones sobre vecindarios locales (igual a una celda en algunos casos e igual a un radio de grano para estimaciones de densidad de grano). Aceptemos este tamaño de vecindario implícito (que se puede cambiar ejecutando primero los medios focales u otros ajustes del núcleo sobre el mapa de densidad original), este umbral de población y la sensación de "relativamente alto" en el axioma 1 como parámetros configurables por el usuario que controlan resultado.

Estos axiomas conducen naturalmente a un algoritmo bastante simple : uno debe ubicar los máximos locales, buscar en sus vecindarios hasta que se encuentre un límite que satisfaga el axioma (1), rellene los agujeros para satisfacer el axioma (2) y luego examine todas las áreas candidatas. de acuerdo con (3). Esto se hace de la siguiente manera:

  1. Opcionalmente, alise el mapa de densidad.

  2. Realice un algoritmo de "relleno" en un mapa relacionado con la densidad (ver más abajo).

  3. Región Agrupe el resultado.

  4. Eliminar agujeros de los polígonos agrupados por región.

  5. Realice sumas zonales de la densidad de población sobre los polígonos rellenos.

  6. Elimine cualquier polígono que tenga sumas (o densidades medias) por debajo del umbral de población (densidad).

Lo que queda es tu solución.

Permítanme decir un poco más sobre el paso (1), que es clave. Un algoritmo de relleno identifica "sumideros" y "los llena" hasta una cantidad constante por encima de sus elevaciones. Esto es exactamente lo que Axiom (1) nos pide que hagamos, siempre que (a) podamos hacer que "hundirse" desempeñe el papel de "máximo local" y (b) hacer que "cantidad constante por encima de" desempeñe el papel de " fracción constante de". " La forma de hacerlo es rellenando el logaritmo negativo de la densidad.en lugar de la densidad en sí. (Agregue una pequeña constante a la densidad, por ejemplo, alrededor de 0.1 personas por kilómetro cuadrado, antes de tomar el registro, para que las celdas que contienen ceros no causen problemas). Los "lagos" en la densidad de registro negativa identifican al candidato Areas urbanas. Todavía tiene tres parámetros independientes para jugar (ingresando en los pasos 0, 1 y 5); configurarlos requerirá un poco de reflexión sobre lo que realmente quiere decir con "área urbana", así como algo de experimentación.

whuber
fuente
Gracias por tu respuesta detallada. Trataré de encontrar las herramientas de software adecuadas (o programarlas) para probar el algoritmo de relleno con el registro negativo, eso parece una buena pista.
Laurent Jégou