¿Del polígono a la medida continua de la diversidad?

11

Ante todo; He tratado de encontrar una pregunta similar, sin éxito. Tal vez sea porque soy bastante nuevo en SIG y realmente no sé exactamente qué estoy buscando. Si alguien me señala un problema similar, me encantaría eliminar esta publicación.

Necesito crear una variable 'continua' o ráster (en celdas de cuadrícula pequeñas) de diversidad de población para un país determinado. Tengo un archivo shape que muestra la propagación de los grupos étnicos en los polígonos (fig. 1), y el resultado que estoy buscando es el 'indicador medio de diversidad' en cada una de las unidades administrativas (AU, en este caso, el 360 distritos electorales nigerianos).

Fig.1 - Polígonos de grupos de población

Fig 1. Polígonos de grupos de población en Nigeria

La solución que se me ocurrió fue obtener el porcentaje de área de cada polígono en cada AU, y calcular un índice de heterogeneidad a partir de eso. Pero el problema es que estaría dejando de lado mucha información debido a la distribución de las unidades administrativas. Como se muestra en la fig. 2, los cuadrados 'a', 'b' y 'c' tendrían el mismo 'índice de segregación', pero está claro que no están en la misma posición frente a los 'puntos calientes'.

Figura 2

Figura 2.

Así que pensé que otras soluciones podrían ser crear un mapa de cuadrícula y calcular la distancia al borde más cercano, pero nuevamente compartir solo un borde no es lo mismo que estar en la parte central del mapa, donde varios grupos viven juntos.

Después de encontrar esta pregunta , supongo que los polígonos podrían transformarse en puntos usando sus centroides, y luego aplicar el mismo método. Pero la verdad es que soy nuevo en esto, y esa pregunta no está realmente claramente respondida. ¿Cómo pude hacer tal cosa?

Usando otro ejemplo, quiero crear algo como esto (imágenes de este sitio web ):

1 2

Dada la distribución de algunos puntos con diferentes características cualitativas , obtenga una medida de la diversidad a partir de la cual pueda estimar la "heterogeneidad media" de cada unidad administrativa.

¿Cómo podría hacerlo? Uso R y QGIS, así que no me importa en qué plataforma se base la solución.

Fran Villamil
fuente

Respuestas:

5

¡Realmente le daría una oportunidad a SpatiaLite para hacer esto! Lo más conveniente es que pueda usar el complemento QSpatiaLite en QGIS.

Simplemente configure una cuadrícula de polígono con un tamaño razonable para las celdas de cuadrícula. Luego, interseque la cuadrícula con el polígono del grupo étnico y calcule el área de cada intersección. ¡Con la tabla resultante puede calcular sus índices utilizando las áreas de intersección, que son áreas de grupos étnicos en cada celda de la cuadrícula, como 'métrica de abundancia' (así es como lo llamaría un ecólogo)!

Asumiendo que su capa de grupos étnicos se llama 'EthnicGroups', con un campo 'group' y la polígono-grid se llama 'Grid' con un campo 'ID', se aplicaría esta consulta SQL:

SELECT 
  g.ID AS gID, 
  e.group AS egr,
  AREA(INTERSECTION(e.geometry, g.geometry)) AS egr_area
FROM Grid AS g JOIN EthnicGroups AS e 
ON INTERSECTS(g.Geometry, e.Geometry)
ORDER BY gID, egr_area ASC

Para calcular las métricas de diversidad con fórmulas especiales, usaría R, colapsando estas 'abundancias', obteniendo un valor para cada celda de cuadrícula, ¡que finalmente podría unirse a sus geometrías de cuadrícula!

Para obtener su diversidad media para cada AU, podría utilizar los índices de diversidad que ha unido a la cuadrícula. Nuevamente, usando SpatialLite agrupando los valores dentro de los polígonos AU con la aplicación de la función media.

Es curioso que recientemente haya escrito una publicación de blog que cubra este tema, que podría darle una idea: http://thebiobucket.blogspot.co.at/2014/12/usecase-find-dominant-species-and.html

En lo que a mí respecta, aconsejaría omitir la idea de 'continuidad' en este sentido, porque la diversidad solo es significativa en relación con la unidad espacial en la que se basa. Así que creo que todos los enfoques y técnicas sofisticadas que utilizan cualquier tipo de promedio o interpolación sobre otras unidades que no sean las unidades espaciales en las que se basan sus índices, no agregarán nada valioso, ¡sino que oscurecerán el resultado!

Aquí hay un mapa que muestra la diversidad de anfibios (en lugar de étnicos;) para la cual he usado el mismo método: ingrese la descripción de la imagen aquí

ps: ¡ Este enlace puede ser de interés si desea obtener diversidad dentro de un radio de búsqueda dado!

Kay
fuente
4

En QGIS, puede generar una cuadrícula de puntos en la parte superior de sus polígonos. Encontrará esta función en Vector -> Herramientas de investigación (creo que se llama así en inglés, mi versión de QGIS está en otro idioma). Tendrá que encontrar una granularidad razonable cuando se trata del espaciado de la cuadrícula de puntos.

Luego, en el menú Vector, realiza una unión de atributos por ubicación (que se encuentra en Gestión de datos), utilizando los puntos como objetivo y los polígonos de origen étnico como fuente.

Ahora tiene una cuadrícula de puntos con un atributo de origen étnico para cada punto.

Aquí es donde se pone un poco complicado. Puede generar un ráster utilizando estos puntos, si vuelve a codificar su atributo en un valor numérico (por ejemplo, utilizando la herramienta Crear campo numérico equivalente en la caja de herramientas de procesamiento QGIS). Luego puede usar Crear cuadrícula en Ráster -> Análisis. Aquí podría experimentar con el análisis de la media móvil o del vecino más cercano. Luego, podría usar las estadísticas zonales (hay varias opciones en la caja de herramientas Procesamiento, así como en el menú ráster).

El truco es cómo obtener el índice de heterogeneidad mientras se ignora el valor arbitrario creado al recodificar los atributos en un índice numérico, pero es posible que tenga alguna idea propia aquí. No estoy seguro de cómo hacerlo sin tomar demasiado tiempo de lo que se supone que estoy haciendo en este momento :)

Otra idea es cargar su cuadrícula de puntos en una base de datos de Spatialite (o PostGIS, pero esa es una operación más grande para ejecutar). Luego, podría usar SQL y funciones espaciales en la base de datos para probar, por ejemplo, todos los puntos dentro de un radio establecido de cada punto a darle un índice de varianza local y luego generar un ráster a partir de ese valor. Trabajé un poco con esto recientemente.

¡Espero que esto te dé algunas ideas! Siéntase libre de usar los comentarios si desea discutir más a fondo.

hexamon
fuente
¡¡Muchas gracias!! Voy a tratar de resolverlo y volveré a usted si tengo más problemas (seguro que lo haré).
Fran Villamil
2

Hay una serie de suposiciones en su pregunta que deben abordarse antes de llegar a la pregunta de implementación. El ejemplo que proporciona es un análisis de biodiversidad que se basa en una muestra de variedades de una especie de planta dada. Miré el manual del software que se utilizó para generar este ráster, y no hay indicios de que esto sea apropiado o se haya aplicado a las poblaciones humanas. El centroide de un área cultural humana (que propone utilizar para su análisis) no es de ninguna manera análoga a una muestra (es decir, observación real) de una colección de plantas.

La proximidad de los subgrupos humanos (divididos a lo largo de cualquier dimensión, aquí la dimensión es el origen étnico) puede expresarse como una medida de diversidad o una medida de segregación. Una medida de diversidad ampliamente utilizada es el índice Herfindahl , que varía de 0 a 1 y es pequeño cuando un área tiene muchos grupos pequeños y grande cuando un área tiene muchos grupos grandes. Se calcula dentro de una población o área sin referencia a nada fuera de esa población o área. Esto es problemático ya que está interesado en la interacción espacial a través de los límites administrativos.

Una medida de segregación ampliamente utilizada es el índice de disimilitud , que varía de 0 a 1 y es pequeño cuando las subáreas tienen la misma distribución de población que la región mayor, y grande cuando las subáreas son exclusivamente de un grupo u otro. Por lo general, se calcula dentro de una región para la cual hay información demográfica disponible para muchas subáreas (por ejemplo, puede calcular el índice de disimilitud en blanco y negro para el área metropolitana en función de los datos demográficos de todas las secciones del censo dentro del área metropolitana). Wong (2002) ha modelado localsegregación calculando el índice de disimilitud para cada subárea en función de la población de subáreas vecinas (es decir, contiguas) en lugar de la región en su conjunto. Una limitación de esta medida es que solo puede funcionar para dos grupos a la vez. Sin embargo, lo he usado en mi propia investigación al usar los dos grupos más poblados dentro de cada zona de vecinos.

Ha indicado que desea calcular la diversidad para cada unidad administrativa (AU). Pero también dice que necesita crear una trama continua de diversidad. No me queda claro si realmente quieres una trama continua de diversidad o si crees que lo necesitas para calcular la diversidad de AU. Si realmente desea una diversidad continua, recomendaría echar un vistazo a O'Sullivan & Wong (2007) , que visualiza la diversidad continua utilizando un estimador de densidad del núcleo. Esto tiene el efecto de contabilizar la interacción de la población a través de los límites administrativos, que usted indica que desea.

OTOH, si realmente desea diversidad por unidad administrativa, puede hacerlo utilizando el índice Herfindahl o el índice local de disimilitud. Pero eso requiere información sobre las características demográficas dentro de cada AU. Supongo que la razón por la que está utilizando el mapa de áreas étnicas es porque no tiene datos de población étnica para las UA. Pero si conoce la población de cada UA y la intersecta con la cuadrícula de áreas étnicas, puede asignar la población de UA a las áreas étnicas. La suposición importante con esta y las otras respuestas propuestas hasta ahora es que suponen que la densidad de población es constante en la UA o en el área étnica. Esta suposición parece prima facie inverosímil, pero conoce los datos mejor que yo, y puede sentirse cómodo con esta suposición.

Según mi comprensión de sus objetivos, creo que mi enfoque sería el siguiente:

  1. Modele la población dentro de las subunidades donde las subunidades pueden ser la intersección de las UA y las áreas étnicas, o un vector o una cuadrícula de trama. Dado el tiempo suficiente, me gustaría probarlo en ambos sentidos.
  2. Calcule el índice de Herfindahl para cada AU, pero, siguiendo a Wong (2002), calcularía el índice de Herfindahl en función de la vecindad de cada AU en lugar de solo la población dentro de la AU. Con el tiempo suficiente, experimentaría con vecindarios basados ​​tanto en contigüidad como en distancia.

Por supuesto, nada de esto llega a la implementación técnica, pero si me das algún comentario sobre esto, podemos continuar desde allí.

PD: Los trabajos académicos con los que me vinculé están cerrados. Si OP no tiene acceso a una biblioteca académica, no dude en ponerse en contacto conmigo por correo electrónico y se los proporcionaré.

Lee Hachadoorian
fuente
+1 ¡Quizás no sea técnicamente detallado, pero sigue siendo muy útil e informativo!
Joseph