Ante todo; He tratado de encontrar una pregunta similar, sin éxito. Tal vez sea porque soy bastante nuevo en SIG y realmente no sé exactamente qué estoy buscando. Si alguien me señala un problema similar, me encantaría eliminar esta publicación.
Necesito crear una variable 'continua' o ráster (en celdas de cuadrícula pequeñas) de diversidad de población para un país determinado. Tengo un archivo shape que muestra la propagación de los grupos étnicos en los polígonos (fig. 1), y el resultado que estoy buscando es el 'indicador medio de diversidad' en cada una de las unidades administrativas (AU, en este caso, el 360 distritos electorales nigerianos).
Fig 1. Polígonos de grupos de población en Nigeria
La solución que se me ocurrió fue obtener el porcentaje de área de cada polígono en cada AU, y calcular un índice de heterogeneidad a partir de eso. Pero el problema es que estaría dejando de lado mucha información debido a la distribución de las unidades administrativas. Como se muestra en la fig. 2, los cuadrados 'a', 'b' y 'c' tendrían el mismo 'índice de segregación', pero está claro que no están en la misma posición frente a los 'puntos calientes'.
Figura 2.
Así que pensé que otras soluciones podrían ser crear un mapa de cuadrícula y calcular la distancia al borde más cercano, pero nuevamente compartir solo un borde no es lo mismo que estar en la parte central del mapa, donde varios grupos viven juntos.
Después de encontrar esta pregunta , supongo que los polígonos podrían transformarse en puntos usando sus centroides, y luego aplicar el mismo método. Pero la verdad es que soy nuevo en esto, y esa pregunta no está realmente claramente respondida. ¿Cómo pude hacer tal cosa?
Usando otro ejemplo, quiero crear algo como esto (imágenes de este sitio web ):
Dada la distribución de algunos puntos con diferentes características cualitativas , obtenga una medida de la diversidad a partir de la cual pueda estimar la "heterogeneidad media" de cada unidad administrativa.
¿Cómo podría hacerlo? Uso R y QGIS, así que no me importa en qué plataforma se base la solución.
Hay una serie de suposiciones en su pregunta que deben abordarse antes de llegar a la pregunta de implementación. El ejemplo que proporciona es un análisis de biodiversidad que se basa en una muestra de variedades de una especie de planta dada. Miré el manual del software que se utilizó para generar este ráster, y no hay indicios de que esto sea apropiado o se haya aplicado a las poblaciones humanas. El centroide de un área cultural humana (que propone utilizar para su análisis) no es de ninguna manera análoga a una muestra (es decir, observación real) de una colección de plantas.
La proximidad de los subgrupos humanos (divididos a lo largo de cualquier dimensión, aquí la dimensión es el origen étnico) puede expresarse como una medida de diversidad o una medida de segregación. Una medida de diversidad ampliamente utilizada es el índice Herfindahl , que varía de 0 a 1 y es pequeño cuando un área tiene muchos grupos pequeños y grande cuando un área tiene muchos grupos grandes. Se calcula dentro de una población o área sin referencia a nada fuera de esa población o área. Esto es problemático ya que está interesado en la interacción espacial a través de los límites administrativos.
Una medida de segregación ampliamente utilizada es el índice de disimilitud , que varía de 0 a 1 y es pequeño cuando las subáreas tienen la misma distribución de población que la región mayor, y grande cuando las subáreas son exclusivamente de un grupo u otro. Por lo general, se calcula dentro de una región para la cual hay información demográfica disponible para muchas subáreas (por ejemplo, puede calcular el índice de disimilitud en blanco y negro para el área metropolitana en función de los datos demográficos de todas las secciones del censo dentro del área metropolitana). Wong (2002) ha modelado localsegregación calculando el índice de disimilitud para cada subárea en función de la población de subáreas vecinas (es decir, contiguas) en lugar de la región en su conjunto. Una limitación de esta medida es que solo puede funcionar para dos grupos a la vez. Sin embargo, lo he usado en mi propia investigación al usar los dos grupos más poblados dentro de cada zona de vecinos.
Ha indicado que desea calcular la diversidad para cada unidad administrativa (AU). Pero también dice que necesita crear una trama continua de diversidad. No me queda claro si realmente quieres una trama continua de diversidad o si crees que lo necesitas para calcular la diversidad de AU. Si realmente desea una diversidad continua, recomendaría echar un vistazo a O'Sullivan & Wong (2007) , que visualiza la diversidad continua utilizando un estimador de densidad del núcleo. Esto tiene el efecto de contabilizar la interacción de la población a través de los límites administrativos, que usted indica que desea.
OTOH, si realmente desea diversidad por unidad administrativa, puede hacerlo utilizando el índice Herfindahl o el índice local de disimilitud. Pero eso requiere información sobre las características demográficas dentro de cada AU. Supongo que la razón por la que está utilizando el mapa de áreas étnicas es porque no tiene datos de población étnica para las UA. Pero si conoce la población de cada UA y la intersecta con la cuadrícula de áreas étnicas, puede asignar la población de UA a las áreas étnicas. La suposición importante con esta y las otras respuestas propuestas hasta ahora es que suponen que la densidad de población es constante en la UA o en el área étnica. Esta suposición parece prima facie inverosímil, pero conoce los datos mejor que yo, y puede sentirse cómodo con esta suposición.
Según mi comprensión de sus objetivos, creo que mi enfoque sería el siguiente:
Por supuesto, nada de esto llega a la implementación técnica, pero si me das algún comentario sobre esto, podemos continuar desde allí.
PD: Los trabajos académicos con los que me vinculé están cerrados. Si OP no tiene acceso a una biblioteca académica, no dude en ponerse en contacto conmigo por correo electrónico y se los proporcionaré.
fuente