Cálculo de la correlación espacial entre entidades de dos capas separadas en QGIS

10

Estoy tratando de determinar si la presencia de un gran número de tropas militares en servicio activo en un área se correlaciona espacialmente con niveles más altos / más bajos de delitos violentos. Es decir, ¿las áreas que rodean las grandes bases militares son más / menos violentas, en promedio, que las áreas que no están cerca de las bases militares?

Estoy trabajando con los siguientes dos conjuntos de datos:

(1) un conjunto de datos de puntos de bases militares en los Estados Unidos continentales y sus niveles de tropas correspondientes:

Ubicaciones de instalaciones militares estadounidenses en los 48 más bajos.

(2) un conjunto de datos a nivel nacional sobre las tasas de delitos violentos por pueblo / ciudad:

Niveles de delitos violentos en los EE. UU. Por ciudad

Siento que estoy buscando algún tipo de modelo basado en la gravedad en el que la función "masa" proporcione niveles de tropas en cada base. Por lo tanto, una gran presencia de tropas ejercería influencia sobre un área más grande y tendría un efecto más fuerte cerca del centro de masa (es decir, la ubicación del punto en la capa SIG).

Estoy pensando que, conceptualmente, se vería así: modelo de gravedad - diagrama de disminución de distancia

En este diagrama , X, Y, Z representan bases militares. a, b, c, d representan ciudades (cada una de las cuales tiene un campo de índice de violencia en su tabla de atributos).

El gradiente alrededor de las bases representa el campo de influencia, que disminuye exponencialmente con la distancia desde el centroide de la base. Una mayor presencia de tropas equivale a un radio de influencia mayor (con cierta distancia umbral máxima), y también a una influencia más fuerte cerca del centro en relación con las áreas cercanas a una base más pequeña.

A cada ciudad se le asignará un puntaje basado en la suma de la magnitud de todos los vectores de "fuerza" de todas las bases circundantes en cuyo radio de influencia se encuentran. Entonces, por ejemplo, en mi diagrama, Ciudad a tendría un puntaje de 0 ya que se encuentra fuera del radio de cualquier base. Ciudad b solamente se vería influenciada por la base X . Ciudad c sólo se vería influenciada por la Base Z , y su puntuación sería menor que b , ya que X es una base mucho más grande que Z . Finalmente, la ciudad d se encuentra dentro del radio de ambas bases X e Y, recibiría una puntuación basada en la suma de la magnitud de la influencia de ambas bases. Entonces vería si hay una correlación entre una puntuación más alta para una ciudad y tasas más altas de violencia.

He estado buscando varios modelos basados ​​en la gravedad (modelos Huff , etc.) pero no he podido encontrar mucho en cuanto a QGIS / Python, y no estoy muy seguro de cómo implementar lo que describí anteriormente ... ¿Alguien tiene sugerencias? ¿para esto? ¿Alguno de ustedes ha hecho este tipo de análisis en otras áreas antes?

Entonces el TLDR es:

  • ¿Qué técnicas estadísticas podría usar para este tipo de preguntas?
  • ¿Hay alguna herramienta integrada en QGIS (o disponible como complemento) que pueda hacer esto?
  • Si no hay nada como esto en QGIS, ¿hay alguna biblioteca de Python que pueda realizar este tipo de análisis?
J. Taylor
fuente
Para ser claros, soy consciente de que hay muchos otros factores que entran en juego con las tasas de violencia (pobreza, densidad urbana, etc.), pero supongamos, por simplicidad, que no hubo variables de confusión significativas y que solo estaba mirando la correlación entre estas dos variables (niveles de tropas y tasas de violencia). En este punto, esto es solo un ejercicio de aprendizaje, y estoy tratando de descubrir qué herramientas están disponibles para mí. ¡Gracias!
J. Taylor
1
Para responder a su tercera pregunta, encontré PySAl, que fue desarrollado por el profesor Luc Anselin, a quien vale la pena consultar dados sus intereses. También trabajó en GeoDa, que es una solución lista para usar de lo que estás viendo. ¿Puede haber un complemento PySAl para QGIS? pysal.readthedocs.org/en/latest
raphael

Respuestas:

2

Ampliando mi comentario anterior

Lo que probablemente querrá hacer es ejecutar una regresión lineal con retraso espacial, lo que explica la correlación espacial de algunas de sus variables (voy a tener que mirar mis notas sobre esto).

Luc Anselin ha sido pionero en este espacio, y debe echar un vistazo a su trabajo, especialmente las herramientas (gratuitas) y la documentación en el Centro GeoDa . Ambas herramientas pueden ser de su interés:

  1. GeoDa, un software independiente para explorar la correlación espacial (automática).
  2. PySAL , una biblioteca de análisis espacial de Python.

Mi búsqueda de un complemento PySAL para QGIS encontró algo que no se ha actualizado en años, pero es posible que tenga más suerte.

Rafael
fuente
Gracias rafael. Analizaré más el concepto de "regresión lineal con retraso espacial". Ya había encontrado PySAL / GeoDa gracias a una recomendación en el canal #qgis IRC. Tiene razón en que mucha de la documentación en la página GeoDa ha sido útil. Todavía no he encontrado nada que haga exactamente lo que quiero, pero si termino teniendo que codificarlo yo mismo, hay muchas herramientas que parecen ser útiles "bloques de construcción".
J. Taylor