Recursos SIG distribuidos y en la nube

14

¿Hay documentos de investigación definitivos, recursos web o libros (de texto) sobre SIG distribuidos? Los temas que me interesan son:

  • Paralelismo de algoritmos espaciales secuenciales
  • Marcos para implementar SIG en el entorno de nube / clúster
  • FOSS y software comercial para lo anterior

He visto esta pregunta, pero quiero algo un poco más definitivo. El estado de CW sería beneficioso, así como las recomendaciones para las etiquetas.

EDITAR: He ingresado varios de estos términos en Google Scholar , y aunque soy un estudiante graduado y trato con trabajos de investigación de forma regular, muchos de los resultados no son sustantivos ni abarcan.

revs Baskinomics
fuente
No encontrará mucha información sólida aquí. La mayor parte del trabajo en esta área es ad hoc o altamente personalizado para clientes gubernamentales que necesitan megaprocesamiento. En mi agencia, hemos tomado el código ESRI y lo hemos hecho escalar más para nuestras necesidades, pero requiere mucha atención.
DEWright
Supuse implícitamente que, ya que gran parte de mi búsqueda no ha dado lugar a un recurso sólido y examinado. Participo activamente en la investigación de algunos de estos elementos, y hasta ahora he tenido que combinar mi formación académica con estos conceptos con poca orientación. También participo en algunas consultas con un centro de supercomputación y están interesados ​​en desarrollar soluciones SIG escalables. Vea mi edición arriba.
Baskinomics

Respuestas:

7

He realizado varios proyectos a este respecto, pero al final siempre terminaron siendo soluciones personalizadas que básicamente

  • separó el problema en cuadrículas
  • realizó el procesamiento en cada nodo individual y copió el resultado en una tabla temporal / almacén de datos
  • fusionó todas las soluciones en una sola tabla de resultados y, opcionalmente, manejó las condiciones de contorno. El manejo de las condiciones de límite solo era necesario para los casos en que las características debían coserse o masajearse (por ejemplo, al construir una topología de manera distribuida, desea que las características de límite se ajusten).

Curiosamente, cada vez que resolví un problema de esta naturaleza, usé una tecnología diferente, principalmente porque esa era la moda del momento. Al final, lo que desea es una biblioteca de paso de mensajes que tenga un administrador de colas de trabajos, genere procesos en los diferentes nodos y que tenga algún tipo de mecanismo de sincronización ( Semapahore , Barrier's , etc.) y alguna forma de manejar errores y reintentos. Todos los proyectos que menciono a continuación tienen estas cosas.

Para geo, he usado (en orden cronológico):

(vieja escuela)

(más nuevo)

Hay varios otros que la gente usa.

Al final, cualquiera de estos lo reduciría (aunque de una manera ligeramente diferente), por lo que se reduce a elegir uno que tenga una comunidad que sea útil.

Además, en cada nodo, tendría que usar una biblioteca para realizar las operaciones de geometría SIG. La recomendación sobre cuál usar se basaría en el lenguaje en el que prefiera codificar esto. Pero estoy seguro de que las opciones que la mayoría de las personas le darían serían:

O alguna otra biblioteca que sirve como envoltorio para uno de estos.

Ragi Yaser Burhum
fuente
1
¡Agradable! Actualmente estoy aprendiendo Apache Hadoop MapReduce y CGAL, eso es realmente lo que había planeado intentar primero. Me había aferrado a esto porque no quería inundar mi pregunta con recursos que ya tenía en mi poder, pero me pareció útil: nathankerr.com/projects/parallel-gis-processing/…
Baskinomics
MapReduce y CGAL son excelentes selecciones. No te puedes equivocar con ellos.
Ragi Yaser Burhum