Estoy interesado en los pros y los contras de varias herramientas ETL (extracto, transformación, carga) espaciales. Si ha utilizado los elementos enumerados aquí (o agrega los suyos), busco sus opiniones y experiencias. En particular, me gustaría ver comparaciones de usabilidad de:
- Software seguro FME (propietario)
- ArcGIS Data Interoperability Extension (propiedad, subconjunto de funciones FME)
- Extensión espacial Talend (anteriormente Integrador de datos espaciales) (código abierto)
- GeoKettle (código abierto)
- ogr2ogr (no sé si es realmente ETL, sino más bien un conjunto de herramientas de traducción de archivos)
- Cualquier lote adicional listado
No es necesario hacer una revisión de TODO el software mencionado. Si tiene experiencia incluso con uno, será muy beneficioso para tomar una decisión sobre qué dirección tomar.
Ejemplo: estoy buscando crear una función de conversión de esquema que me permita seleccionar la capa de entrada, crear una traducción y generar un nuevo esquema predefinido. De manera óptima, después de crear el script de traducción, me gustaría tener un formulario interactivo donde pueda "asignar" campos en mi capa de entrada a la capa de salida (es decir, la capa de salida tendrá un campo llamado "Dirección", ¿cómo se llama? en la capa de entrada?)
Algunos se mencionaron en las preguntas y respuestas en ¿Qué herramientas están disponibles para cargar datos GIS a una base de datos?
Y aquí hay un par de artículos relacionados que encontré.
fuente
La mayoría de las operaciones simples pueden ser realizadas por estas utilidades de código abierto
Obtén FWtools http://fwtools.maptools.org/ y pruébalo.
fuente
Hice una comparación de varias herramientas hace aproximadamente un año que también contiene la mayoría de las opciones mencionadas en este hilo.
Como respuesta más directa, uso mucho FME debido a su versatilidad. Sin embargo, cuando trabajo con estructuras de datos complejas como CityGML, INSPIRE GML o modelos de bases de datos más grandes, uso HALE , una aplicación de código abierto desarrollada para ETL y particularmente la armonización.
Actualmente (a partir de la versión 2.9.0) se compara con FME (2014 SP1) de la siguiente manera:
Tenga en cuenta que he estado en el equipo de HALE durante bastantes años.
fuente
Si observa el enlace duplicado de blah238s, encontrará más información. Diría que Talend Open Studio y Pentaho GeoKettle son las soluciones de código abierto más destacadas que uno puede elegir. Por lo que he leído, de estos dos objetivos Talend, más que solo ETL y GeoKettle, son un poco más fáciles de usar.
Mi municipio está a punto de darle una oportunidad a GeoKettle para escribir un dialecto GML elaborado por la asociación sueca de autoridades y regiones locales (SALAR) y necesitamos este formato para entregar geodatos a diferentes intereses comerciales.
Creo que GeoKettle tiene soporte para OGR / GDAL desde la versión 2.0.
fuente
FME es probablemente el mejor producto para usar en este espacio. Después de eso es GDAL / OGR. Otro producto de código abierto en este espacio es el geokettle: http://www.spatialytics.org/projects/geokettle/, aunque nunca lo he usado con ira (tuve la suerte de tener los otros dos productos mencionados).
Si ninguna de esas opciones genéricas funciona, probablemente desee utilizar una herramienta de conversión específica.
fuente
Usó Geokettle religiosamente para una curva de alto aprendizaje de un proyecto pequeño a menos que haya usado una interfaz de usuario Eclipse ... Realmente potente ya que está compilado contra GDAL1.10 admite todos los tipos de geografía ... Lo que me gustó fue su soporte para datos almacenados y datos a través de servicios ... Lo usé para recrear y sincronizar conjuntos de datos del servidor ArcGIS en una instancia de postgis local a través de ESRI json a GeoJSON ... El flujo de trabajo puede generar condiciones y la configuración de validación para consultar el # de objectid y en función de esa compilación un csv predefinido para iterar una solicitud de publicación de 500 funciones a la vez, dependiendo de la primera consulta, fue capaz de consolidar todas las solicitudes en un archivo geojson, ejecutar ogr2ogr para cargar en postgis incluso postgis con script para ejecutar vacío e indexar con él ... No afiliado solo un ventilador
Puede ejecutarlo y asignar un flujo de trabajo en la interfaz gráfica de usuario del escritorio y usar herramientas de servidor pentahos para configurarlo en Hadoop y hacer que se ejecute como un script o trabajo cron.
fuente
QGIS (al menos desde la versión actual 2.6) ahora también tiene un generador de modelos integrado. A través de esta caja de herramientas puede acceder a cientos de algoritmos (GDAL, GRASS, SAGA, vectortools, etc.). También puede agregar su propio script.
Debo admitir que no lo he usado extensamente, pero si estuviera buscando un constructor de modelos lo consideraría digno de investigación.
fuente
[ADVERTENCIA: una promoción gratuita de un producto con el que estoy involucrado]
Hemos estado trabajando en una herramienta para hacer ETL. Es similar en sabor a FME pero está diseñado para tareas más simples y requiere menos experiencia para su uso. Algunos detalles se pueden encontrar en https://www.geoactive.it solo busque información sobre Data Dragon. Esta aplicación usa GDAL / OGR en el back-end y estamos empujando cualquier adición que hagamos a GDAL / OGR.
El uso comercial requiere que se compre, pero tenemos licencias académicas disponibles de forma gratuita, por lo que si desea usarlo para estudiar, envíeme un mensaje y le proporcionaré más detalles.
Esto está en su etapa de lanzamiento temprano, por lo que todavía hay algunos errores menores, así que por favor, sea amable con nosotros.
fuente