Metadata -auto build usando python

11

Tenemos un gran repositorio (más de 10,000) de datos espaciales (vectores shp / gdb / tab y rásteres ecw / tif y también datos las, xyz y DEM) donde algunos tienen registros de metadatos en xml usando el editor de metadatos anzlic. Quiero verificar si cada conjunto de datos espaciales tiene un registro xml asociado y verificar las proyecciones, la extensión espacial, la fuente y el tamaño con el archivo espacial asociado.

He creado un script basado en arcpy para extraer esta información de formatos legibles por ESRI, pero no estoy seguro de cómo manejar los archivos de pestañas y, lo que es más importante, cómo compararlo con el registro xml basado en metaeditor anzlic.

Entonces, si tenemos citypoints.shp / .tab, entonces deberíamos tener citypoints_metadata.shp / .tab.xml ya que el registro de metadatos -esto es independiente de citypoints.shp.xml que algunos software crean automáticamente.

Otra pregunta similar del foro es ¿Se admiten los metadatos de ANZLIC utilizando el nuevo enfoque de ArcGIS 10.x? pero no cubre el requisito de verificar la existencia de un registro válido y tratar con formatos .tab (otros no-esri) en un espacio de trabajo de código abierto / creative commons según mi pregunta ( Cómo leer archivos MapInfo .tab en ArcPy ? ) ¿También busqué en el software mencionado en Seeking Open Source ISO Metadata Editor? pero ninguno de ellos genera automáticamente el archivo de metadatos base ni permite comparar registros existentes con la fuente.

GeorgeC
fuente
Si alguien está interesado, ahora tengo una solución basada en qgis python para esto. Feliz de compartir si alguien pregunta.
GeorgeC

Respuestas:

2

Mira el proyecto NME

Con él, puede hacer que todos los metadatos admitidos por GDAL hagan referencia en un XML (también opciones de salida de SQL) utilizando el script de python gdalogr_catalogue.py con un comando como el siguiente

python gdalogr_catalogue.py -d /home/my_directory

Después, depende de usted adaptar el XML recuperado de esta utilidad para poder compararlo con el editor de metadatos anzlic o personalizar el script original para recuperar exactamente lo que necesita.

ThomasG77
fuente
1

¿ha considerado usar la conversión de formatos no ESRI a formatos ESRI? Estaba pensando que si tu script funciona bien, ¿por qué no usar Gdaltranslate para convertir los datasets ráster y ogr2ogr para convertir los datasets vectoriales a formatos ESRI? Ok, si no desea crear nuevos conjuntos de datos, eche un vistazo a gdalinfo.exe y ogrinfo.exe, ya que los nombres sugieren que ambos producen metadatos que podrían serle útiles.

dango
fuente
No queremos crear datos adicionales: tenemos que procesar más de 10k archivos de pestañas.
GeorgeC