¿Cuáles son los pros y los contras de los diferentes formatos de datos (rendimiento, tamaño de archivo, etc.) al considerar la distribución de datos abiertos?
Nuestra organización quiere publicar datos como datos abiertos. Sin embargo, no hay una idea clara sobre qué formatos de datos utilizar. Por supuesto, cuanto más 'abierto' es un formato de datos, más fácil es usarlo.
¿Qué formatos de datos son los más 'abiertos' y, por lo tanto, más utilizables para la distribución de datos abiertos cuando se tienen en cuenta los siguientes tipos ?:
- datos ráster (estoy pensando: GeoTIFF, Erdas Imagine IMG?)
- datos vectoriales (estoy pensando: GML, CSV, ESRI Shapefile, DXF?)
- datos tabulares (estoy pensando: CSV?)
- Datos 3D (estoy pensando: ¿CityGML?)
- Puntos 3D podría / LIDAR (Estoy pensando: LAS?)
- ¿Estoy olvidando algo aquí?
Además, si hay documentación sobre formatos de datos abiertos, estoy muy interesado si desea compartir.
data
file-formats
Mark Verschuur
fuente
fuente
Respuestas:
La iniciativa de datos abiertos de la ciudad de Viena ( http://data.wien.gv.at ) utiliza Geoserver para proporcionar acceso a geodatos ráster y vectoriales a través de los servicios Geoserver WMS y WFS . Esto tiene muchas ventajas: los usuarios pueden descargar datos en diferentes formatos para usarlos sin conexión (por ejemplo, geojson, KML o Shapefiles comprimidos) o usar los servicios en vivo al insertarlos en mapas en línea o proyectos SIG.
fuente
Para csv tabular. Excel es, en el mejor de los casos, demasiado complicado y, en el peor, totalmente inaccesible. El acceso no es accesible y el PDF es una bofetada.
Para el uso geoespacial geojson, su texto está bien soportado y no tiene las restricciones técnicas que tiene el único otro formato viable (shapefile). Además, a menos que tenga una muy buena razón, debería estar en WGS84, teniendo en cuenta que la mayoría de los usuarios estarán en otro estado y no querrán un avión de estado.
fuente
Me gusta bastante NetCDF para datos continuos / de matriz (es decir, rásteres). Los pros para NetCDF son:
El único inconveniente de NetCDF4 que puedo ver es el excelente soporte en paquetes GIS estándar como ArcGIS y QGIS (¡aunque me encantaría que me corrijan al respecto!).
EDITAR Algunos otros paquetes que admiten NetCDF
Algunos lenguajes de programación estándar que admiten NetCDF (aunque para ser justos, cualquier cosa que pueda leer HDF puede leer NetCDF4):
Para los usuarios de matemáticas y estadísticas tienes:
Específicamente en SIG:
Si desea ver rápidamente un archivo NetCDF, usaría el Panoply multiplataforma de la NASA. Y si está interesado en más, UCAR Unidata tiene una lista de software .
fuente
Yo diría:
El software de código abierto puede leer fácilmente estos formatos y se pueden transformar fácilmente a cualquier otro formato necesario para aplicaciones específicas.
¡También +1 para abrir datos!
fuente
Prácticamente esta misma pregunta surgió en opendata.SE: ¿Cuáles son los formatos más útiles para liberar datos geoespaciales?
Entonces, espero no estar violando ninguna política al citar mi propia respuesta allí:
Mi experiencia, haciendo mapas de bastantes conjuntos de datos gubernamentales:
Para datos de puntos, CSV es el mejor, con columnas "lat" y "lon". Es muy fácil trabajar con una amplia gama de herramientas, incluidos editores de texto, hojas de cálculo, etc. Hay dos desventajas:
.vrt
archivo complementario.lat
ylon
no es totalmente estándar. Muchas herramientas son bastante liberales en lo que aceptan.Para líneas y polígonos, en orden decreciente de preferencia:
Honestamente, sin embargo, la mejor respuesta es probablemente "todos ellos". Haga un favor a todos y publique los datos en CSV (si es un punto), GeoJSON, Shapefile comprimido y KMZ.
fuente