¿Usa Dropbox para sincronizar geodatabases de archivos?

11

He podido acumular una gran cuenta gratuita de Dropbox y usarla para sincronizar mis bases de datos SIG en varias PC diferentes. Acabo de empezar a hacer esto y hasta ahora no he tenido ningún problema. Pero recibo algunas banderas rojas de advertencia que me están asustando.

Parece que hay varios archivos duplicados en las GeoDatabases. Por lo general, algo como:

a00000017.gdbtable (copia duplicada GIS-HP)

Puedo eliminar manualmente estos archivos sin ningún problema, pero no tengo idea de por qué están apareciendo.

Además, en lugar de eliminar bloqueos de archivos, Dropbox sigue diciendo que los renombra. Entonces, cuando libero un bloqueo y obtengo otro, cambia el nombre del archivo en lugar de eliminarlo y crear uno nuevo. Aunque todavía elimina el archivo de bloqueo cuando me desconecté completamente de la GeoDatabase.

Como dije, no he tenido ningún problema hasta ahora, pero estoy preocupado por la corrupción de datos a largo plazo mientras uso Dropbox.

¿Alguien ha usado Dropbox y ha encontrado problemas al usarlo para sincronizar datos SIG?

Cody Brown
fuente
3
No tengo una respuesta definitiva, pero te sugiero que seas prudente para ser cauteloso. No creo que DropBox esté destinado a acceder a un formato de datos complejo como una geodatabase de archivos, que consta de múltiples archivos discretos, en múltiples PC simultáneamente. Esta publicación muestra algunos problemas potenciales a tener en cuenta
Stephen Lead
@StephenLead He estado haciendo una copia de seguridad de los datos de Dropbox a diario. Utilicé Amazon Cloud Drive durante aproximadamente un año sin problemas, pero eso es muy lento para la sincronización. Dropbox funciona de manera más rápida y sencilla. Realmente espero que pueda manejarlo.
Cody Brown
2
Es mejor comprimir la geodatabase de archivos antes de que se use para compartir resources.arcgis.com/en/help/main/10.2/index.html # //... no está diseñada para editarse con más de un usuario a la vez - Los archivos lck deberían evitar esto.
Mapperz
Idea sólida @Mapperz
Cody Brown

Respuestas:

9

ESRI ofuscó intencionalmente la estructura de archivos FileGDB para que la gente no intentara meterse con ella internamente:

Una geodatabase de archivos se almacena como una carpeta de archivos. Cuando ve la carpeta con el Explorador de Windows, aparte de la extensión .gdb, se ve como cualquier otra carpeta y puede ver su contenido. La carpeta contiene archivos con nombres crípticos que contienen datos geográficos, datos de atributos, archivos de índice, archivos .lock y un archivo de firma, así como otros archivos. Cada clase de entidad o tabla en la geodatabase se almacena en dos o más archivos. Por diseño, es difícil, si no imposible, saber qué archivos forman un conjunto de datos dado.

ESRI recomienda que copie FileGDB con sus herramientas y no con las herramientas de su sistema operativo. Sin embargo, es posible copiar toda la base de datos o cambiarle el nombre:

Aunque no se recomienda, es posible copiar una geodatabase de archivos a otra ubicación copiando la carpeta a otra ubicación (si está utilizando un sistema operativo Windows Vista, también debe cambiar la extensión de la nueva carpeta a .gdb; de lo contrario, ArcGIS no puede reconocerlo como una geodatabase de archivos). Solo copie una geodatabase de archivos con el Explorador de Windows cuando esté seguro de que no hay otros procesos que accedan a los datos. El problema es que puede ser difícil saber si otros procesos están accediendo a los datos. Puede pensar que no hay otros procesos; sin embargo, un proceso en su computadora u otro podría estar accediendo a él. Si copia la carpeta cuando otro proceso está accediendo a los datos, es posible que los datos no se copien correctamente.

Sería cauteloso de usar Dropbox para sincronizar los archivos individualmente. La estructura de la base de datos simplemente no está diseñada para ser manipulada de esa manera. Si su conjunto de datos es lo suficientemente pequeño, puede ser una buena aplicación para una geodatabase personal o una base de datos sqlite (aunque no he visto que confirme que ArcGIS puede escribir sqlite) si tiene una geometría simple.

Hay una herramienta que recuperará la geodatabase dañada en caso de que estén dañados:

DPierce
fuente
2
Usted cita: " puede que no note ningún problema hasta que acceda a cierta parte de la nueva copia unos días más tarde " me asusta. Probablemente sería mucho más inteligente usar shapefiles en lugar de una GeoDatabase.
Cody Brown
He estado usando SkyDrive para sincronizar archivos gdbs sin problemas durante casi un año. Cuando tenemos problemas de proxy que a veces significa que no puedo acceder a los servicios de Microsoft, normalmente cierro mi SkyDrive y solo permito que se sincronice nuevamente una vez que se ha restaurado el acceso. He editado cajas de herramientas con modelos y scripts cuando mi SkyDrive está abierto pero no se sincroniza correctamente, y todavía no he perdido nada.
Cindy Jayakumar
1
FWIW Estaba editando una capa de polígono complejo en un archivo GDB, así que desconecté Dropbox mientras trabajaba en él. Volví a conectar Dropbox después de editar, por lo que se realizó una copia de seguridad de los archivos. 24 horas después, todas mis ediciones han desaparecido y (como había desconectado Dropbox durante la edición) no hay archivos intermedios a los que volver. Por lo tanto, parece que Dropbox a veces puede dañar una geodatabase de archivos.
Stephen Lead
8

Si necesita tener múltiples PCs accediendo a los archivos, parece tener más sentido migrar a una verdadera configuración de servidor espacial en lugar de una configuración ad hoc usando Dropbox. Esto podría ser un servidor alojado que ejecuta ArcGIS o una base de datos PostGIS que se ejecuta en un servicio web en la nube como AWS . Mi preferencia sería por lo último. La configuración requerirá un poco más de trabajo, pero puede definir sus propias relaciones y escalar hasta la cantidad de computadoras que necesite (dependiendo de cómo configure AWS), todo por mucho menos de lo que pagaría a Esri.

Hay varias publicaciones SO que discuten PostGIS y ArcGIS aquí y aquí . El segundo parece tener más información actualizada en los comentarios debajo de la respuesta aceptada.

Sin algo más robusto que maneje el tráfico de los diferentes clientes, probablemente se ocupará constantemente de problemas de corrupción de datos. Por lo menos, si se movió a shapefiles, debería revisar GeoGit . Esto le daría un control de revisión básico para que los archivos de forma editados en una computadora puedan fusionarse con ediciones de otra sin sobrescribirse por completo.

Richard D
fuente
Los servidores web son una excelente manera de administrar los datos SIG en varias PC. De hecho, estoy de acuerdo, es probablemente la mejor manera. El problema con esto es el ancho de banda y la velocidad de procesamiento. Por lo general, la velocidad de Internet fuera del sitio es lo suficientemente alta como para trabajar con los datos. Pero, si quiero hacer un análisis exhaustivo de los datos, no hay forma de que lo extraiga en la web. Por eso prefiero una solución como Dropbox. Aparezco en el sitio y las GeoDatabases están actualizadas y almacenadas localmente en la PC. Gran manera de trabajar.
Cody Brown
3
@codybrown Pero todavía está tratando de enviar datos a través de Internet con Dropbox, sin mencionar los problemas de sincronización que está obteniendo, probablemente porque lleva mucho tiempo actualizar de un cliente a otro. Al menos un servidor estaría optimizado para esa tarea. Si realmente está buscando tener una solución de almacenamiento de datos mientras trabaja desde el hogar, el trabajo o el sitio del cliente, entonces un disco duro de extracción grande es la única forma de evitar la latencia y los posibles conflictos de sincronización, suponiendo que sea el único uno usando los datos en un momento dado.
Richard D