¿Medir la diferencia de rendimiento entre Merge y Append en ArcGIS Desktop?

12

A menudo me encuentro en una situación en la que no me importa si mi herramienta produce o no una nueva clase de entidad, pero me importa cuánto tiempo lleva combinar todos mis grandes conjuntos de datos. ¿Se tarda más en producir una nueva clase de entidad utilizando la herramienta Fusionar en lugar de la herramienta Anexar, o Fusionar y Anexar son esencialmente iguales en términos de rendimiento?

MTerry
fuente
2
Alguna evidencia anecdótica: siempre he encontrado que Merge es más rápido, especialmente cuando se trata de grandes cantidades de características.
Devdatta Tengshe
pero Append funciona mejor cuando tiene dominios y subtipos predefinidos.
Mapperz

Respuestas:

6

La combinación toma geometría y atributos y combina (combina) todo el conjunto de datos en un nuevo conjunto de datos de entidades. ingrese la descripción de la imagen aquí

Agregar es una buena forma de unir datos adicionales a un conjunto de datos existente: puede tener opciones para controlar subtipos de características que se agregan.

http://resources.arcgis.com/en/help/main/10.1/index.html#//001700000055000000

La diferencia clave es

Si se especifica el TEST de tipo de esquema , el esquema (definiciones de campo) de los conjuntos de datos de entrada debe coincidir con el del conjunto de datos de destino para que se agreguen las características. Si se especifica el Tipo de esquema NO_TEST , el esquema del conjunto de datos de entrada (definiciones de campo) no tiene que coincidir con el conjunto de datos de destino. Sin embargo, los campos de los conjuntos de datos de entrada que no coincidan con los campos del conjunto de datos de destino no se asignarán al conjunto de datos de destino a menos que la asignación se establezca explícitamente en el control de Mapa de campo.

subtipo (Opcional) Una descripción de subtipo para asignar ese subtipo a todos los datos nuevos que se agregan al conjunto de datos de destino.

http://resources.arcgis.com/en/help/main/10.1/index.html#//001700000050000000

ingrese la descripción de la imagen aquí

Quizás le interese el 'Procesamiento en mosaico de grandes conjuntos de datos'

http://resources.arcgis.com/en/help/main/10.1/index.html#//01m10000000r000000

Mapperz
fuente
1
Soy consciente de las diferencias entre las herramientas, pero me pregunto si estas diferencias conducen a una diferencia significativa en el tiempo de procesamiento. Normalmente uso NO_TEST cuando uso la herramienta de agregar, ya que me aseguro de que mis definiciones de campo coincidan antes de agregar / fusionar.
MTerry
5

Tome estas respuestas basadas en las herramientas mismas y no en un punto de referencia real:

La herramienta de fusión crea una nueva clase de entidad, que lleva tiempo en sí misma, antes de agrupar los dos conjuntos de datos.

La herramienta de agregar con la opción TEST supone que ambos conjuntos de datos tienen los mismos campos (nombres de campo) y los agrupa sin tener que crear una nueva clase de entidad (suena más rápido).

La herramienta de agregar con la opción SIN PRUEBA permite que el mapeo de campo combine clases de entidad similares que pueden tener diferentes nombres de campo. Esto requiere algunas pruebas condicionales detrás de escena, lo que llevaría más tiempo.

A medida que crece el tamaño del conjunto de datos, la cantidad de tiempo que lleva crear un nuevo fc parece insignificante. ¡La única manera de saberlo con certeza sería hacer algunos puntos de referencia con sus grandes conjuntos de datos y publicar las respuestas aquí!

Sospecho que la diferencia no es mucha, se trata más de lo que quiere de la herramienta al final (mapeo de campo versus nueva clase de entidad versus no nueva clase de entidad)

Roy
fuente
0

Acabo de ejecutar las tres variantes. Siempre combiné los mismos 63 shapefiles. Cada archivo de forma contiene alrededor de 63000 puntos creados a partir de una operación RasterToPoint. Todos los archivos de forma tienen la misma tabla de atributos.

Las diferentes variantes necesitaban los siguientes tiempos para compilar:

  • Fusionar: 13 minutos 57 segundos
  • Agregar con PRUEBA: 8 minutos 34 segundos
  • Añadir con NO_TEST: 9 minutos 12 segundos

Parece que Append con TEST como parámetro de entrada es el más rápido. Obviamente, la elección de qué Apéndice utilizar no depende de la velocidad, sino de los archivos de entrada como se explicó anteriormente.

Espero que sea útil.

Alejandro
fuente