A menudo me encuentro en una situación en la que no me importa si mi herramienta produce o no una nueva clase de entidad, pero me importa cuánto tiempo lleva combinar todos mis grandes conjuntos de datos. ¿Se tarda más en producir una nueva clase de entidad utilizando la herramienta Fusionar en lugar de la herramienta Anexar, o Fusionar y Anexar son esencialmente iguales en términos de rendimiento?
12
Respuestas:
La combinación toma geometría y atributos y combina (combina) todo el conjunto de datos en un nuevo conjunto de datos de entidades.
Agregar es una buena forma de unir datos adicionales a un conjunto de datos existente: puede tener opciones para controlar subtipos de características que se agregan.
http://resources.arcgis.com/en/help/main/10.1/index.html#//001700000055000000
La diferencia clave es
Si se especifica el TEST de tipo de esquema , el esquema (definiciones de campo) de los conjuntos de datos de entrada debe coincidir con el del conjunto de datos de destino para que se agreguen las características. Si se especifica el Tipo de esquema NO_TEST , el esquema del conjunto de datos de entrada (definiciones de campo) no tiene que coincidir con el conjunto de datos de destino. Sin embargo, los campos de los conjuntos de datos de entrada que no coincidan con los campos del conjunto de datos de destino no se asignarán al conjunto de datos de destino a menos que la asignación se establezca explícitamente en el control de Mapa de campo.
subtipo (Opcional) Una descripción de subtipo para asignar ese subtipo a todos los datos nuevos que se agregan al conjunto de datos de destino.
http://resources.arcgis.com/en/help/main/10.1/index.html#//001700000050000000
Quizás le interese el 'Procesamiento en mosaico de grandes conjuntos de datos'
http://resources.arcgis.com/en/help/main/10.1/index.html#//01m10000000r000000
fuente
Tome estas respuestas basadas en las herramientas mismas y no en un punto de referencia real:
La herramienta de fusión crea una nueva clase de entidad, que lleva tiempo en sí misma, antes de agrupar los dos conjuntos de datos.
La herramienta de agregar con la opción TEST supone que ambos conjuntos de datos tienen los mismos campos (nombres de campo) y los agrupa sin tener que crear una nueva clase de entidad (suena más rápido).
La herramienta de agregar con la opción SIN PRUEBA permite que el mapeo de campo combine clases de entidad similares que pueden tener diferentes nombres de campo. Esto requiere algunas pruebas condicionales detrás de escena, lo que llevaría más tiempo.
A medida que crece el tamaño del conjunto de datos, la cantidad de tiempo que lleva crear un nuevo fc parece insignificante. ¡La única manera de saberlo con certeza sería hacer algunos puntos de referencia con sus grandes conjuntos de datos y publicar las respuestas aquí!
Sospecho que la diferencia no es mucha, se trata más de lo que quiere de la herramienta al final (mapeo de campo versus nueva clase de entidad versus no nueva clase de entidad)
fuente
Acabo de ejecutar las tres variantes. Siempre combiné los mismos 63 shapefiles. Cada archivo de forma contiene alrededor de 63000 puntos creados a partir de una operación RasterToPoint. Todos los archivos de forma tienen la misma tabla de atributos.
Las diferentes variantes necesitaban los siguientes tiempos para compilar:
Parece que Append con TEST como parámetro de entrada es el más rápido. Obviamente, la elección de qué Apéndice utilizar no depende de la velocidad, sino de los archivos de entrada como se explicó anteriormente.
Espero que sea útil.
fuente