Opciones de estandarizador de direcciones

9

Ok, entonces con ArcGIS 10, ESRI ha depricado 'Estandarización de direcciones' en los nuevos localizadores, sé que todavía puede usar los localizadores 9.3.1 para hacer esto; pero sospecho que después de la versión 10.1 veremos que esto está disponible cada vez menos.

El estándar de direccionamiento FGDC asigna un gran valor a las buenas direcciones que tienen los valores de prefijo, dirección de prefijo, nombre de calle, sufijo, dirección de suficiencia para una buena forma limpia. Y mi agencia necesita lo mismo.

¿Existen otras herramientas que las personas usan para tomar direcciones estructuradas y analizarlas de manera bastante confiable para que puedan almacenarse? ¿Alguno de ellos es gratis?


* Actualización: * Encontré esto en CodePlex (US Address Parser) y me ha dado un muy buen punto de partida. Es realmente bueno porque es un código administrado que puedo usar en todo el lugar y hasta ahora ha tenido una tasa de éxito muy alta al desglosar partes para revisarlas línea por línea y parte por parte.

DEWright
fuente
1
Mi instalación de ArcGIS v10 tiene ArcToolBox, Geocoding Tools, Standardize Addresses. Las entradas pueden ser una tabla o una clase de entidad, por lo que esto debería funcionar con los datos de referencia espacial y / o las direcciones sin formato. ¿Es esto lo que estás buscando?
klewis
1
Sí, pero cuando tuvo la capacidad de pasar una dirección a un geocodificador, luego obtuvo el resultado con una respuesta estandarizada y luego pudo hacer una llamada de nivel SOAP para un solo registro a la vez. Ahora; le queda construir un servicio de geoprocesamiento, el host que se separa del resto del sistema de geocodificación. Entonces hicieron el proceso más complejo y con el sistema actual teniendo tales problemas; No es confiable.
DEWright

Respuestas:

6

El análisis de una dirección es un proceso complicado, ya que estoy seguro de que lo sabe.

Usando datos ZIP + 4 del USPS, puede determinar si existe una calle dentro de una ciudad / estado / código postal determinado. Incluso puede verificar que un número primario (número de casa) se encuentre dentro del rango correcto de ZIP + 4. También es posible ajustar los nombres de las ciudades y los nombres de las calles para corregir los problemas de ortografía utilizando listas de ortografía y haciendo coincidir "sonidos como". Tomar una dirección y analizarla en los componentes individuales y luego compararla con una base de datos de direcciones conocidas es la única manera de saber que el análisis se ha realizado correctamente.

Saber que una dirección se ajusta dentro del área asignada y saber que es una dirección real y entregable son objetivos distintos. El primero, la aproximación de direcciones, es algo que googlemaps hace muy bien. Sin embargo, es solo eso, aproximación. Googlemaps no le permite saber si la dirección se puede entregar, sino que le muestra dónde se ubicaría en el mapa si fuera real. Esto es inmensamente valioso desde el punto de vista del mapeo y tienen diferentes grados de precisión.

Ciertamente, la base de datos de USPS tiene fallas (muchas de ellas) pero también son ciertamente más precisas y correctas que cualquier otra base de datos de direcciones de EE. UU.

También trabajo en SmartyStreets y quería agregar a la conversación. Si necesita validar menos de 250 direcciones por mes, la API es gratuita. Si su organización es un grupo sin fines de lucro , el servicio es completamente gratuito sin límites.

Jeffrey
fuente
Estamos construyendo un servicio separado en mi agencia para trabajar en las porciones de Geocodificación; donde se agregarán los datos del condado y / o la ciudad para una primera capa de validación; luego pase a fuentes comerciales como TomTom o NavTeq antes de Tiger. Donde estamos tomando la base de un geocodificador compuesto ESRI y agregando pasos o ramas adicionales para comparar el puntaje de origen con otro y devolver el puntaje más alto de los dos o tres. Nuestro uso de bases de datos AIS / AMS de USPS ayuda con la parte 'Entregable', junto con los datos del Condado.
DEWright
Gracias por compartir, Jeffrey. Editaré (en breve) su respuesta para cumplir con las pautas de nuestro sitio; por favor revise nuestras preguntas frecuentes para más información.
whuber
1

Sí, hay herramientas, las gratuitas dependerán de dónde se encuentren sus direcciones. Hay muchos depuradores de direcciones no libres con licencia del USPS. Uno de los que uso es ZP4 . Considero que la entrada y la salida son flexibles en función de cómo almacena sus datos actualmente y cómo le gustaría almacenar sus datos en el futuro. Puede optar por generar sus datos, para aquellas direcciones que coinciden con direcciones entregables dentro de los datos de USPS, en 7 fragmentos. Estos fragmentos corresponden al número de casa, la predirección, el nombre de la calle, el sufijo de la calle, la dirección posterior, la abreviatura de la unidad de apartamento y el número de apartamento. Es la solución costosa de arrendamiento que he encontrado.

ktreiche
fuente
1
Si bien ZP4 es muy barato ($ 600 / año), los términos me ponen un poco cauteloso y parece que tienes que tener cuidado con cómo lo estás usando.
blord-castillo
1

Trabajo en el campo de verificación de direcciones, en realidad (una compañía llamada SmartyStreets), donde hacemos la verificación de direcciones postales (en los Estados Unidos).

Necesitará un proveedor de datos de dirección certificado por CASS. El software de estas compañías ha sido aprobado por el USPS para agregar información faltante en una dirección y devolver resultados precisos. Uno de estos servicios es LiveAddress , o si tiene una lista de direcciones, está la Smartylist , que le dará la información que necesita. Ambos son gratuitos hasta cierto punto, pero bastante asequibles después de eso.

En ArcGIS, creo que la API LiveAddress se puede implementar mediante programación. Alternativamente, se puede exportar una lista de direcciones a una hoja de cálculo o CSV y cargarla en el servicio de limpieza de listas.

Mate
fuente
No estoy buscando realmente la corrección o las certificaciones de envío masivo, que es a lo que se dirige CASS; más para un mejor análisis y búsqueda para ayudar a corregir las direcciones incorrectas. Ya tengo bases de datos USPS AIS y AMS y ahora estoy comenzando a construir lógica para analizar y consultar un registro de esas fuentes si no coincide completamente. Echaré un vistazo a los enlaces a los que hace referencia; pero estoy conduciendo hacia la construcción de una solución que se pueda compartir para las direcciones más comunes de EE. UU. a un costo menor. El hecho de que USPS AIS / AMS no lo encuentre no significa que sea incorrecto.
DEWright el
@DEWright Tienes razón. Hay direcciones que existen fuera del dominio de USPS, pero la gran mayoría de ellas se pueden encontrar dentro de la base de datos de direcciones entregables de USPS. Fedex y UPS tienen algunas direcciones (generalmente remotas) a las que envían y USPS no enviará. Sería bueno tener una fuente autorizada que combinara todas esas direcciones. La dificultad con eso es que USPS no comparte exactamente toda su base de datos, y tampoco Fedex o UPS. En su mayor parte son datos de propiedad. La verificación de la dirección es más que solo el envío de correos.
Jeffrey
1

He tenido un gran éxito al usar la biblioteca del analizador de direcciones de EE. UU. Creé una herramienta de Python que usa la biblioteca para crear los campos de dirección analizados. https://github.com/datamade/usaddress

ketar
fuente
0

Otra opción para las direcciones basadas en EE . UU . Es YAddress . También corrige y valida la dirección antes de dividirla en componentes. (Trabajo para la empresa que lo hace).

Michael Diomin
fuente