Calidad de geocodificación: Nominatim vs PostGIS Geocoder vs. Geocoder :: US 2.0

14

De vez en cuando necesito geocodificar >> 500,000 direcciones de calles de EE. UU. (Sin entidades ni intersecciones). Me gustaría configurar un servicio de geocodificación local para manejar estos códigos geográficos masivos.

He usado el Geocoder :: US 2.0 basado en Tiger localmente en el pasado. La evaluación comparativa inicial proporciona una precisión razonable frente a las direcciones geocodificadas de Google, especialmente cuando no confío en el analizador Ruby y paso los elementos de dirección al geocodificador explícitamente.

También he leído mucho sobre el Geocodificador PostGIS . Como mis datos ya están en PostGIS, esto suena atractivo, pero no lo he configurado localmente para probarlo.

Además, alguien me recomendó que probara Nominatim localmente. No sé mucho al respecto, excepto que no está basado en Tiger (por lo que puedo decir), y me pregunto si obtendré resultados más confiables.

Mi pregunta para cualquier persona con experiencia en las soluciones anteriores: ¿Cómo se compara la precisión de las tres? Específicamente, ¿ cuál proporciona los códigos geográficos más consistentemente confiables para las direcciones de los Estados Unidos? No estoy demasiado preocupado por la velocidad o la complejidad de la configuración.

danpelota
fuente

Respuestas:

14

No he tenido la oportunidad de probar los geocodificadores estadounidenses de Nominatim y Geocoder. Sin embargo, entiendo que Geocoder y Nominatim no se pueden ejecutar directamente en la base de datos, lo que para mí es una gran desventaja porque los hace difíciles de usar en cosas como disparadores o para actualizaciones por lotes directamente en la base de datos.

El geocodificador PostGIS es un conjunto puro de funciones plpgsql de PostGIS / postgresql que se ejecuta completamente en la base de datos. Esperaría que los resultados del geocodificador Geocoder US y PostGIS estén a la par y de lo que he probado usando el material web, lo son. Google es un poco mejor ya que aprovechan los nombres de lugares.

Creo que Nominatum, ya que utiliza datos de OSM, utiliza datos de tigre indirectamente, ya que las importaciones de OSM para EE. UU. Provienen en gran parte de TIGER con correcciones aportadas por los usuarios. No estoy seguro de qué año (año) de Tiger OSM se encuentra actualmente. Al jugar con las interfaces web en línea, también aprovecha los nombres de los lugares y tiene un giro interesante, ya que le permite especificar el nivel de zoom de la geocodificación, lo que permite una geocodificación más rápida al establecer la precisión del zoom que necesita.

Divulgación completa: he estado trabajando mucho en PostGIS Geocoder y escribí el manual en línea para ello. Te diré que un error en el que estoy trabajando es que creo que la ubicación del punto que interpola está en el lado equivocado de la calle. Estoy trabajando en arreglar eso. Si no le importa de qué lado de la calle (o al menos a veces), eso puede ser un problema para usted.

Probablemente valga la pena probar con las versiones en línea que comparan algunos resultados de direcciones: por ejemplo, nominatim puede probar aquí: http://open.mapquestapi.com/nominatim/v1/search.php

Para mis casos de uso, he encontrado que la comprobación difusa de nominatum no es tan buena como la que tiene el Geocodificador de PostGIS. Por ejemplo, la dirección de mi vanidad (dirección postal) es 1 Devonshire Place, Boston MA. PostGIS devuelve una respuesta que está cerca, según recuerdo, Google devuelve una respuesta, pero no puedo hacer que Nominatim devuelva una respuesta. Para ser justos, incluso los registros de parcelas de Boston no tienen idea de dónde está y se enumeran en los registros de parcelas como washington street. PostGIS puede encontrarlo, ya que realiza varios niveles de comprobación e intersecciones de calles transversales, etc. He probado otros casos en los que escribo incorrectamente el código postal o algo así y PostGIS vuelve con un conjunto preciso de opciones. Google también lo hace.

LR1234567
fuente
Comentario adicional: Probablemente valga la pena probar con las versiones en línea que comparan algunos resultados de direcciones: por ejemplo, nominatim puede probar aquí: open.mapquestapi.com/nominatim/v1/search.php
LR1234567
¡Gracias por la respuesta! Haré algunas evaluaciones comparativas durante la próxima semana más o menos, pero hasta ahora me ha impresionado el codificador PostGIS Tiger.
danpelota
Exceptuando el
bloqueo
tigergeocoder.com utilizando datos de TIGER 2013, listos para ejecutar su propia instancia de servidor en la nube de Amazon EC2 y geocodificar más de 1,000,000 por día. PostGIS, como mencionó, también ha cargado Zillow Neighborhoods y devuelve códigos FIPS para las partes de la dirección. REST API similar a Google pero su propio servidor, no se necesita cuota.
Biba
Nominatim se ejecuta rápido y tiende a ser más preciso en 2019, datos de tigres nuevos. No estima áreas y la dirección de adivinar es simplemente mejor.
Andrew Scott Evans
-1

Técnicamente, puede apilar las bases de datos Tiger y OSM en un servidor gigante y construirlas dentro de Nominatum OSM. Tiger se puede importar fácilmente y complementa el servidor OSM.

Quienquiera que sea, la calidad de los datos que obtendrá no va a estar en la cima. OSM carece de precisión para las direcciones de calles en Estados Unidos En algunas ocasiones lo he visto a 90 millas del objetivo original.

La base de datos de Tiger tampoco es precisa debido al algoritmo de interpolación asignado para predecir las ubicaciones de los números de calles. En general, compensarán el objetivo real de 300 pies a un par de millas.

Creo que debe evaluar el tiempo y los recursos de alojamiento si crea un geocodificador propio en lugar de utilizar uno comercial. Con el comercial obtendrá ubicaciones en la azotea y no se preocupará por nada. Los precios de 500k serán de alrededor de $ 600 a $ 800 con diferentes proveedores.

ivan
fuente
2
¿Qué tiene que ver su respuesta con su empresa? Parece que está incluyendo una firma con un enlace a su sitio web bajo la apariencia de, en este caso, una exención de responsabilidad innecesaria, por lo que lo estoy editando. En cualquier caso, no incluya un enlace en ningún aviso legal.
PolyGeo