¿Conoces algún buen recurso sobre algoritmos de geocodificación?
Estoy particularmente interesado en el análisis de consultas de direcciones, incluidas las partes de coincidencia y ponderación de la consulta, el tratamiento de errores ortográficos y variaciones, así como los detalles sobre el almacenamiento de datos físicos (por ejemplo, esquemas para consultas directas de bases de datos relacionales, enfoques para la indexación de datos, etc.) .
He estudiado algunos documentos sobre la geocodificación de ArcGIS 10, pero tocan un poco los detalles de implementación reales. La documentación detallada de otras implementaciones de producción de alta calidad también podría ser útil. Cuanto más técnico, mejor. Los documentos de algoritmos teóricos también son geniales.
Gracias.
El documento al que se vincula Mapperz es muy bueno y tiene muchas citas que probablemente serán de interés, pero no creo que hagan un muy buen trabajo al describir la coincidencia de cadenas y su importancia para el proceso de geocodificación. Mencionaron brevemente Soundex , pero Soundex no es la única opción y ni siquiera la mejor opción para las direcciones IMO. Enumeraron bastantes citas que son relevantes para el tema, por lo que esos documentos serán de su interés.
Este hilo en el sitio de intercambio de estadísticas habla sobre la coincidencia difusa de dos conjuntos de cadenas, y todas las mismas técnicas se aplican al hacer coincidir direcciones. Particularmente creo que usar distancias de edición tiene más sentido que Soundex, especialmente con detalles de dirección que no tienen análogo Soundex. Calcular la distancia de Levenshtein entre dos cadenas no es tan complicado, y hay muchos ejemplos flotando en Internet ( aquí hay uno en Python).
Acabo de pasar la última hora tratando de encontrar cómo ESRI implementa su sensibilidad ortográfica y sus diferentes puntajes de candidatos y partidos. No he encontrado nada más que descripciones simples (la mejor de las que encontré en este PDF y la sección de ayuda en línea de 9.3 ). Entonces, si alguien puede señalarme una documentación más detallada, agradecería también el OP.
fuente
La Universidad de Carolina del Sur cuenta con servicios de procesamiento de direcciones y geocodificación para los cuales han publicado algunos detalles técnicos. Tienen muchas buenas referencias en su sitio.
fuente
La lista de correo GEOREFERENCING proporcionada por UK JISC https://www.jiscmail.ac.uk/cgi-bin/webadmin?A0=GEOREFERENCING
Mi blog (sección de geocodificación) contiene publicaciones ocasionales sobre geocodificación y resolución de topónimos (su primo no estructurado): http://bit.ly/lQ0Sjs
fuente
Un buen recurso para estudiar geocodificación https://webgis.usc.edu/Services/Geocode/About/TechnicalDetails.aspx
fuente