¿Cuáles son los métodos utilizados por los servicios de GeoIP además de la información de WHOIS? [cerrado]

11

Me preguntaba cómo los servicios de GeoIP recopilan datos sobre la ubicación geográfica de IP además de verificar la información de WHOIS de la dirección IP. Por ejemplo, me topé con este sitio web, que dice que la IP 74.207.244.221 se encuentra en Fremont, California: https://ipinfo.io/74.207.244.221

Pero no puedo encontrar esta información en esta información de IP whois. ipinfo.io afirma que:

Originalmente, nuestra API utilizaba datos de MaxMind, pero hemos estado muy ocupados trabajando en la creación de nuestros propios datos de geolocalización. Hemos progresado mucho y ahora usamos nuestros propios datos para atender alrededor de la mitad de todas las solicitudes. Sin embargo, todavía recurrimos a los datos de MaxMind

Y esto me interesó, ¿cuáles son las formas en que servicios como ipinfo.io y MaxMind recopilan datos GeoIP?

Aprendiz
fuente

Respuestas:

11

Dichos servicios suelen usar 3 formas de geolocalizar una dirección IP:

  1. Revisando las bases de datos whois para buscar una dirección;
  2. Rastrear consultas DNS inversas para intentar encontrar pistas basadas en registros de nombres de dominio o rastrear la ruta del paquete enviado al destino, lo que también podría dar pistas (usando traceroute, por ejemplo).
  3. Y, por último, utilizan la triangulación RTT.

La triangulación del tiempo de ida y vuelta (RTT) es un método utilizado para obtener la geolocalización aproximada de una dirección IP midiendo la latencia de ping desde tres ubicaciones diferentes.

Por ejemplo, si tiene tres servidores repartidos por todo el mundo en forma de triángulo, y si hace ping a una dirección IP de los tres y obtiene los mismos resultados para la latencia, eso significaría que la dirección IP se encuentra justo en El centro de ese triángulo. Es la forma en que funciona la triangulación, sin embargo, en este caso se usa con pings ICMP.

Recursos que puede leer:
¿Qué es ping? @ Wikipedia
SIGCOMM artículo sobre triangulación RTT

Fanatico
fuente
55
Wow, nunca pensaría que hay una triangulación basada en RTT. Interesante. Entonces, si algún servidor quisiera evitar ser geolocalizado, podría introducir un retraso aleatorio en las respuestas ICMP.
Estudiante
Me gustaría agregar que podría ser útil mirar tracert / traceroute, como escribió en iplocation.net: "Puede usar el comando 'traceroute' para encontrar pistas sobre la ubicación de la dirección IP. Los nombres de los enrutadores a través de los cuales los paquetes que fluyen desde su host al host de destino podrían indicar la ruta geográfica de la ubicación final ".
Estudiante
1
@Learner es una buena adición, sin embargo, eso ya está en mi respuesta en forma de "seguimiento de consultas DNS inversas". Aunque traceroute realmente no hace eso, le muestra todos los dominios / direcciones a través de los cuales viaja una consulta. Sin embargo
agregaré
5

Soy el fundador de IPinfo , ¡así que definitivamente puedo ofrecer algunos detalles sobre esto! No hay un solo método que usemos, o una sola fuente de datos, para producir nuestra propia base de datos de geolocalización (o cualquiera de nuestros otros conjuntos de datos, como IP a empresa o IP a operador). ¡Es una combinación de un conjunto de diferentes conjuntos de datos, técnicas de procesamiento de datos y lecciones aprendidas haciendo esto desde hace varios años!

Algunas fuentes de datos y técnicas que no se mencionan con frecuencia incluyen:

  • Alimentaciones directas de los ISP. Nuestro servicio maneja alrededor de 500 millones de solicitudes API por día, y se utiliza en muchos sitios web populares de alto perfil. Por lo tanto, los ISP tienen el incentivo de proporcionarnos datos de geolocalización precisos y actualizados para que sus clientes obtengan una gran experiencia en la web. Estamos trabajando directamente con más y más ISP todo el tiempo.

  • Datos de ubicación GPS. Es posible recopilar información de ubicación precisa con GPS en dispositivos móviles. Puede vincular eso con la dirección IP y algunas inferencias de topología de red para calcular la ubicación de los rangos de IP con solo unas pocas mediciones.

  • Correcciones enviadas por el usuario. Cuando nos equivocamos en la ubicación (o no se ha actualizado después de un cambio), a menudo recibimos rápidamente comentarios de los usuarios, y podemos corregir manualmente la ubicación o ajustar nuestro algoritmo para asegurarnos de que esté ubicado correctamente en la próxima ejecución de nuestra tubería de procesamiento de datos.

Para nuestro conjunto de datos de IP a empresa, de hecho eliminamos todos los nombres de dominio todos los meses y hacemos referencias cruzadas de los datos que extraemos allí con información de propiedad de IP, registros de quién es y más. Luego también usamos los datos de raspado de dominio para mostrar qué dominios están alojados en qué direcciones IP, y también en nuestro clasificador de tipo de IP, junto con muchas otras fuentes de datos, para determinar la probabilidad de que una dirección IP se use principalmente como un ISP residencial, empresa o proveedor de alojamiento. También analizamos la estructura de enlaces de esas páginas, y mostrar algunos de estos datos en host.io .

Ben Dowling
fuente
¡Gracias! No esperaba que el fundador de este sitio web respondiera a mi pregunta :) Fue muy interesante.
Aprendiz