La base de datos de bloqueadores de anuncios que he estado usando durante años se ha hinchado mucho con el tiempo, y ahora está llena de muchos dominios obsoletos (algunos ni siquiera son válidos). Quiero recortarlo, pero no estoy seguro de cómo hacerlo mejor.
Lo que intenté fue crear un archivo por lotes que analice el archivo y haga ping a cada dominio, luego, dependiendo del nivel de error, escribe el nombre de dominio en el archivo live
o dead
. Esta es una solución decente, pero tiene al menos un par de problemas:
- No tiene en cuenta los servidores que descartan pings
- Incluso con los interruptores
-n 1
y-w 1000
, muchos dominios aún tardan 10 segundos en agotar el tiempo de espera - Prueba uno a la vez, por lo que puede llevar mucho tiempo terminar
¿Alguien tiene alguna sugerencia sobre cómo probar si una lista de nombres de dominio está viva? Requisitos:
- No importa si la solución es línea de comandos o GUI
- No estoy demasiado preocupado por perder algunos servidores que descartan ICMP (el tiempo es más importante)
- No debería probar demasiados a la vez, o mi ISP no estará contento (preferiblemente configurable)
networking
domain
Synetech
fuente
fuente
Respuestas:
¿Puedo sugerir python? Actualizaré esta respuesta con el código probado cuando vuelva a mi PC, pero se vería algo así
Con blocklist.txt como:
Y good.txt:
bad.txt:
fuente