¿Es más rápido buscar términos de búsqueda largos o cortos? ¿O afecta a la velocidad? En otras palabras, ¿debe hacer que los términos de búsqueda sean lo más exactos posible?
Hay más de 100 000 archivos y cada archivo contiene entre 20 y más de 5000 filas de datos. Por lo general, el grep se usa para encontrar solo una instancia del término de búsqueda.
Digamos que el término de búsqueda es SEARCHTERM
, y estará en una fila como esta:
NAD+DP+1234567890:92++UNIQUE+NAME+SEARCHTERM++12345+FI'
¿Es más rápido buscar "SEARCH" o "SEARCHTERM"? Digamos que en este caso no nos importa si también encontramos coincidencias en otras líneas no relacionadas.
Así es como lo hago actualmente:
grep NAD+DP 123* | grep SEARCHTERM
Pero lo encuentro bastante lento, aún. Por lo general, toma alrededor de 3-5 minutos encontrar los datos, incluso cuando conozco el nombre de archivo aproximado, lo que limita el rango a alrededor de 10 000 archivos.
Entonces, ¿ayudaría un término de búsqueda más largo o más corto? Hasta donde yo sé, grep busca "bloques" de palabras de cierta longitud?
fuente