¿Cómo hacer que wget IGNORE ciertos archivos?

0

¿Cómo hago que wget IGNORE ciertos archivos? Pregunto, ya que los descarga y los elimina después, ya que no son obligatorios (están excluidos). Pero, ¿existe una opción para IGNORE ellos antes incluso de comenzar a descargarlos?

Además, ¿se -Xaplica también a los archivos, al igual que a los directorios?

Ejemplo:

wget -A pdf -r -l 1 -X /ABC/,/index.html -i log.txt

¿O tener el archivo descargado y ejecutarlo con -comitirlo?

Samuel Shifterovich
fuente
puede intentar --reject jpg, png --aceptar html, pdf
arana
@arana No, no quiero almacenar 30'000 archivos html de log.txt. Quiero almacenar 30'000 archivos pdf, pero no html. Los únicos archivos html que estoy dispuesto a almacenar son los que se repiten, y ese es /index.html. Los 30,000 archivos html individuales restantes se deben descargar, rastrear usando -r y luego eliminar.
Samuel Shifterovich
Quería usar el modificador --reject, ese era un ejemplo, puede rechazar cualquier patrón que desee y si usa --rejectregex puede rechazar archivos que especifiquen expresiones regulares.
arana
--rejectregex es para rechazar archivos por nombre y no por la extensión entonces?
Samuel Shifterovich
no, puede usar -reject para excluir por nombre, solo proporcione la lista de los nombres que no desea, rechazar-regexp es para patrones más complejos.
arana