Encontrar páginas en una página web que contienen un enlace determinado

3

Google hace un buen trabajo al encontrar información relevante.

Digamos que googleo: la opinión de la FDA sobre ISO-9001

Luego encuentra un enlace a un PDF en fda.gov http://www.fda.gov/downloads/MedicalDevices/DeviceRegulationandGuidance/PostmarketRequirements/QualitySystemsRegulations/UCM134625.pdf

Pero, ¿cómo encuentro la página en fda.gov que realmente enlaza con este .pdf?

Así que puedo ver en qué aspectos esto fue publicado por la FDA (el documento en sí no contiene mucha información sobre cuándo y para quién fue publicado).

Norfeldt
fuente

Respuestas:

1

Si recuerdo bien, existe el link:comando que puedes escribir en la página de Google [ 1 ] :

link: www.yoursite/path/to/yourfile.pdf

Se refiere [ 2 ] que con info: siteusted puede obtener las páginas que enlazan con el sitio.

info : obtenga información sobre una dirección web, incluida la versión en caché de la página, páginas similares y páginas que enlazan con el sitio. Ejemplo: información: google.com

ACTUALIZAR:

Expresamente para su enlace escribí en google

link: www.fda.gov/downloads/MedicalDevices/DeviceRegulationandGuidance/PostmarketRequirements/QualitySystemsRegulations/UCM134625.pdf 

El primer enlace es esta página que en la línea 683] enlaza a su archivo. Tenga en cuenta que no puse http://antes.

Hastur
fuente
No se pudo hacer funcionar ... ¿Pero ni siquiera estoy seguro de que la página exista? buscar en el sitio de la FDA da UCM134625.pdf solo da un resultado y este es para el archivo. google2.fda.gov/… *
Norfeldt
@Norfeldt Respuesta actualizada. Tenga en cuenta que agregué un espacio incluso si se decía que lo evitaría ( ! ). En general, puede encontrar fácilmente que más de una página está vinculada al mismo archivo. O que la página que se vinculó una vez ya no existe pero el archivo todavía está disponible ... si no puede encontrar la página (busque también en el historial de su navegador) puede intentar encontrar algo en caché copy ...
Hastur
El link:operador ya no es compatible con Google. El texto en su consulta se está interpretando literalmente comolink www.fda.gov/downloads/MedicalDevices/DeviceRegulationandGuidance/PostmarketRequirements/QualitySystemsRegulations/UCM134625.pdf
James P
@ James Probablemente tenga razón, incluso si en esta página de ayuda todavía se informa como ejemplo ... Por cierto, da al menos una página que contiene el enlace. Solo para tener en cuenta que cuando investigo con o sin :él me da un resultado ligeramente diferente (188 vs 196 enlaces). Si uso href(en lugar de link) disminuye el número de entradas encontradas.
Hastur
¡Muchas gracias por la ayuda! Creo que mi problema podría haber sido causado por el hecho de httpque olvidé eliminarlo antes de buscar.
Norfeldt