El sitio web en el que estoy trabajando tiene algunos cientos de archivos PDF. No creo haber visto a ninguno de ellos volver en una búsqueda, pero están vinculados directamente desde nuestro sitio. También están llenas de palabras clave porque son documentos de productos.
¿Hay algo especial que debamos hacer para que Google u otros motores de búsqueda los rastreen?
¿Existe alguna regla estricta y rápida para crear archivos PDF que ayuden a Google a que les guste más? Por ejemplo, ¿debería ejecutarlos a través de ghostscript para limpiar las etiquetas PDF rotas que Adobe crea durante la generación?
Respuestas:
Google definitivamente indexa archivos PDF y puede buscar solo archivos PDF agregando
filetype:pdf
a su consulta de búsqueda ( ejemplo ).Diría que las principales cosas que hacer para optimizar un PDF para que se indexe fácilmente serían:
Para obtener más consejos, lea Optimización de documentos PDF y Once consejos para optimizar archivos PDF para motores de búsqueda
fuente
No estoy seguro acerca de otros motores de búsqueda, pero en lo que respecta a Google, la regla principal sería no excluirlos a través de robots.txt
Este fue su anuncio inicial de apoyar la búsqueda de PDF.
fuente
Al igual que hacer que un sitio web sea compatible no puede dañar con su SEO, hacer que su PDF sea accesible no puede dañar. El comprobador de accesibilidad incorporado de Adobe está lejos de ser perfecto, pero al menos arreglar esas áreas lo ayudará a comenzar.
Probablemente dedico 5 minutos a cada 4 o 5, principalmente PDF de texto que ponemos en línea. El tiempo aumenta de manera uniforme dependiendo del número de páginas y de lo complejas que sean esas páginas.
Suponiendo que tiene Adobe Acrobat Pro para hacer su edición:
Para una edición más avanzada, como tablas y errores de Adobe realmente extraños, utilizamos un complemento llamado CommonLook. CommonLook hace el trabajo, pero lo odio casi tanto como odio las herramientas de Adobe.
Familiarícese con la herramienta Retocar orden de lectura, la barra de herramientas Etiquetas, la barra de herramientas Orden de lectura y la barra de herramientas Contenido. Mi trabajo requiere documentos totalmente compatibles antes de salir a la web, pero cualquiera podría beneficiarse de algunas propiedades simples de etiquetado y documentos.
fuente