Porque seguro que se ve así. Para mis sitios, no permitimos el directorio de imágenes y las vistas previas son imágenes que faltan, lo que hace que el sitio se vea inestable.
¿Es este el caso y hay una manera de permitir que solo el bot de vista previa acceda a las imágenes usando robots.txt?
EDITAR: Parece que las previsualizaciones son generadas tanto por el Google Bot normal como por un bot on the fly de Google Web Preview como se menciona (brevemente) en el Blog Central de Webmaster .
Al usar un sitio: la búsqueda y mi software de monitoreo pude ver cuándo el bot llegó a mi sitio y cuando esto sucedió, las imágenes se mostraron muy bien en la vista previa. Entonces, supongo que el rastreador normal ignora las imágenes por robots.txt, pero el rastreador de vista previa obtiene las imágenes de todos modos.
Esta implementación parece un poco miserable porque mis opciones parecen ser:
- Permitir que Google Bot rastree mis imágenes (lo que no quiero hacer)
- use la etiqueta nosnippet que bloquea la vista previa, pero TAMBIÉN fragmentos (que no quiero hacer)
- Deje que aparezcan las previsualizaciones inestables que pueden afectar negativamente los clics
fuente
Respuestas:
Creo que John Mueller tenía razón en los comentarios.
No sabía que podía permitir que Google rastreara contenido sin indexarlo. Puse su técnica en su lugar y estoy esperando a que me rastreen para ver si funcionó.
Aceptaré esto como respuesta en unos días, a menos que John quiera agregar sus comentarios a la sección de respuestas para poder ganar el representante.
fuente
Como la mayor parte de la vista previa la realiza el rastreador de bot de Google, bloquear el rastreo de alguna parte de su sitio afectará la vista previa ...
¿Por qué no quieres permitir que el robot de Google rastree tus imágenes?
fuente
La siguiente es una solución técnica que puede aplicarse o no simplemente a su sitio.
Es posible (incluso probable) que Google salga con una manera de hacer esto con solo algunos consejos en metadatos o robots.txt, pero hasta entonces ...
Paso 1.
Cree un servicio de redirección / servlet para imágenes de portada.
Es decir, una URL como
/frontpageimages/[image name]
eso hace que un servidor redirija a
/images/[image name]
Paso 2.
Haga que todos los enlaces de imágenes en su página principal (y solo la página principal) se reescriban para pasar por el servicio de redirección desde el paso 1 en lugar de vincularse directamente a la imagen.
Paso 3.
Asegúrese de que robots.txt permita que googlebot se arrastre
/frontpageimages/
Esto debería garantizar que Google pueda rastrear cualquier imagen que encuentre en su página principal mientras deja las imágenes solo en otras páginas.
Si bien el servicio de redirección podría (en teoría) usarse para rastrear todas sus imágenes sin violar técnicamente su robots.txt, no es algo que los robots con buen comportamiento (como googlebot) vayan a hacer. Y los robots mal portados no se preocuparán por el archivo robots.txt.
fuente