Acabo de actualizar mi archivo robots.txt en un nuevo sitio; Google Webmaster Tools informa que leyó mi robots.txt 10 minutos antes de mi última actualización.
¿Hay alguna forma de alentar a Google a que vuelva a leer mi archivo robots.txt lo antes posible?
ACTUALIZACIÓN: en Configuración del sitio | Acceso al rastreador | Probar robots.txt:
El acceso a la página de inicio muestra:
Googlebot está bloqueado en http://my.example.com/
FYI: el archivo robots.txt que Google leyó por última vez se ve así:
User-agent: *
Allow: /<a page>
Allow: /<a folder>
Disallow: /
¿Me pegué un tiro en el pie, o eventualmente leerá: http: ///robots.txt (como lo hizo la última vez que lo leyó)?
¿Alguna idea sobre lo que necesito hacer?
Respuestas:
En caso de que alguien más se encuentre con este problema, hay una manera de obligar a google-bot a volver a descargar el archivo robots.txt.
Vaya a Salud -> Obtener como Google [1] y haga que busque /robots.txt
Eso volverá a descargar el archivo y Google también volverá a analizar el archivo.
[1] en la interfaz de usuario anterior de Google era 'Diagnóstico -> Obtener como GoogleBot'.
fuente
Disallow: /
. En cambio, la búsqueda informa "Denegado por robots.txt": /.Sé que esto es muy antiguo, pero ... Si subió el archivo robots.txt incorrecto (no permite todas las páginas), puede intentar lo siguiente:
a medida que google intenta leer el mapa del sitio xml, lo verificará de nuevo contra robots.txt, lo que obligará a google a volver a leer su robots.txt.
fuente
OKAY. Esto es lo que hice, y en unas pocas horas, Google volvió a leer mis archivos robots.txt.
Tenemos 2 sitios por cada 1 sitio que ejecutamos. Llamémosles el sitio canónico (www.mysite.com) y el sitio de dominio simple (mysite.com).
Tenemos nuestros sitios configurados para que mysite.com siempre devuelva un 301 redirigiendo a www.mysite.com.
Una vez que configuré ambos sitios en las herramientas para webmasters de Google, le dije que www.mysite.com es el sitio canónico, poco después leí el archivo robots.txt en el sitio canónico.
Realmente no sé por qué, pero eso fue lo que sucedió.
fuente
Acorte el intervalo de escaneo de Google por algunos días.
Además, he visto el botón para verificar su archivo robots.txt, esto podría forzarlo a google, pero no estoy seguro.
fuente