Leí las respuestas en esta pregunta, pero todavía dejan mi pregunta abierta: ¿Google almacena el caché robots.txt?
No encontré una manera en las Herramientas para webmasters de Google para invocar una descarga de mi robots.txt .
Por algún error, mi robots.txt fue reemplazado por:
User-agent: *
Disallow: /
Y ahora todo mi contenido fue eliminado de los resultados de búsqueda de Google.
Obviamente, estoy interesado en corregir esto lo antes posible. Ya reemplacé el archivo robots.txt , pero no encuentro la manera de hacer que Google actualice la versión en caché.
google
google-search-console
robots.txt
Der Hochstapler
fuente
fuente
Respuestas:
No puede hacer que vuelvan a descargar su archivo robots.txt cuando lo desee. Google lo volverá a rastrear y utilizará los nuevos datos siempre que lo considere apropiado para su sitio. Tienden a rastrearlo regularmente, por lo que no esperaría que se demore mucho en encontrar su archivo actualizado y volver a rastrear e indexar sus páginas. Tenga en cuenta que puede pasar algún tiempo después de que se encuentre el nuevo archivo robots.txt antes de que se vuelvan a rastrear sus páginas y aún más tiempo para que reaparezcan en los resultados de búsqueda de Google.
fuente
Me enfrenté al mismo problema cuando comencé mi nuevo sitio web
www.satyabrata.com
el 16 de junio.Yo tenía una
Disallow: /
en mi robots.txt , exactamente igual que Oliver. También había un mensaje de advertencia en las Herramientas para webmasters de Google sobre las URL bloqueadas.El problema se resolvió ayer, 18 de junio. Hice lo siguiente. No estoy seguro de qué paso funcionó.
www.satyabrata.com
El mensaje de advertencia sobre las URL bloqueadas desapareció ahora y se muestra un nuevo archivo robots.txt descargado en las Herramientas para webmasters de Google.
Actualmente, solo tengo dos páginas indexadas en Google, la página de inicio y el archivo robots.txt . Tengo 10 páginas en el sitio web. Espero que el resto se indexe pronto.
fuente
Tuve un problema en el que las imágenes se movieron a un servidor CNAME separado y se colocó un rechazo en la carpeta de imágenes. La forma en que lo borré fue recuperar los archivos robots.txt en la página web de Herramientas para webmasters de Google como herramienta de Google. Una vez que me dijo que había recuperado y leído el archivo robots.txt, lo envié. Esto rompió un embargo de tres meses en el escaneo de imágenes en el que Google informó que estaba leyendo el archivo robots.txt pero que no estaba cambiando su araña para que coincidiera con las reglas que se cambiaron para permitir la carpeta de imágenes. En una semana, las imágenes se indexaron nuevamente.
Podría valer la pena intentarlo. Se sabe que Google ocasionalmente se atasca y no puede releer el archivo.
fuente
Espero que este enlace lo ayude a rastrear sus sitios web: https://support.google.com/adsense/answer/10532?hl=es .
Eliminar
/
de su archivo robots.txt .fuente
En mi caso, el problema era que estaba usando un servicio de DNS gratuito llamado miedo.org
(mi dominio gratuito terminó en
.us.to
)Una vez que hice la transición a un TLD, comenzó a funcionar.
fuente