¿Google rastrea los sitios de Drupal en modo de mantenimiento?

10

Estoy usando Aegir para clonar copias de mi sitio con un nombre de subdominio, es decir, test.mydomain.com. Estas copias están en modo de mantenimiento para alejar a los spammers y las miradas indiscretas. Luego uso estas copias para realizar pruebas y trabajos de desarrollo antes de realizar cambios en mi sitio principal mydomain.com

¿Pero estoy dañando mi SEO por la existencia de estos sitios clonados? ¿Google rastrea un sitio que se ha puesto en modo de mantenimiento? ¿Me penalizará por tener tantos subdominios sin salida?

Meggy
fuente
3
Esta pregunta parece estar fuera de tema porque se trata de algoritmos internos de Google, no algo específicamente relacionado con Drupal, ni algo que podamos saber con un nivel significativo de confianza.
Mołot
77
@ Mołot ¿Cómo puede esto no estar en el tema? El modo de mantenimiento es una característica de Drupal. Existen métodos para manejar adecuadamente este escenario. Preguntar si Drupal hace lo correcto es útil para futuros lectores.
mpdonadio
2
@MPD al menos parte de "¿Me penalizará por tener tantos subdominios sin salida" no tiene ninguna relación con Drupal. Las formas en que Google puede ser dirigido a una página en modo de mantenimiento en primer lugar tampoco están relacionadas con Drupal.
Mołot

Respuestas:

21

Cuando coloca un sitio de Drupal en modo de mantenimiento, los no administradores ven la página del modo de mantenimiento estándar (suponiendo que borre las cachés después de hacerlo). Si examina la respuesta, verá que se envía de vuelta con un código de estado HTTP de 503, que desde RFC 2616 es:

503 Servicio no disponible
El servidor actualmente no puede manejar la solicitud debido a una sobrecarga o mantenimiento temporal del servidor. La implicación es que esta es una condición temporal que se aliviará después de algún retraso. Si se conoce, la duración del retraso PUEDE indicarse en un encabezado Retry-After. Si no se da Retry-After, el cliente DEBE manejar la respuesta como lo haría para una respuesta 500.

Y del blog oficial de Google Webmaster :

Si mi sitio está fuera de servicio por mantenimiento, ¿cómo puedo decirle a Googlebot que regrese más tarde en lugar de indexar la página "fuera de servicio por mantenimiento"?
Debe configurar su servidor para que devuelva un estado de 503 (red no disponible) en lugar de 200 (exitoso). Eso le permite a Googlebot saber probar las páginas nuevamente más tarde.

Por lo tanto, eso demuestra que Drupal hace lo correcto y que Google volverá a visitar su sitio y las páginas de índice la próxima vez que recupere un código de estado que no sea 5XX.

mpdonadio
fuente
2
La página de inicio de sesión del usuario continuará devolviendo un código de estado 200 OK (y también mostrará bloques y elementos que normalmente no son visibles en el modo de mantenimiento ( # 722434 )); sin embargo, robots.txt tiene una directiva Disallow: para la página de inicio de sesión, por lo que los bots con buen comportamiento aún no la indexarán.
Garrett Albright
Este es un buen punto con respecto a la página de mantenimiento en sí, el código de respuesta 503 significa que Google no indexará esa página de mantenimiento.
David Thomas
6

A menos que haya hecho algo personalizado para permitirlo, Google no puede rastrear su sitio en modo de mantenimiento.

Debido a que necesita iniciar sesión para ver, googlebot verá la página de mantenimiento designada.

Para obtener pautas adicionales de Google, consulte los siguientes enlaces:

David Thomas
fuente
Creo que el punto era que no querrías que Google indexara la página de mantenimiento.
Fuzzy76
2

Tus preocupaciones:

Si no sabe si el modo de mantenimiento está bloqueando "todo lo que desea bloquear" en un 100% (!), Pero al mismo tiempo está muy preocupado por "si alguien como Google aún podría acceder a él". ... entonces el modo de mantenimiento podría ser una mala opción para bloquear su sitio de desarrollo en primer lugar.

Recomendación:

Personalmente, recomiendo simplemente agregar un .htpasswd a sus sitios de desarrollo.

Es fácil de automatizar incluso dentro de implementaciones de aegir. Nunca se interpone en su camino, porque su navegador y todas las herramientas de línea de comandos pueden omitirlo. Puede dejar entrar a otras personas. Bloquea el sitio en su totalidad al 100% para google, etc.

usuario18099
fuente