Uso Drupal 7 y estoy intentando usar la metaetiqueta "noindex" para evitar que los motores de búsqueda indexen http://example.com/comment/reply/43/738 .
La página de comentarios / respuestas se está indexando, a pesar de que he utilizado la siguiente función en robots.txt:
Disallow: /comment/reply/
¿En qué archivo de plantilla tendré que incorporar la metaetiqueta "noindex" para / comment / reply / pages?
robots.txt
archivo?Respuestas:
Puede usar cualquiera de este código en robots.txt:
Esto descuidará cada URL que contenga comentarios .
También puede usar lo siguiente para descuidar cada URL que contenga / comente .
Después de hacer esto, verifique si funciona o no utilizando el verificador Google Robots.txt .
fuente
En el template.php de su tema, o en page.tpl.php, puede verificar la url de la página para ver si la página es una página de comentarios, luego agregar código que inserte la metaetiqueta.
Puede hacerlo en la función template.php YOURTHEME_preprocess_html (), o insertarlo en algún lugar cerca de la parte superior de page.tpl.php. El código para agregar sería algo como esto:
Ver drupal_add_html_head () .
fuente
Actualización : lo siguiente funciona, se imprime
<meta name="robots" content="noindex,follow" />
en la sección de encabezado de todas las páginas a las que se accede a través de una ruta que comienza concomment
. Esto es para evitar el hecho de que una página como comment / 3 lleva internamente node / nid como argumentos, como jmarkel señaló anteriormente.Con la ayuda de un comentario útil sobre la función arg .
Con suerte, esto eventualmente será abordado por el módulo Meta Tags: hay una solicitud de función , pero aún no está claro si el autor del módulo desea admitir esto.
[Mi comentario anterior] Solo quería agregar que el uso de robots.txt no es la respuesta, como ya lo notó, los enlaces siguen apareciendo en los resultados de búsqueda a pesar de usarlos
Disallow: /comment
. Esto se espera, ya que robots.txt le dice al bot que no rastree esas páginas, pero no le dice a Google que no lo indexe. Como se explica en SEOmoz Robots.txt y las mejores prácticas de Meta Robots para la optimización de motores de búsqueda :fuente