En robots.txt, ¿puedo escribir la siguiente URL relativa para el archivo de mapa del sitio?
sitemap: /sitemap.ashx
¿O tengo que usar la URL completa (absoluta) para el archivo de mapa del sitio, como:
sitemap: http://subdomain.domain.com/sitemap.ashx
Por qué me pregunto
- Tengo un nuevo servicio de blog, www.dominio.com, que permite a los usuarios bloguear en accountname.domain.com.
- Uso comodines, por lo que todos los subdominios (cuentas) apuntan a "blog.domain.com".
En blog.domain.com puse el archivo robots.txt para permitir que los motores de búsqueda encuentren el mapa del sitio. Pero, debido a los comodines, todas las cuentas de usuario comparten el mismo archivo robots.txt. Es por eso que no puedo usar la segunda alternativa. Y por ahora no puedo usar la reescritura de URL para archivos txt. (¿Supongo que las versiones posteriores de IIS pueden manejar esto?)
fuente
robots.txt
sin la R mayúsculahttp
yhttps
, solo debe proporcionar un mapa del sitio (con la variante canónica) .Los rastreadores de Google no son lo suficientemente inteligentes, no pueden rastrear las URL relativas, por eso siempre se recomienda usar URL absolutas para una mejor rastreabilidad e indexación.
Por lo tanto, no puede usar esta variación
La sintaxis recomendada es
Nota:
fuente
Buena pregunta técnica y lógica mi querido amigo. No en el archivo robots.txt no puede ir con la URL relativa del mapa del sitio; debe ir con la URL completa del mapa del sitio.
Es mejor ir con "mapa del sitio: https://www.example.com/sitemap_index.xml "
En la URL anterior después de los dos puntos da espacio. También me gusta apoyar a Deepak.
fuente