Un archivo de Sitemap ayuda a los motores de búsqueda a descubrir URL nuevas y actualizadas en su sitio web. En particular, si su sitio web es bastante grande, esto puede ayudarlos a poder centrarse en el contenido nuevo y actualizado, en lugar de tener que rastrear ciegamente todo para ver si algo ha cambiado. Eso puede resultar en que el contenido nuevo se encuentre mucho más rápido, lo que puede ser bastante notable, especialmente si el sitio es más grande o más complejo.
Con Google en particular (trabajo en Google; no sé cómo otros motores de búsqueda manejan esto), también hace lo siguiente:
- Encuentre el número de URL indexadas para su sitio web: estas estadísticas se recalculan diariamente y son muy precisas. Puede encontrarlos en la página de detalles de Sitemaps .
- Descubra problemas de canonicalización: si los números no coinciden , con frecuencia es una señal de que está especificando URL en el archivo de Sitemap que no coinciden con lo que encontramos durante nuestro rastreo. Esa suele ser una señal de que necesita trabajar en la canonicalización .
- Ayuda con la canonicalización: cuando encontremos múltiples URL en su sitio que muestren contenido idéntico, le daremos una ventaja adicional a cualquier URL que figure en un Sitemap, incluso si no utiliza otros métodos de canonicalización.
- Encuentre partes de su sitio mal indexadas: estos recuentos se proporcionan por archivo de Sitemap, para que pueda crear archivos de Sitemap separados para secciones lógicas de su sitio, para descubrir áreas donde Google no está indexando tanto como desea.
- Priorice los errores de rastreo: en la sección de errores de rastreo , las URL que se especificaron en los archivos de Sitemaps se enumeran por separado. Dado que proporcionó específicamente estas URL, asumimos que desea indexarlas y que cualquier error de rastreo allí es importante.
Además, puede usar varias extensiones en los archivos de Sitemaps (por ejemplo, para imágenes, video, noticias o internacionalización), si decide hacerlo. Estas extensiones son todas opcionales.
Para la mayoría de los sitios web, el elemento más visible de los archivos de Sitemaps es que puede ver el recuento de URL indexado. Puede tardar un día en aparecer, por lo que si acaba de enviar un Sitemap por primera vez, es posible que tenga que ser un poco paciente. Si bien otras formas (por ejemplo, un sitio: -consulta) son aproximaciones muy, muy aproximadas, este recuento es extremadamente exacto.
Editado para agregar: otra cosa que personalmente encuentro extremadamente útil con respecto a Sitemaps es que si no los está generando directamente con su CMS, invariablemente descubre mucho sobre cómo su sitio web se puede rastrear y qué tipo de URL se descubren durante ese proceso He visto muchos casos en los que rastrear un sitio web con una herramienta a su lado (por ejemplo, un generador de Sitemaps) generará problemas que de lo contrario podría perderse, ya sean identificadores de sesión en URL, contenido duplicado a través de diferencias de URL, espacios infinitos (como como calendarios sin fin), o incluso partes de un sitio que no están vinculados en absoluto.
Si no recibe ningún error, puede suponer que Google lo ha analizado y conoce el contenido. Pero eso no significa que rastrearán o indexarán esas páginas. Los sitemaps son solo otra forma de informar a los motores de búsqueda acerca de sus páginas. No están obligados a rastrear e indexar ninguna o todas esas páginas. Lo mismo se aplica a encontrar páginas a través de enlaces o envíos de URL.
fuente
Google generalmente hace un buen trabajo al rastrear su sitio web si tiene una buena cantidad de enlaces de calidad. Si pasa mucho tiempo mirando la cantidad de páginas que ha indexado, le sugiero que mejore su sitio y obtenga algunos enlaces de calidad.
fuente
Tal vez una herramienta de validación de mapa del sitio como esta , aunque nunca he "visto" que el mapa del sitio comience a funcionar.
fuente
Para un sitio web más grande, por ejemplo, un sitio web con cientos, miles o millones de páginas, es bastante útil. Teníamos en nuestro sitio de la empresa 400 000 páginas donde las URL se crearon dinámicamente por ID de contenido y los parámetros de URL se usaron con &, las Herramientas para webmasters de Google le proporcionarán comentarios sobre las páginas rastreadas y le mostrarán errores, puede depurar o abrir la página y mira por ti mismo lo que está mal. De esta manera, Google realmente nos ayudó a hacer un mejor sitio web y nos evitó muchas veces la vergüenza.
También es útil para ver el número de páginas indexadas frente al número de rastreadas.
Para sitios web más pequeños, si el sitio web es un pequeño grupo de páginas .html donde cada página está vinculada a través del menú y el sitio no se actualiza con frecuencia, si carga el mapa del sitio, nada cambiará en los resultados de búsqueda. No tendrá ninguna ventaja de cargar el mapa del sitio sobre alguien que no cargó el mapa del sitio.
También solía tener unos 20 sitios web pequeños, donde tenía mapas de sitio generados por cron script automáticamente y dejé de hacerlo. Un día descubrí que mi error no generó correctamente los archivos XML durante aproximadamente 6 meses, pero afortunadamente Google ignoró mi error e indexó estos sitios web por completo, incluso cuando los mapas del sitio tenían errores, Google usa el mapa del sitio solo como una pista de dónde ir, no muy serio.
fuente