Tengo un mapa del sitio que se genera a diario con muchos enlaces a páginas de productos. Estos productos se importan diariamente desde otra fuente de datos. Debido a que la actualización consiste en descartar toda la información actual del producto y reemplazarla con la nueva información importada, la última fecha de modificación siempre salta un día. Esto también se usa en el mapa del sitio. Incluso para productos que no han cambiado. Todas las páginas de productos fingen haber sido actualizadas.
¿Google penalizará al sitio web por fingir que las páginas han cambiado día a día mientras no?
Mi solución sería cambiar la entrada solo si los nuevos datos del producto importado difieren de los datos anteriores. Solo quiero asegurarme de que esta sea una actualización útil, mientras que también podría dedicar mi tiempo a otras mejoras.
fuente
Nunca me ha gustado la idea de actualizar
<lastmod>
todos los días, ya que no solo está mal, es engañoso en los motores de búsqueda.En una publicación sobre SO , Gary Illyes de Google escribió:
En general, he abogado por usar
<lastmod>
correctamente o no usarlo en absoluto. Dejarlo apagado (así como<changefreq>
&<priority>
) incluso hace que el archivo en sí sea más pequeño y más rápido para que los motores de búsqueda también lo lean.fuente
No. Google lo usará
lastmod
como una pista (igual que todos los valores del mapa del sitio), pero si decide que su contenido no se actualiza diariamente, simplemente lo ignorará y volverá a visitar sus páginas en su propio horario.fuente
No trabajo para Google, y no puedo decir con certeza lo que realmente hacen, pero la forma sensata para que traten las
<lastmod>
marcas de tiempo sería como pistas para no perder el tiempo volviendo a rastrear páginas que no han cambiado.Entonces, si informa que todas sus páginas se cambian todos los días, Googlebot seguirá rastreando todas sus páginas en el orden que le parezca, en lugar de centrarse solo en las páginas que han cambiado. En efecto, es como si no informara ninguna marca de tiempo de la última modificación.
La razón principal para proporcionar
<lastmod>
marcas de tiempo correctas es hacer que los cambios en su sitio se muestren más rápido en el índice de Google. Si tiene cientos de páginas en su sitio, Google tardará un tiempo en rastrearlas y encontrar cualquier cambio. Sin embargo, si le dice a Googlebot qué páginas han cambiado recientemente, puede rastrear esas páginas primero y evitar perder mucho tiempo en el resto.Por supuesto, podría aumentar la tasa de rastreo de Googlebot en Herramientas para webmasters de Google y esperar lo mejor. Pero realmente, no debería ser demasiado difícil hacer que su script de actualización conserve las marcas de tiempo. Por ejemplo, supongo que actualmente estás haciendo algo como esto:
Si es así, simplemente cámbielo a algo como esto en su lugar:
fuente
No, simplemente ignora la información que ha proporcionado cuando es incorrecta. En este caso, los rastreadores web determinan por sí mismos con qué frecuencia deben rastrear sus páginas.
fuente
Google no te penalizará por esto. Para obtener una penalización, realmente debes ponerte el sombrero negro en el culo de Google, así que no te preocupes por eso. Google descubrirá pronto si su contenido tiene cambios (eso es en lo que han estado trabajando en los últimos años) y usará la propiedad lastmod como una pista.
fuente
Le sugiero que lea estas Mejores prácticas para mapas de sitio XML y fuentes RSS / Atom
fuente