¿Qué es el contenido duplicado y cómo puedo evitar que me penalicen en mi sitio?

36

Esta es una pregunta general de la comunidad sobre el contenido duplicado.

Si su pregunta se cerró como un duplicado de esta pregunta y considera que la información proporcionada aquí no proporciona una respuesta suficiente, abra una discusión sobre Pro Webmasters Meta .


  1. ¿Qué considera Google contenido duplicado?
  2. ¿La forma en que estoy presentando mi contenido resultará en una penalización por contenido duplicado?
  3. ¿Cómo puedo evitar que el contenido de mi sitio sea tratado como contenido duplicado?
libre de danle
fuente

Respuestas:

31

La guía para webmasters Contenido duplicado de Google define el contenido duplicado (para fines de optimización de motores de búsqueda) como "bloques sustantivos de contenido dentro o entre dominios que coinciden completamente con otro contenido o son apreciablemente similares".

La guía de Google enumera lo siguiente como ejemplos de contenido duplicado:

  • Foros de discusión que pueden generar páginas regulares y despojadas dirigidas a dispositivos móviles
  • Almacenar elementos mostrados o vinculados a través de múltiples URL distintas
  • Versiones de páginas web solo para impresoras

Sanciones

Los motores de búsqueda deben penalizar algunas instancias de contenido duplicado que están diseñadas para enviar spam a su índice de búsqueda, tales como:

  • sitios de raspadores que copian contenido al por mayor
  • técnicas simplistas de hilado de artículos que generan contenido "nuevo" al reemplazar selectivamente las palabras en el contenido existente.

Cuando los motores de búsqueda encuentran contenido duplicado, pueden:

  • Penalizar un sitio completo que contiene contenido duplicado. (cuando es spam)
  • Elija una página como fuente canónica del contenido y reduzca la prioridad o no indexe la otra página con la duplicación. (común)
  • No realice acciones punitivas e indexe varias copias del contenido (raro)

Evitar la duplicación interna

Cuando se le preguntó sobre el contenido duplicado, Matt Cutts de Google dijo que solo debería lastimarlo si parece spam , sin embargo, muchos webmasters emplean las siguientes técnicas para evitar la duplicación innecesaria de contenido:

  • Asegúrese de que solo se pueda acceder al contenido con una URL canónica
  • Si su sitio debe devolver el mismo contenido en varias URL (por ejemplo, para una página de "vista de impresión"), especifique manualmente una URL canónica con un elemento de enlace en el encabezado del documento
  • En los casos en que su sitio devuelva contenido similar según los parámetros codificados en la URL (por ejemplo, ordenar un catálogo de productos) excluya los parámetros de URL en las Herramientas para webmasters de Google

Sindicación de contenido

La publicación de contenido en su sitio que se ha publicado en otro lugar se denomina sindicación de contenido. Crear contenido duplicado a través de la sindicación de contenido puede estar bien:

  • Mientras tengas permiso para hacerlo
  • Usted les dice a sus usuarios cuál es el contenido y de dónde vino
  • Usted enlaza a una fuente original (un enlace directo directo al contenido original de la página con la copia, no solo un enlace a la página de inicio del sitio donde se puede encontrar el original)
  • Tus usuarios lo encuentran útil
  • Tiene algo que agregar a ese contenido para que los usuarios prefieran encontrar ese contenido en su sitio que en cualquier otro lugar. (Comentario o crítica, por ejemplo).
  • También tiene suficiente contenido original en su sitio (al menos 50% original, pero idealmente 80% original)

Si bien Google no penaliza por cada instancia de contenido duplicado, incluso el contenido duplicado no penalizado puede no ayudarlo a obtener visitantes:

  • Estás compitiendo con todas las otras copias que están ahí fuera
  • Es probable que Google prefiera la fuente original del contenido y la copia más respetable del contenido.

Google penalizará el contenido duplicado publicado en su sitio web de otras fuentes si:

  • Parece ser raspado o robado (especialmente sin atribución).
  • Los usuarios no reaccionan bien (especialmente haciendo clic de nuevo en Google después de visitar su sitio).
  • Existen tantas copias que no hay razón para enviar a los usuarios a su copia.
  • Su copia no es la original, más respetable o más utilizable; y no tiene ningún comentario o crítica.
  • Su sitio no tiene suficiente contenido original para equilibrar todo el contenido republicado.
  • Duplica páginas tan a menudo dentro de su propio sitio que Googlebot tiene problemas para rastrear el sitio completo.

Internacionalización y Geo Targeting

La localización de contenido es un área en la que duplicar contenido puede ser beneficioso para SEO. Está perfectamente bien publicar el mismo contenido en sitios dirigidos a diferentes países que hablan el mismo idioma. Por ejemplo, puede tener un sitio en los EE. UU., Un sitio en el Reino Unido y un sitio en Australia, todos con el mismo contenido.

Con un sitio para cada país, generalmente es posible clasificar mejor para los usuarios de ese país. Además, es posible atender específicamente a los usuarios de cada país con pequeñas diferencias de ortografía, precios en la moneda del país u opciones de envío de productos. Para obtener más información sobre cómo configurar sitios web con orientación geográfica, consulte ¿Cómo debo estructurar mis URL tanto para SEO como para localización?

Manejo de raspadores de contenido

Otros sitios que roban su contenido y lo republican sin permiso ocasionalmente pueden causar problemas de contenido duplicado para su sitio. Los motores de búsqueda trabajan arduamente para garantizar que sea difícil para los sitios scraper beneficiarse de la duplicación de su contenido . Si un sitio de raspador le está causando problemas, entonces puede ser posible eliminar el sitio del índice de Google presentando una solicitud DMCA con Google

Stephen Ostermiller
fuente
0

En términos simples, el contenido duplicado es contenido copiado de otras fuentes web o de su propio sitio web (mismo contenido en varias páginas).

Google puede identificar fácilmente si se trata de un contenido único o de plagio.

Es mejor escribir contenido por su cuenta para el sitio web y no repetir el mismo contenido en varias páginas.

Si su sitio web tiene contenido duplicado, no puede estar en la primera página de Google y será penalizado por las pautas de Google y, además, no estará en 100 posiciones también en SERP.

cstpl123
fuente
El duplicado no tiene que copiarse de otras fuentes. También puede estar en su propio sitio web. Si más de una URL puede servir el mismo contenido, independientemente de dónde residía originalmente, es contenido duplicado.
John Conde