¿Cómo lidiar con contenido duplicado / URL en Joomla?

11

Acabo de descubrir un importante problema de SEO y, aunque lo he resuelto por el momento; Estoy tratando de averiguar por qué puede haber ocurrido en primer lugar y si hubo un error o si tiene algo que ver con Joomla. Primero el problema:

Cuando rastreé un sitio con Moz, mostró cuatro contenidos duplicados para la página de inicio que era inesperado. Entonces, por ejemplo, para la página de inicio http://www.foo.com mostraba URL de contenido duplicado como las siguientes:

foo.com/2-uncategorised/1-offers (canonical = foo.com/2-uncategorised/1-offers)
foo.com/2-uncategorised/2-enquiry (canonical = foo.com/2-uncategorised/2-enquiry) 
foo.com/2-uncategorised/3-products (canonical = foo.com/2-uncategorised/3-products) 

Y todos estos enlaces simplemente cargaban el contenido de la página de inicio, pero los meta detalles eran del artículo. Obviamente, esto indica que Joomla estaba creando automáticamente los enlaces y encontré lo mismo para los 4 enlaces. El enlace en el artículo era así:

index.php?option=com_content&view=article&id=1&catid=2&Itemid=1
index.php?option=com_content&view=article&id=2&catid=2&Itemid=1
index.php?option=com_content&view=article&id=3&catid=2&Itemid=1

El Itemid = 1corresponde al elemento del menú de la página de inicio que explica por qué se estaba cargando la página de inicio. Intenté recrear el problema pero no pude. Según las personas que agregaron el contenido, estos son los pasos que hicieron al crear esos artículos y enlaces dentro de él:

  1. Crear artículos
  2. Agregue un enlace a otros artículos usando la pestaña 'Artículo' en el editor de contenido.
  3. Crear elemento de menú para los artículos

Entonces me preguntaba si obviamente hay algo mal aquí. Estoy confundido porque hay más de 100 artículos, pero esto sucedió solo en unos 5 artículos. Gracias.

sifu
fuente

Respuestas:

15

TOC de esta respuesta:

  1. Contenido bajo el mismo ID de artículo
  2. Cómo se crea contenido duplicado / Páginas dinámicas / URL
  3. Perspectiva SEO
  4. Manejo de contenido duplicado en Joomla
  5. Referencias y enlaces

1. ¿Por qué los artículos se muestran bajo el mismo itemid?

En primer lugar, este no es el problema por el que obtiene URL duplicadas. Los artículos están usando la identificación del elemento de la página de inicio, porque no hay otra identificación del elemento asignada para ellos.

Lea más sobre esto:

Y este también podría ser perspicaz:



2. Cómo se crea el "contenido duplicado" / páginas dinámicas / URL

Este es realmente un comportamiento estándar para sitios web dinámicos que generan sus páginas mediante el uso de parámetros de URL para construir cadenas de consulta en forma de pares de campo-valor . El servidor / aplicación recibirá la consulta, la procesará y devolverá el contenido asociativo al navegador.

Para comprender mejor esto, es posible que desee deshabilitar las URL de SEF en un sitio web de Joomla y estudiar un poco la URL no SEF de una página:

Ejemplo:

index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101

Dividiendo la consulta anterior en pares de campos-valores, vemos:

  • opción = com_content
  • ver = artículo
  • id = 3
  • catido = 9
  • Itemid = 101

Estos son valores de campo que Joomla entiende e intentará devolver el siguiente contenido como:

Consultará en el componente com_content y usará una vista de artículo para mostrar el elemento de contenido (artículo) con id 3, de la categoría id 9, usando el elemento de menú con id 101.


Muchas variaciones de URL para 1 página

Sin embargo, el mismo artículo se puede mostrar con aún más combinación de campos y valores:

Algunas combinaciones posibles podrían ser:

  • index.php? option = com_content & view = article & id = 3 & catid = 9
  • index.php? option = com_content & view = article & id = 3 & Itemid = 101
  • index.php? option = com_content & view = article & id = 3 & Itemid = 102
  • index.php? option = com_content & view = article & id = 3 & Itemid = 103
  • index.php? option = com_content & view = article & id = 3
  • index.php? option = com_content & view = article & id = 3 & lang = es
  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = es

  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = es & print = 1

  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = es & tmpl = component

Como puede ver, todo lo anterior solicita los mismos datos del sistema, que es el artículo con id = 3. Esto lleva al hecho de que se puede acceder al mismo contenido / página a través de varias URL diferentes y en algunos casos se puede se muestra en diferentes diseños.

* Con las URL SEF habilitadas en Joomla, lo anterior podría traducirse a más de 1 URL SEF para el mismo artículo / contenido.



3. La perspectiva SEO

Los motores de búsqueda modernos y Google en particular son conscientes de este comportamiento. Por lo general, harán todo lo posible para indexar y mantener en sus resultados de búsqueda la URL más adecuada para una página. Además, Google ha revelado que no existe una " penalización " real por contenido duplicado debido a esto.

Sin embargo, el problema principal en el caso de que el mismo contenido / página se haya indexado más de una vez, es que posiblemente esté perdiendo el ranking de la página y el mejor rendimiento SEO posible , porque el ranking de la página se dividirá en más de 1 página en lugar de 1 .

Con esto en mente, es aconsejable lidiar con esto, en lugar de permitir que los motores de búsqueda indexen las URL al intentar adivinar si diferentes URL muestran el mismo contenido o contenido diferente.
Además, controlar sus URL y lo que SE debe indexar, puede ayudarlo a producir una mejor experiencia de usuario en su conjunto, ya que los usuarios del sitio encontrarán la misma página bajo 1 única URL estándar, y puede producir una estructura más sólida para un sitio web y su administración .



4. Cómo lidiar con contenido duplicado

  • Uso de URL canónicas para sus páginas.
    Canonical Urls le indicará al motor de búsqueda cuál se supone que es la URL correcta de una página que deben rastrear y mantener en su índice.

  • Usando INDEX / NOINDEX, SIGUE / NO SIGA los metadatos. El uso de dichos metadatos en sus páginas indicará a los motores de búsqueda si desea que indexen o no el contenido de una página y que sigan o no los enlaces que se encuentran en ella.

  • Usando 301 redirecciones / htaccess.
    Puede redirigir todas las demás URL a la que desee en la principal. Esto se puede lograr con SEF Extensions o htaccess . Ambos proporcionan un gran poder, sin embargo, htaccess tiene una gran flexibilidad teniendo en cuenta la capacidad de usar expresiones regulares para todo tipo de redirecciones / reescrituras usando mod_rewrite. Con respecto a las extensiones J, cuando surge la necesidad, generalmente uso sh404SEF .

    Actualización: como señaló @Neil Robertson en los comentarios: una redirección importante es desde la versión que no es www del sitio web a la versión www del sitio web o viceversa. Agregue esto al archivo .htaccess para la redirección no www a www.

        ### Redirect non-www to www
        RewriteCond %{HTTP_HOST} !^www\. [NC]
        RewriteRule ^(.*)$ http://www.%{HTTP_HOST}/$1 [R=301,L]
        ### Redirect non-www to www - END 
    
  • Uso de las Herramientas para webmasters de Google Las Herramientas para webmasters de
    Google tienen opciones para ajustar el comportamiento del rastreador con sus parámetros de URL .

  • Uso de Sitemaps
    Enviar a los motores de búsqueda la estructura de URL de su sitio.

  • Utilizando el archivo Robots.txt,
    Google y otros SE importantes respetan su Robots.txt. Puede indicarles que no rastreen directorios / rutas de URL específicos.

Todas las opciones anteriores se pueden combinar para producir el resultado deseado.

* Como en todas partes, en Joomla, una buena planificación y organización del contenido siempre ayudan a alcanzar un mejor resultado. Especialmente con Joomla, esto también implica una categorización de contenido limpia y una estructura de elementos de menú.



5. Referencias y enlaces.

Extensiones SEO de Joomla

Por lo general, en Joomla, si desea lidiar con esto de manera eficiente, terminaría instalando una extensión SEO-SEF de terceros.



Más lectura:

FFrewin
fuente
1
una de las mejores respuestas en este foro :) muy útil. gracias @FFrewin
Joomler
1
Esta es una excelente respuesta. :) Para completar, podría ser bueno agregar información sobre cómo redirigir la versión que no es www del sitio web a la versión www del sitio web o viceversa. Esto a menudo se olvida, pero probablemente sea la causa principal del contenido duplicado en todos los sitios web (no solo en Joomla).
Neil Robertson
Parece que el nuevo enrutador finalmente verá la luz del día en Joomla 3.8 y esto ayudará a simplificar las URL sin necesidad de una extensión de terceros.
Neil Robertson
1
@NeilRobertson: sigo pensando que todavía hay margen de mejora y se necesita más trabajo para lograr una solución completa y eficiente para administrar URL / duplicados SEF en Joomla.
FFrewin
@FFrewin, estoy de acuerdo. Parece que algunas extensiones de terceros también deben actualizarse para aprovechar el nuevo enrutador.
Neil Robertson
0

Si tengo varios elementos de menú que van al mismo contenido, utilizo Enlaces del sistema / Alias ​​de elemento de menú ubicado en el Administrador de menús. Aquí hay un viejo artículo al respecto; pero el método todavía existe hoy: https://magazine.joomla.org/issues/issue-apr-2016/item/2997-avoid-duplicate-content-with-a-menu-item-alias

@Neil, estoy de acuerdo al 100% en que el contenido que no sea www vs www se lea como duplicados. Aquí está el código que obliga a www a no ser www. Colóquelo en su archivo htaccess. Además, también agrega el protocolo de seguridad https. Este código no es el único método, pero es lo que uso con éxito en muchos sitios.

RewriteCond %{HTTP_HOST} ^www.yourwebsite.com [NC]
RewriteRule ^(.*)$ https://yourwebsite.com/$1 [L,R=301]
yaya
fuente