Estaba buscando hoy en mis herramientas de Google Webmaster para mi sitio web y veo títulos duplicados para las siguientes páginas en mi sitio web (pequeña muestra de muchas en el índice de mi sitio):
/?title=3_Misconceptions_Regarding_Traumatic_Human_brain_Injury365
/?title=3_or_more_Misguided_beliefs_Pertaining_to_Disturbing_Head_Incidents2902384
/?title=A_Listing_Of_Successful_Web_Marketing_Tips_For_EveryoneHelpful_Online_Marketing_Methods_For_Easy_Success
/?title=Adhere_to_This_kind_of_Online_marketing_Guidance_To_develop_Your_Business
¡Estas ciertamente no son páginas que he creado!
También eché un vistazo a mis datos estructurados que he creado en mi sitio y puedo ver esto (una pequeña muestra de muchos):
Structured Data > __sid=11 (Markup: kualalumpur.yalwa.my)
Structured Data > __sid=7 (Markup: www.locanto.cn)
Nada de esto es el resultado de algo que he hecho. Obviamente es una especie de dolor o un plan elaborado para robar pagerank.
Ayer instalé redireccionamientos y canónicos 301 automatizados de php en todas mis páginas para tratar de reafirmar esto (gracias a la maravillosa ayuda de la gente de desbordamiento de pila). Pero me gustaría entender más sobre esto y cuál es su objetivo.
Respuestas:
Algunas formas en que las páginas inexistentes terminan en el Índice de Google
Hay 3 formas en que las páginas inexistentes pueden terminar en Google o en cualquier otro motor de búsqueda, y estas son:
Sus páginas están vinculadas a estas páginas. (Esto puede estar en el mapa del sitio, una página de perfil, un comentario de blog o un enlace basado en href ...) He visto algunos complementos de WordPress, por ejemplo, que contienen dichos enlaces porque se han desarrollado en un sitio y luego se han subido a la biblioteca de complementos, pero el desarrollador tiene una configuración de caché que se ha encontrado con el complemento.
Un vínculo de retroceso apunta a estas páginas.
He visto páginas y cadenas de índice de Google que simplemente no existen, aunque las suyas parecen tener palabras que no veo cómo Googlebot podría encontrarlas.
Vínculos internos
Ahora es más probable que sea un enlace interno de algún tipo porque busqué en Google sus páginas de título y todo lo que encontré fueron 3 páginas, Pro Webmaster, otro sitio que muestra imágenes de este sitio y el suyo. Parece que alguien ha creado este enlace, o una aplicación / plugin / malware lo ha hecho.
Investigando
Entonces, para descartar que sus usuarios, usted o una aplicación hayan creado estos enlaces, lo que debe hacer es iniciar sesión en el SQL (idealmente PHPMyadmin) y buscar las cadenas. Asegúrese de que la base de datos esté limpia de estas páginas. Luego, suponiendo no obtiene resultados, es hora de buscar archivos de caché y archivos php para estas páginas. Si no encuentra nada, entonces es probable porque alguien también lo vinculó y ahora no está en Google porque se ha eliminado.
Redirigir la
/?
cadena puede ser dañino si alguien quiere atraparteAhora puedo ver que ha eliminado todas las
/?title=
cadenas y las ha redirigido a la página de inicio, aunque esto es algo correcto, también puede ser perjudicial al mismo tiempo y lo explicaré.Si alguien está enviando spam a su sitio con vínculos de retroceso desagradables, lo peor que puede hacer es comenzar a redirigirlos a la página de inicio, ya que Google puede ver esto como una manipulación del pagerank. Esto se debe a que el 301 redirige el flujo de jugo desde el enlace externo, si ese enlace sucede es un sitio de Viagra, entonces le estás dando una falsa indicación a Google en el redireccionamiento y esto puede volver y morderte.
Tengo que amar los buenos viejos 404
Lo correcto en las páginas que simplemente no existen es usar un 404, que son perfectamente normales y de ninguna manera da a Google la impresión de que su sitio está roto. Cualquier página que no exista nunca terminará en el índice de Google y cualquier persona que vuelva a vincular a páginas inexistentes no debería dañar su sitio si un 404 regresa, sin embargo, como se mencionó un 301 a la página de inicio 'PODRÍA' porque retiene el jugo.
Hace 1-2 años, diría que la redirección de cadenas era el mejor método, pero desde las actualizaciones de Google Panda y Penguin, he visto sitios que intentan de todo tipo para tratar de dañar la reputación en línea (Básicamente, Panda, Penguin castiga a los sitios por enlaces de spam, enlaces pagados y, en general, enlaces no relevantes) Aunque Google afirma que es imposible dañar la reputación de otros en línea, plantea la pregunta de si esto es cierto, ¿por qué hay tantos que actualmente envían spam a otros y cómo saben que no es el webmaster tratando de manipular sus propias clasificaciones? ? un área discutible, pero terminemos esto ... Creo que un 404 se adaptará mejor a usted en esta situación.
La edición de la consulta debe ser directa, en lugar de redirigir para
/
eliminar la cadena y luego 301 a/404/
.fuente