Recientemente, noté que tengo una lista creciente de errores Soft 404 en las Herramientas para webmasters de Google. Todos son para páginas de resultados de búsqueda generadas dinámicamente que informan "No se encontraron coincidencias".
Yo no entiendo lo que significa que Google por Soft 404 y por qué se están informando que para estas páginas. Entonces agregué <meta name="robots" content="noindex">
a estas páginas.
Sin embargo, Google aún informa nuevos errores de Soft 404 para páginas que usan la metaetiqueta noindex .
¿Por qué Google informa algún error en una página que les dije que no indexaran?
El problema es que con todos estos errores no deseados, no puedo ver si hay algún problema real que deba corregirse.
Algunos han dicho que estas páginas deberían devolver un código de estado 404. Pero eso solo cambia el problema a la pestaña de errores 404. Además, Google devuelve el código de estado 200 para su página sin resultados .
No quiero bloquear el acceso con robots.txt porque quiero que se sigan los enlaces en estas páginas y quiero que Google vea la metaetiqueta noindex . Además, no hay ningún patrón que pueda usar para bloquearlos.
Google encontró estas URL en primer lugar porque el contenido solía existir, pero desde entonces se ha eliminado. No puedo devolver un código de estado 410, porque mi código PHP no tiene forma de saber la razón por la que no se encontraron resultados.
¿Hay algo que pueda hacer para que sea más fácil ver los problemas reales?
fuente
Respuestas:
Debe evitar que Google rastree las páginas de búsqueda del sitio. Google no quiere rastrear la búsqueda de su sitio en absoluto . Aquí está la publicación del blog Matt Cutts de Google sobre el tema: resultados de búsqueda en los resultados de búsqueda de Matt Cutts el 10 de marzo de 2007 . Google ahora penaliza activamente los sitios que permiten rastrear los resultados de búsqueda de sus sitios y aparecer en los SERP de Google. Al permitir que Googlebot rastree sus páginas de resultados de búsqueda, está arriesgando todo su tráfico de referencia de Google. Un truco favorito de un crítico de Google es utilizar la búsqueda de su sitio para términos de spam como "Viagra". Cuando ven una página rastreable como resultado (incluso si dice "no se encontraron resultados para Viagra") aplicarán una penalización manual contra su sitio como sitio de spam.
Debe poner su búsqueda en el sitio
robots.txt
. Solo asegúrate de que Googlebot pueda rastrear tus páginas de contenido. Luego dejará de recibir nuevos errores 404 suaves informados.Una gran cantidad de errores 404 (incluso errores 404 suaves) no perjudican la clasificación de su sitio. Google informa de errores en cualquier página que puedan encontrar y rastrear, ya sea que lo desee o no indexado, y si incluso lo vincula o no. Lo hacen porque los informes de errores son exclusivamente para su beneficio y sienten que debe estar completamente informado.
Esto es lo que John Mueller de Google tiene que decir al respecto :
fuente