Estamos viendo algunas páginas que existen en nuestro sitemap.xml
pero que inexplicablemente faltan en el índice de búsqueda pública de Google.
No puede descargar /superuser//sitemap.xml , protegemos este archivo porque ha habido problemas con él en el pasado, pero googlebot sí. Verificamos a través de las Herramientas para webmasters de Google que el sitemap.xml
archivo se eliminó hoy y está calificado como OK sin errores (marca de verificación verde).
El sitemap.xml
contiene una lista de los últimos 50.000 preguntas en nuestro sitio que se les pidió. Por ejemplo, esta pregunta ...
/superuser/201610/how-to-see-the-end-of-a-long-chain-of-symbolic-links
... existe en el sitemap.xml
...
<url>
<loc>/superuser/201610/how-to-see-the-end-of-a-long-chain-of-symbolic-links</loc>
<lastmod>2010-10-20</lastmod>
<changefreq>daily</changefreq>
<priority>0.2</priority>
</url>
La búsqueda de "Cómo ver el final de una larga cadena de enlaces simbólicos" le da un solo resultado a questionhub.com que está raspando nuestros datos (un problema completamente diferente).
Puede incrementar el número de conteo de preguntas y hacer una búsqueda exacta del título de la pregunta y verá que este patrón persiste.
Estas URL están en sitemap.xml pero no se muestran en el índice de Google, y sin embargo, se muestran en sitios que raspan nuestros datos comunes creativos. ¿Por qué sería eso?
Respuestas:
Parece que Google tuvo algunos problemas técnicos de rastreo esta semana, que suenan notablemente a lo que estábamos experimentando:
http://searchengineland.com/is-google-broken-sites-big-small-seeing-indexing-problems-53701
fuente
Google no hace ninguna oferta ni garantiza que las páginas de un mapa del sitio se indexarán.
Mi experiencia ha sido que una página debe estar vinculada (desde una página de alguna autoridad) para que aparezca. ¿Esa página / pregunta está vinculada directa / indirectamente desde una página con alguna autoridad?
Por ejemplo, si la página de inicio de superuser.com (que presumiblemente tiene muchos enlaces entrantes) está vinculada directamente a esta pregunta, o indirectamente a través de otras páginas, puede esperar que se indexe.
De Google:
http://www.google.com/support/webmasters/bin/answer.py?hl=es&answer=156184
fuente
Creo que Google podría estar teniendo dificultades para indexar sus páginas web, 50,000 es mucho. Entonces, mi sugerencia sería desglosar su mapa del sitio en pedazos así
Si se descompone, tendrá una mejor suerte de tener esas 50,000 URL indexadas.
Sitemaps.org explicación del problema
http://sitemaps.org/protocol.php
fuente
Parece que Google afirma que 46.514 enlaces enviados están en el índice. ¿Podría ser un problema con (odio decirlo) pero el ranking de la página? Los sitios de raspado pueden estar haciendo un mejor trabajo de reticulación, etc. y estar clasificados más alto. Solo un pensamiento.
Este sitio de búsqueda : superuser.com Cómo ver el final de una larga cadena de enlaces simbólicos también parece estar obteniendo su sitemap.xml correctamente, aunque no devuelve los resultados esperados.
fuente
Con este tipo de cosas hay muchas posibles respuestas.
Empezaría preguntando cuántas páginas tienes realmente. (enviaste 50,000 URL en un sitio rápido: superuser.com muestra 125,000 indexadas ¿crees que solo tienes 50K URL y las estás enviando todas pero Google está encontrando 2-3 copias de cada página? o tal vez tienes 1Mil URL y solo 12.5 % se están indexando) obtener el panorama general ayuda a dirigir dónde buscar problemas.
Si nada parece estar mal con el primer paso, pasaría al contenido, parece que QH tiene mucho más contenido en su página y enlaza muchos otros "recursos" a pesar del hecho de que todo su contenido está descartado, es posible que Google considere su página más útil ya que proporcionan más recursos / información para el usuario. Si se consideran la autoridad y todo su contenido es el mismo que el de ellos, es posible que Google no indexe el suyo aunque usted sea el original.
Si está convencido de que ese no es el problema, cree algunos enlaces de alta calidad, publique esta pregunta en algunos blogs populares para empleados o pida a algunos amigos que escriban en el blog, tal vez si tiene amigos SEO que ejecutan blogs populares, escribirían un estudio de caso al respecto, etc.
Si obtienes muchos enlaces fuertes y todavía no se indexa, busca razones por las que podría ser penalizado (en la mayoría de los casos, este no será el problema, pero nunca está de más comprobarlo).
Si nada de esto funciona, entonces 9 de cada 10 veces es un problema técnico simple que se ha pasado por alto (exclusión de robots o algo similar).
Si aún no tiene respuesta después de pasar por esto, pregunte a Google y espere que le den una respuesta.
fuente
La pregunta se acaba de hacer ayer: dale una oportunidad al googlebot, no eres el único sitio en Internet que tiene que rastrear, ya sabes :)
Si las preguntas se indexan normalmente dentro de un día más o menos, y pasa una semana y esa todavía no está indexada, entonces podría estar preocupado. Pero ciertamente no después de 1 día.
fuente