¿Qué puede causar "Descubierto - actualmente no indexado" en el nuevo GWT

18

El nuevo GWT muestra enlaces de sitemaps divididos en nuevas categorías. Dos que me confunden: 1. Descubierto: actualmente no indexado 2. Rastreado: actualmente no indexado

¿Cuáles son las posibles razones para esto? ¿Existen implicaciones en todo el sitio? ¿Es esta una señal de Google que debería considerar eliminar?

ingrese la descripción de la imagen aquí

Noam
fuente

Respuestas:

11

Es solo parte del proceso. No hay nada que hacer hasta que realmente obtenga errores .

Para comprender las categorías, debe comprender cómo funciona la indexación, que es algo que se hace de forma bastante continua:

  • Googlebot busca una página, lo que significa descargar su contenido en los servidores de Google. Cuando esto sucede, la página se rastrea .
  • Más tarde coloca el contenido de la página descargada en el índice. Esto significa que la página está indexada .
  • Mientras rastrea la página, encuentra Me gusta y los coloca en una cola. Esos enlaces son descubiertos .

Entonces:

  • Descubierto no indexado significa que el enlace se ha agregado a la cola de cosas que Googlebot puede rastrear eventualmente . Dado que la web es prácticamente infinita y hay una priorización, es posible que nunca llegue allí.
  • Rastreado no indexado actualmente significa que la página se descargó en los servidores de Google pero que su contenido no se ha insertado en el índice.
Itai
fuente
1
Añadiría que Google decide qué rastrear según el PageRank. Vincular a la página con mayor frecuencia o de manera más prominente (incluso internamente) puede hacer que Googlebot lo rastree.
Stephen Ostermiller
3
Creo que "actualmente no indexado" también podría significar que Google está eligiendo no indexarlo. Podría ser duplicado o parecer de baja calidad. Puede que no tenga suficiente Pagerank. Google podría pensar que no coincidirá con suficientes búsquedas.
Stephen Ostermiller
Esto es lo que estaba insinuando con la priorización . Esto sucede con enlaces que se sospecha que están duplicados (a veces porque difieren solo en un parámetro o coinciden con otro canónico).
Itai
Las páginas entran y salen de "Rastreado no indexado actualmente" sin ninguna atención de mi parte. La información también es dudosa. Ejemplo: una URL inspeccionada da como resultado un mensaje que está indexado, pero no en ningún mapa del sitio ... la página está en el mapa del sitio y lo ha estado durante años. La reciente actualización de algo envió este informe de un lado a otro.
GLCoder
3

Google puede descubrir y rastrear sus páginas, pero eso no significa que necesariamente las indexará.

Hay muchas razones por las cuales Google podría no indexar una página. Quizás encontró contenido duplicado. Quizás no sienta que ofrece suficiente valor para cualquier consulta de búsqueda específica. Es posible que Google haya encontrado algo sobre su página que no le gusta.

Cualquiera sea la razón, Google simplemente no ha decidido indexar algunas de las páginas que ha descubierto y rastreado en su sitio. Es bastante normal que algunas de sus páginas no se indexen. Algunas de las páginas en mis sitios no están indexadas a pesar de tener un mejor contenido que muchas páginas indexadas y tener una cantidad sustancial de enlaces internos. El sistema de indexación de Google es un algoritmo de aprendizaje automático. Y entonces puede decidir no indexar algunas páginas a veces por una variedad de razones desconocidas.

Michael d
fuente
1
"Quizás encontró contenido duplicado"> Sin embargo, me gustaría agregar que, en este caso, dado que el mensaje es "Descubierto - actualmente no está indexado", indica que la página ni siquiera ha sido recuperada (o sería "Rastreada - actualmente no indexado "). Entonces, en este punto, no saben nada sobre su contenido. Entonces, supongo que la priorización en esta etapa depende de la URL en sí, el número de páginas que enlazan con ella y posiblemente otras cosas.
Niavlys
2

Googlebot tiene su propia cola, basada en diferentes parámetros. Este es el mensaje sobre esas URL que incluso están en cola.

ingrese la descripción de la imagen aquí

Aj Cohn tiene una especie de opinión graciosa sobre el significado de este mensaje:

Descubierto: actualmente no indexado parece indicar que lo ven en su mapa del sitio, pero en función de cómo se ve otro contenido, ni siquiera se molestarán en rastrearlo. Esencialmente, "¡Ya eres feo!" O, tal vez es solo una representación de la pobre eficiencia de rastreo.

Francamente, no estoy completamente seguro de que la definición de Descubierto sea precisa, ya que muchas de las URL de muestra en este estado tienen una Fecha de último rastreo. Eso parece contradecir la definición proporcionada.

Evgeniy
fuente
2
Eliminé el bit "leer el manual". Eso no es útil. Sobre todo porque la documentación de Google es bastante pobre.
Stephen Ostermiller
0

Aunque Google descubrió la URL, no sintió que fuera lo suficientemente importante como para pasar tiempo rastreando. Si desea que esta página reciba tráfico de búsqueda orgánica, considere vincularla más desde su propio sitio web. Asegúrese de promocionar este contenido a otros con la esperanza de que pueda obtener vínculos de retroceso de sitios web externos. Los enlaces externos a su contenido son una señal para Google de que una página es valiosa y considerada confiable, lo que aumenta las probabilidades de que se indexe.

tsogtgerel.ts
fuente