¿Por qué Google no puede encontrar los datos estructurados en la mayoría de mis páginas indexadas?

13

Tengo un sitio web con aproximadamente 30,000 páginas. El índice de Google está bien, casi todas las páginas están indexadas, pero en los datos estructurados solo veo 48 páginas detectadas para schema.org. Schema.org es idéntico a todo el sitio web.

Mi pregunta es ¿por qué hay tanta diferencia entre las páginas indexadas y las detectadas con páginas de marcado?

Especialmente trabajé duro para implementar todos los esquemas adecuados para mi sitio web y ahora Google no los detecta.

Páginas indexadas: más de 27,000 Datos estructurados en herramientas para webmasters - 48 páginas

Páginas con schema.org - 48 Páginas indexadas en herramientas para webmasters: más de 27,000

DFuchidzhiev
fuente
55
Las Herramientas para webmasters de Google pueden ser lentas para informar hallazgos ya que no es en tiempo real, además, también puede llevar varios rastreos. La pregunta importante es cuántas de sus URLS escanea Google por mes, dudo mucho de 27,000, ya que esperaría ver un número mayor. Google siempre indexará y actualizará las páginas más populares, ya que estas se rastrean con mayor frecuencia, algunas URL que no se han actualizado durante meses o años podrían tardar días, semanas o incluso meses en actualizarse.
Simon Hayter
55
Para actualizar lo que @bybe ha dicho (un voto positivo en el comentario). Google tiene una métrica de estilo TTL para cada página. Si la página es nueva o no se actualiza con frecuencia, Google no la visitará con frecuencia. Si la página es nueva y cambia con frecuencia, el tiempo TTL para la página disminuirá con el tiempo y Google visitará la página con más frecuencia. La frescura es una métrica importante en su escenario. Si su sitio es estándar en cuanto a frescura, Google puede tardar bastante tiempo en descubrir el cambio. Si su sitio es nuevo, puede probar la frescura con algunas solicitudes de encabezado de muestra.
closetnoc
En mi caso, este es un nuevo sitio web, esto se puede ver en el gráfico de páginas indexadas, comienza en agosto de 2014. bybe: no pido páginas rastreadas, sino indexadas. Y puedo esperar esos puntos que ambos notaron, pero les pido la diferencia entre las páginas indexadas y las páginas con marcado de esquema. Si bien el contenido se puede cambiar con frecuencia o no, el esquema es parte de la estructura HTML. Y esta pregunta es muy importante para mí porque empiezo a trabajar duro con schema.org para cada proyecto, ya que Google me lo recomienda.
DFuchidzhiev
Como dije, puede llevar varios rastreos y puede tardar más en aparecer en las Herramientas para webmasters de Google. También lleva más tiempo que esos esquemas aparezcan realmente en los motores de búsqueda, es decir, estrellas, precios en existencia y otras ventajas que aparecen en los resultados de búsqueda (generalmente 2-3 meses). Siempre y cuando su código salga bien en la prueba de fragmentos enriquecidos, hay poco que pueda hacer ... solo dígales a los clientes que tarda 2-3 meses y que nunca debe prometer que los datos enriquecidos aparecerán realmente en los resultados, ya que Google no siempre devuelve los datos en resultados reales
Simon Hayter

Respuestas:

5

Así es como funciona según los sitios que hemos lanzado recientemente + un par que han funcionado durante un tiempo.

Suponiendo que es un sitio nuevo que utiliza todo Schema.org, así como vocabulario de datos alternativos para migas y datos de revisión, debe esperar al menos un tiempo de retraso de 3 meses. Verá que los informes del esquema de herramientas para webmasters de Google no hacen nada: no hay nuevas revisiones, no hay nuevas páginas ... incluso los picos luego disminuyen los recuentos o las falsas alarmas. No te preocupes es solo GADHD. Un día en el mes 2 (ish) puede ver que todos los recuentos comienzan a completarse, nivelarse y estabilizarse. Puede ver que los widgets SERP de vocabulario de datos alternativos se activan en páginas con tráfico / nuevas. Un mes después de este punto, los widgets SERP de schema.org deberían activarse, suponiendo que no haya errores en GWT. Puede observar de ida y vuelta, especialmente para comentarios, precios, etc. durante este tiempo. Un día estarán prendidos, otro apagado. Una consulta activada, otra desactivada. Finalmente, los SERP se estabilizarán,

Como closetnoc señaló en un comentario para la pregunta original, el RDF se dispara a partir de datos / páginas focales recientes. Puede llevar mucho más de 3 meses para aquellas páginas enterradas que nunca reciben visitas, posiblemente hasta un año para las páginas realmente obsoletas. Es una buena idea refrescar las áreas que desea activar widgets SERP ricos. Google mostrará que están indexados-RDF en GWT, listos para rockear, pero los widgets SERP reales no se activarán hasta que el gatillo lo permita. Este desencadenante es fresco / tráfico / interés / búsquedas en sus páginas RDF "ya indexadas".

Solo sea paciente y espere ver muchas fluctuaciones e inconsistencias. Supongo que así es como funciona el índice de bot RDF con el motor de predicción + consultas pop.

dhaupin
fuente
1
Volver a visitar esta respuesta: parece que Google+ estado de inicio de sesión combinado con G + local para biz tiene un efecto sobre la rapidez con que SERPS muestra datos estructurados. En una extremidad, parecen estar rastreando el interés social + local a nivel SERP y parecen ser más liberales en los fragmentos ricos que muestran allí. Por ejemplo, las estrellas de revisión pueden mostrarse a un usuario de G + y a cualquier usuario que no sea de G + en su localidad. Mientras que, puede tomar otro mes para que las mismas estrellas se muestren para el resto del mundo no registrado en el mundo no local. Moraleja del comentario: asegúrese de configurar G + local para su (s) sitio (s) y luego verifique como editor también.
dhaupin
Tenga en cuenta que mis herramientas para webmasters comenzaron a mostrar mis datos estructurados 6 días después de que se pusieron en marcha en mi sitio, por lo que esto puede haber mejorado
Matt Wilko