¿Cómo puedo encontrar cuando una URL fue indexada por primera vez por Google?

16

¿Cómo puedo saber cuándo una URL particular fue indexada por primera vez por Google? Prefiero una solución que funcione incluso para las URL de la competencia que no son de mi propiedad.

Matcheek
fuente
1
Es muy posible que la respuesta sea "no". Es posible que Google ni siquiera almacene esta información (ya que no hay una razón particular por la que tendrían que hacerlo) o, incluso si lo hacen, no pueden exponerla a terceros.
Ilmari Karonen
1
Como otros han mencionado, no puede obtener esta información. Si tiene acceso a los registros del servidor, puede ver cuándo se rastreó por primera vez, pero incluso eso no significa que se indexó en ese momento.
John Mueller

Respuestas:

15

Para conocer la antigüedad de una URL, puede seguir este enlace reemplazándolo www.example.compor la URL que desee:

https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl

Por ejemplo, aquí está el resultado de Google para el sitio Meta de Stack Overflow : ingrese la descripción de la imagen aquí

De lo contrario, la máquina Wayback también es una buena solución pero menos precisa desde mi experiencia.

Zistoloen
fuente
3
¿Esa función de Google también está disponible en inglés? Has vinculado a la versión francesa.
Stephen Ostermiller
1
@StephenOstermiller Simplemente cambie el tld de .fra .com.
MDMoore313
2
@Zistoloen +1 por su respuesta, pero tengo dudas en su consulta. Como dijiste , busqué www.stackexchange.com usando tu consulta de ejemplo, pero no muestra ningún resultado. Busqué eliminando wwwtambién en este momento, muestra el resultado de la fecha, Dec 1, 2014que es una fecha muy reciente que no puede ser la edad de la URL. ¿Estoy buscando incorrectamente? o falta algo?
Sathiya Kumar
2
He "robado" esta respuesta y la agregué a mi respuesta con una mejor explicación. Este es un gran truco, Zistoloen.
Stephen Ostermiller
66
@Stephen & Zistoloen: En general, esa no es la fecha en que Google indexó la página por primera vez. Según algunas pruebas, la fecha que se muestra a través de este método parece extraída del contenido de la página (si Google cree que ve algo que parece una fecha "publicada el" o "última modificación el") o, si no la fecha se encuentra en el contenido, en función de la fecha en que Google observó por última vez un cambio (¿sustancial?) en la página. Por supuesto, si la página nunca se cambió después de su primera publicación, podría ser la misma que su fecha de publicación, pero no hay garantía de eso.
Ilmari Karonen
8

Zistoloen encontró una manera de hacer que Google muestre la fecha cuando indexó por primera vez el contenido de la página. También lo agrego a mi respuesta porque creo que puedo explicarlo más claramente.

  1. Busque en Google algo que muestre la página que desea como resultado
  2. Use "Herramientas de búsqueda"
  3. Seleccione "Rango personalizado ..." del menú desplegable "En cualquier momento"
  4. Poner en un amplio rango de fechas como 1/1/1900 a 1/1/2020

Google mostrará la fecha en que descubrió el contenido que está en la página en el resultado de la búsqueda.

primero indexado

Si la página se actualiza con nuevo contenido, Google también actualiza esta fecha. Por lo tanto, es más una fecha de "primer índice de este contenido" en lugar de una fecha de "primer índice de esta URL".


El caché de Google para una página muestra cuándo se indexó por última vez. Puede ver que la página de inicio de Stack Exchange se indexó por última vez hoy:

ingrese la descripción de la imagen aquí


Otra opción es usar la máquina Wayback de Internet Archive . Eso te muestra cómo era una página en el pasado. Puede averiguar cuándo se publicaron las páginas por primera vez. Tanto Google como Internet Archive rastrean y usan la página poco después de su primera publicación.

Stephen Ostermiller
fuente
1
¿Su primera opción dará resultados exactos para todas las URL? Busqué bing.com como explicaste, pero no obtuve la primera fecha indexada de bing.com. Perdón si me equivoco?
Sathiya Kumar
1
Parece ser preciso siempre que el contenido de la página no haya cambiado. Google puede restablecer esta fecha si se revisa la página. Mi página de inicio aparece como 1 de febrero de 2002 a pesar de que una página interna aparece como 1 de febrero de 2001. La página de inicio fue rediseñada alrededor de ese tiempo, mientras que la página interna no ha cambiado sustancialmente desde 2001.
Stephen Ostermiller
@SathiyaKumar Bing.com me da la fecha 19 de marzo de 2014 usando este método. Tenga en cuenta que cualquier cosa no indexada por Google (a través de robots.txt o de otra manera) obviamente no se mostrará de esta manera.
Thebluefish
4

Es posible que no haya ninguna forma de averiguar cuándo Google indexó por primera vez una página web arbitraria; ciertamente, no conozco ninguna forma de hacerlo. Es posible que Google simplemente no almacene esa información, ya que no hay una razón real por la que lo necesiten. Además, incluso si almacenan esta información, realmente no tienen una razón particular para ponerla a disposición de terceros de forma gratuita.

(Si es su propia página y tiene acceso a los registros de acceso de su antiguo servidor web, es fácil: solo busque en los registros la primera visita del robot de Google a esa página. Pero de lo contrario puede que no haya forma de saberlo con certeza).


En cualquier caso, el método descrito por Zistoloen y Stephen Ostermiller en sus respuestas generalmente no revela la fecha en que Google indexó una URL en particular. Más bien, muestra la fecha en que Google cree que el contenido de la URL se publicó o se actualizó por última vez, y a menudo se basa en los intentos más o menos confiables de Google de "olfatear" las fechas del contenido de la página.

En este video , Matt Cutts de Google toca brevemente cómo se eligen estas fechas. Por conveniencia, he transcrito la parte relevante del video (aproximadamente de 2:09 a 2:22) a continuación:

"... a menudo verá la fecha, como la inferimos, o cuando la vimos por primera vez, cada vez que rastreamos esa página, o si podemos encontrarla en algún lugar de la página, y podemos extraer esa fecha, usted ' Lo veré justo al comienzo del fragmento ".

Para páginas como publicaciones de blog, páginas wiki o preguntas de Stack Exchange, donde el sitio que ejecuta el software informa automáticamente una fecha precisa de creación / modificación en la página, es probable que la fecha informada por Google coincida. Sin embargo, para otros tipos de páginas, el rastreador de fechas de Google tiene que trabajar más duro, y no siempre es correcto (lo que sea "correcto" puede significar, en este contexto).

En particular, estas fechas son básicamente inútiles para determinar cuánto tiempo hace que se indexó una página , por dos razones:

  • Si una página se modificó recientemente y la fecha de modificación se muestra de manera destacada en la página, Google puede elegirla como "la fecha" de la página, incluso si la modificación fue completamente trivial.

    Por ejemplo, esta página wiki bastante antigua (que archive.org indexó por primera vez en 2003 ) tiene actualmente la fecha de Google como del 10 de noviembre de 2014, la fecha en que se editó más recientemente, como se muestra en la parte inferior de la página. ¿El cambio que sucedió en esa fecha? Simplemente eliminando un solo enlace de la parte inferior de la página.

  • Por el contrario, Google parece estar feliz de aceptar "fechas de publicación" muy antiguas si las encuentra en la página, incluso aquellas anteriores al lanzamiento de la World Wide Web .

    Por ejemplo, esta página de un antiguo concurso de programación está fechada por Google al 15 de septiembre de 1986, en realidad la fecha del evento descrito en la página. Del mismo modo, esta página que documenta una huelga estudiantil en 1970 está fechada por Google al 10 de mayo de 1970 (la fecha de uno de los documentos escaneados en la página), y, aún más absurdamente, esta página del manual de Linux está fechada por Google al 4 de noviembre. , 1989 (una fecha de ejemplo aleatoria utilizada en la página).

    Puede encontrar muchos más ejemplos de este tipo utilizando la búsqueda de rango de fechas personalizada descrita por Stephen y Zistoloen, pero configurando el extremo superior del rango a, por ejemplo, el 6 de agosto de 1991 .

Ilmari Karonen
fuente
Bien en su respuesta que opone principalmente las respuestas de Esteban y Zistoloen pero no encuentra ninguna respuesta correcta a la pregunta de OP "¿Cómo encuentro cuando un URL fue indexado por Google en primer lugar?" en tu respuesta !!
Sathiya Kumar
Puede que no haya ninguna respuesta, aparte de "no se puede" o "nadie sabe cómo". Pero tienes razón, déjame editar eso en mi respuesta.
Ilmari Karonen
@llmariKaronen +1 para editar y agregar la respuesta a la pregunta real de OP.
Sathiya Kumar