¿Google envía formularios HTML?

10

Tengo una página web, por ejemplo, http://domain/purchasey en esta página, tengo un formulario web. El usuario, al enviar este formulario (que tiene validación, tanto del lado del cliente como del lado del servidor y no se validará hasta que los campos se llenen de manera adecuada), será redirigido a otra página, donde puede elegir otras cosas y especificar otras configuraciones y luego comprar nuestro producto. Digamos que la segunda página es http://domain/options.

Por lo tanto, el usuario visita nuestro sitio y lo visita http://domain/purchase, llena el formulario, lo envía y luego será redirigido a la segunda página http://doamin/options?parameter1=value1&parameter2=value2, que contiene los parámetros de la primera página. Esto es muy común al pasar parámetros entre páginas web (o técnicamente, entre URL).

Ahora estaba revisando mi sitio web y vi que Google había indexado algunas de mis páginas web y URL redirigidas, como:

  1. http://domain/options?parameter1=value1&parameter2=value2
  2. http://domain/options?parameter1=value3&parameter2=value4
  3. http://domain/options?parameter1=value5&parameter2=value6
  4. http://domain/options?parameter1=value7&parameter2=value8
  5. http://domain/options?parameter1=value9&parameter2=value10

Esto significa que Google Bot ha visitado nuestra http://domain/purchasepágina, ha completado nuestro formulario, lo ha enviado y fue redirigido a la otra URL, con los parámetros correspondientes. Esta es la única forma que tiene sentido para mí. ¿Google realmente llena formularios?

PD: todos los parámetros son significativos, lo que significa que no se rellenan de forma arbitraria. Por ejemplo, el parámetro de teléfono en páginas indexadas tiene números de teléfono correctos. ¿Como es posible?

Saeed Neamati
fuente

Respuestas:

8

Google ha podido rastrear formularios HTML desde 2008 .

Una vez elegidos los valores para cada entrada, generamos y luego tratamos de rastrear las URL que corresponden a una posible consulta que un usuario pueda haber hecho. Si determinamos que la página web resultante de nuestra consulta es válida, interesante e incluye contenido que no está en nuestro índice, podemos incluirlo en nuestro índice tanto como incluiríamos cualquier otra página web.

Por otro lado, dado que es poco probable que GoogleBot conozca los parámetros correctos para poner en esos campos, puede haber otra explicación. ¿Es posible que sus usuarios estén vinculados a las páginas redirigidas?

Kat
fuente
Este video de Google Webmaster también cubre ambos puntos: youtube.com/watch?v=xS0oHYZafTQ
DisgruntledGoat
Dice que solo rastrean formularios GET . Mi método de formulario es POST . Por lo tanto, no aplicable. Sí, por qué no, las URL siempre tienen enlaces.
Saeed Neamati
55
Si está viendo ?parameter1=value9&parameter2=value10en las URL, las RECIBEN; POST no incrusta las variables de formulario en la URL.
Wooble
@Woobie: en este caso, los parámetros de URL parecerían ser el resultado de una redirección del lado del servidor, después de que el formulario se haya PUBLICADO.
MrWhite