¿Search Engine Spider's envía formularios POST?

10

Si tengo contenido detrás de un formulario POST (un cuadro de selección, en mi caso), ¿podrá el robot de Google u otras arañas de motores de búsqueda rastrear el contenido detrás de ese formulario?

Por ejemplo, si tuviera 4 traducciones de una página, y la selección del idioma fuera un formulario POST a la misma URL, que luego redirigiera a la URL específica del idioma, ¿podría Googlebot rastrear los "otros" idiomas?

nathangiesbrecht
fuente

Respuestas:

9

El robot de Google puede enviar formularios , pero generalmente no lo hace a menos que pueda detectar una razón para hacerlo.

Entonces, desde los enlaces, si sus traducciones fueron AJAX'd y se construyeron correctamente, Googlebot puede enviar el formulario para ver cuáles serían los resultados. Sin embargo, este comportamiento (especialmente en POST) no está garantizado y probablemente debería usar GET para hacer que las cosas sean más accesibles para los robots.

JCL1178
fuente
1
@DisgruntledGoat ¿Estás seguro? Tienes una fuente? El artículo vinculado establece que "para los cuadros de texto, nuestras computadoras eligen automáticamente palabras del sitio que tiene el formulario" . Sin embargo, el artículo fue escrito en 2008, ¿entonces quizás las cosas han cambiado?
s427
2
@ s427 Sí, tienes razón, he eliminado mi comentario. Para los formularios GET (como un cuadro de búsqueda) Googlebot puede generar texto y enviarlo. Hay algunas advertencias enumeradas allí: no envían formularios POST ni formularios con campos de contraseña.
DisgruntledGoat
4

Bing lo hace absolutamente. Antes de decirle que no lo hiciera, enviaría continuamente un formulario de contacto y un formulario de encuesta. Sabía que era Bingbot porque incluí $ _SERVER ['HTTP_USER_AGENT'] en la información de $ _POST. Ninguna otra araña envió esos formularios.

nemmy
fuente
¿Cómo le dijiste a Bing que dejara de enviar? ¡Gracias!
Thomas Landauer
Verifiqué HTTP_USER_AGENT para bingbot y deshabilité el botón de enviar.
nemmy
3

Pueden y hacen. Tengo un formulario simple de recolección de correo electrónico en el frente de un sitio que estoy listo para lanzar. Acabo de recibir un envío de ese formulario de IP 66.249.73.214, que es una IP de GoogleBot.

Jesse
fuente