¿Qué es agregar caracteres de rana a mis URL?

8

Mientras navegaba por la sección "Errores de rastreo" de las Herramientas para webmasters de Google, descubrí un conjunto de 500 errores muy extraños en referencia a mi sitio:

URL de Froggy

Pude rastrear cuáles son estos personajes, y aparentemente son los primeros dos personajes en el Área de uso privado de Unicode . Mi fuente simplemente los asignó a una rana que llevaba una pequeña corona y un símbolo que se asemeja al número 7.

Estos símbolos solo aparecen en las direcciones de archivos que no son HTML; documentos de oficina, PDF, etc., pero no solo aparecen en el nombre del archivo.

¿De dónde vienen estos símbolos? ¿Hay alguna forma de deshacerme de ellos para que Google pueda rastrear correctamente mi sitio?

Alguna información de fondo:

  • Uso del servidor web que ejecuta WS2K3 con IIS6 y PHP 5.3.8
  • La codificación del sitio es UTF-8
  • Estos símbolos no aparecen en la página o en la fuente
Jacob Hume
fuente
66
Ahora hay algo que no ves todos los días.
John Conde
@ John Conde: Cuéntame sobre eso. Este no es un problema del lunes por la mañana. : P
Jacob Hume
¿Aparecen en todos los archivos que no son HTML o solo en algunos?
froderik
@froderik Solo un puñado, y los documentos afectados han sido publicados por diferentes desarrolladores en diferentes áreas del sitio web.
Jacob Hume

Respuestas:

4

Es solo una suposición, pero una posibilidad es que alguien más esté conectando a sus archivos con algún código roto. Sé que siempre que he recibido solicitudes poco fiables en mis sitios, siempre he podido rastrearlo hasta el enlace descifrado de otra persona. (Es realmente irritante que las arañas no incluyan encabezados Http-Referer para que nos sea más fácil identificar la fuente de estas URL).

Peter Taylor
fuente
1
"... las arañas no incluyen encabezados Http-Referer ..." - Es cierto, pero las Herramientas para webmasters de Google sí incluyen informes que (generalmente) enumeran qué sitios están vinculados al contenido en cuestión.
danlefree
Revisé rápidamente las secciones "Enlaces a su sitio" y "Enlaces internos" de las Herramientas para webmasters de Google, y no vi ninguno de los caracteres en los 1,000 enlaces que mostraban. ¡Gran idea, sin embargo!
Jacob Hume el