¿Cuál es el efecto de las ligaduras en la web con respecto al SEO?

19

Todos los diseñadores adoran las ligaduras, pero la tipografía vainilla simplemente apesta. Escuché sobre los smartypants que resuelven muchos de estos problemas, aportando citas sexys, magníficos símbolos y todo. Es simplemente perfecto, visualmente.

Pero estoy preocupado por el SEO. Digamos que en una página web, la palabra se finallyconvierte finally. ¿Los motores de búsqueda son capaces de indexar esa palabra y devolver la página al buscar finally(sin la ligadura)?

TKrugg
fuente

Respuestas:

3

Resumen

Si su servidor distribuye páginas con ligaduras (como lo hace smartypants), los motores de búsqueda son inconsistentes. Bing actualmente no indexa las ligaduras correctamente. En general, diría que es un problema. Dado que los motores de búsqueda cambian, hay un método a continuación que puede usar para probar cómo los motores de búsqueda le interesan las ligaduras de índice .

Si su servidor distribuye páginas con texto normal, entonces Javascript las convierte en ligaduras, está bien . Los motores de búsqueda no aplican cambios en el contenido de Javascript antes de indexar las páginas (aunque se afirma que hay algunas excepciones, como cargar comentarios de Facebook ). Dado que existe un método estándar de la industria para proporcionar contenido dinámico a los motores de búsqueda y este método está respaldado por Google , sería una gran sorpresa si esto cambiara en el futuro. Google aconseja navegar por su sitio utilizando un navegador de texto sin formato (por ejemplo, sugieren Lynx ) para ver su contenido como lo ve un motor de búsqueda.


Más detalles sobre el primer caso (páginas distribuidas con ligaduras en el código) ...


En teoria

... no debería hacer ninguna diferencia para un motor de búsqueda bien configurado.

Primero, ayuda a comprender la diferencia entre glifos y caracteres . Una ligadura es un glifo que representa dos caracteres f i. La forma en que el software lo trata depende de ese software y depende del contexto y de la tarea en cuestión: verá a partir de ejemplos en esa pregunta vinculada que cuando copia y pega glifos, lo que se pega variará: a veces se pega el glifo, a veces el glifo se trata como sus caracteres asociados fy ise pegan.

Cualquier procesador de texto automático bien hecho que esté interesado en la semántica de texto (motores de búsqueda, corrector ortográfico, lectores de pantalla ...) debe tratar un glifo como idéntico a los caracteres que representa, y debe tratarlo finallycomo idéntico finally, porque ese es el texto significado del glifo.

En la práctica

No todo está bien hecho ...

Aquí hay una manera fácil de probar los motores de búsqueda. Aquí hay una línea de texto de esa otra pregunta:

Copy the ligature fi from Illustrator to this input box

Si tomamos la versión sin ligaduras de esa oración y la buscamos entre comillas dobles:

(buscando en "Copy the ligature fi from Illustrator to this input box"):

  1. ... si un motor de búsqueda trata los glifos de ligadura como coincidencias para los caracteres que representan, encontrará esa página (y, cuando está indexada, esta)
  2. ... si un motor de búsqueda trata los glifos de ligadura como diferentes a los caracteres que representan, no encontrará nada hasta que esta página se indexe, entonces, solo encontrará esta página, y las búsquedas con la versión de ligadura encontrarán esa página.
  3. ... si un motor de búsqueda se asusta al ver glifos como ligaduras por completo, no encontrará nada, ni siquiera esta página, y las búsquedas con la versión de ligadura tampoco encontrarán nada

Algunos resultados rápidos para los 5 principales motores de búsqueda del mundo (los enlaces son para resultados de búsqueda):

  • Google: bueno (tipo 1) . (a pesar del comentario a continuación, se adapta bien al formato de entidad Unicode o HTML)
  • Bing: falla ( tipo 2 ).
  • Yahoo: Fail ( type 2 ) (resulta que Yahoo está "Desarrollado por Bing")
  • Yandex (ruso): bueno (tipo 1)
  • Baidu (chino): erm, no parece que aparezcan páginas de graphicdesign.stackexchange.com en las búsquedas de Baidu ... ¿tal vez estamos prohibidos allí ...?
user56reinstatemonica8
fuente
No, acabo de editar mi respuesta, mira el código fuente en ese enlace. Todo es unicode como & # xfb00; que el algoritmo de Google ignora.
Ryan
En realidad, Google coincide con esos: mira lo que resalta aquí (ligaduras) y aquí (texto sin formato) - ambos coinciden con ambos. Pero estoy de acuerdo con tu consejo ...
user56reinstatemonica8
... (esas URL eran masivas, necesitan 2 comentarios), parece invitar a problemas. Si bing no coincide con las ligaduras, otros servicios importantes tampoco lo harán.
user56reinstatemonica8
Mire la URL del primer enlace y el código fuente que coincide: verá que Google no tiene (actualmente ...) problemas con el formato Unicode, e indexa las ligaduras Unicode, las ligaduras de entidad HTML y los pares de caracteres separados regulares como f iequivalente sin ningún problema. Google parece funcionar bien, pero la inconsistencia entre los diferentes motores de búsqueda es (al menos en mi libro) un factor decisivo.
user56reinstatemonica8
3

Basado en el ejemplo en vivo que vi, estaría extremadamente preocupado con el uso extensivo de esto porque afectará al SEO. Los caracteres especiales se analizan como Unicode, por lo que el algoritmo de Google no lo leerá. Debería estar bien para usos moderados, pero no me volvería loco con eso ni lo usaría en nada importante como un título.

Aquí está el enlace al ejemplo en vivo que miré: http://pages.cs.wisc.edu/~wolfson/ligatures.html

Ryan
fuente
No creo que sean esas letras en el código fuente. Parece que smartypants es una cosa del lado del servidor que analiza la entrada y guarda los glifos en el texto almacenado en la base de datos y, por lo tanto, también en el código fuente. Dicho esto, creo que estará bien para SEO de todos modos.
user56reinstatemonica8
Ah, en realidad inspeccioné el elemento pero en realidad no vi la fuente. Editaré mi respuesta.
Ryan
1
Definitivamente estoy de acuerdo con "extremadamente preocupado", el soporte Unicode es notoriamente inconsistente. Pero para el registro, Google puede (actualmente ...) indexar unicode y (actualmente ...) coincide con esas ligaduras Unicode en esa página con búsquedas de l i f ietc. (vea cómo las en negrita en la vista previa). Pero definitivamente no me gustaría confiar en él ...
user56reinstatemonica8
¿Qué pasa si las ligaduras se colocaron a través de JavaScript? ¿No alteraría el documento html, por lo tanto, sería completamente invisible para los motores de búsqueda? ¿Sería eso una solución?
TKrugg
Sí, eso debería estar bien: los motores de búsqueda suelen indexar el documento original sin aplicar javascript. Probablemente desee comprobar que hacerlo no ralentiza el tiempo de carga de la página de manera significativa y que no hay una sacudida discordante para el espectador cuando los caracteres de vainilla se reemplazan con las ligaduras durante la carga de la página.
user56reinstatemonica8