Extraños símbolos de números cuadrados se muestran como caracteres en Firefox

5

He estado viendo estos símbolos extraños desde hace un tiempo, y tengo curiosidad por saber qué son y por qué aparecen. A veces, aparecen tan frecuentemente en una página, la escritura es indescifrable. Los símbolos aparecen como se muestran a continuación en Firefox, pero aparecen como pequeños cuadrados en Internet Explorer.

Aquí hay un ejemplo:

enter image description here

  1. ¿Qué son?
  2. ¿Cómo me deshago de ellos?
3498DB
fuente

Respuestas:

9

En general, Firefox muestra todos los caracteres Unicode para los que no puede encontrar un glifo en sus fuentes como un cuadro que contiene el código de carácter. Si vas a por ejemplo. Si tiene un sitio web chino y no tiene instaladas las fuentes chinas, solo obtendrá pequeñas cajas.

Sin embargo, ese personaje en particular en la captura de pantalla es CHAR U + FFFD REPLACEMENT CHARACTER. (Obtengo una forma de diamante con un signo de interrogación; también puede obtener una caja cuadrada o simplemente un signo de interrogación).

A menos que alguien haya tecleado deliberadamente ese carácter, lo cual es poco probable (excepto para mí solo hacerlo arriba), U + FFFD significa que alguien ha arruinado sus codificaciones en algún punto a lo largo de la línea, y cualquiera de los dos:

  • trató de codificar un carácter en una codificación que no lo admite, por ejemplo, si alguien intentó enviar un carácter chino en una codificación Latin-1, o

  • sirvió una secuencia de bytes codificada como UTF-8 cuando en realidad es otra cosa.

En la captura de pantalla en particular es claramente un problema donde las "citas inteligentes" se han enviado como una sola página de códigos de Windows 1252 bytes. Entonces, los datos probablemente se han atribuido erróneamente como UTF-8.

Donde la mala atribución se debe a que su navegador adivina el juego de caracteres incorrecto (para las páginas estúpidas que no etiquetan sus juegos de caracteres), puede corregirlo yendo a Ver - & gt; Codificación y adivinando el correcto. Donde la mala atribución se debe al procesamiento propio de las cadenas del sitio web, no hay mucho que puedas hacer al respecto. Desafortunadamente, muchos sitios web se equivocan con los juegos de caracteres, especialmente aquellos escritos en lenguajes ignorantes de Unicode como PHP, ASP clásico, Ruby y JSP (a pesar de las cadenas nativas de Java, JSP / Servlet son codificaciones de caracteres bastante dañadas).

bobince
fuente
4

Son LUGARES DE LUGAR Unicode; el número representa el punto de código de Unicode para el glifo que falta en las fuentes disponibles. Use una fuente que cubra más de los caracteres Unicode necesarios, y estos cuadros serán reemplazados por bonitos caracteres internacionales.

Tenga en cuenta que esto también puede deberse a que el navegador (u otra aplicación) asuma la codificación de documento incorrecta. Por ejemplo, si la configuración de la codificación de caracteres especifica que un documento debe interpretarse como codificación cirílica (rusa), y su documento está realmente codificado como chino, entonces obtendrá glifos incorrectos donde los mapas de caracteres se superponen, y glifos de marcador de posición (las casillas con números) donde los mapas de caracteres no se superponen.

Lee B
fuente
3

Ellos son simbolos de unicode ; Hice esta pregunta w / r / t imprimiendo en superusuario .

Jason S
fuente
Hola, gracias. Intenté cambiar la configuración como se describe en tu publicación en superusuario, pero los símbolos siguen apareciendo. Pero al menos sé lo que son ahora, así que saludos :)
2

Los caracteres que el símbolo representa son comillas inteligentes ( y ), ingresado incorrectamente por un dedo de copiar y pegar muy ansioso. O más bien son lo que los programas como Microsoft Word usan para representar citas inteligentes. O bien las dos citas deben ser ", o el primero debe ser “ y el segundo ”.

Eric
fuente