Preguntas etiquetadas con unicode

Unicode es un estándar de la industria informática para la codificación, representación y manejo consistentes del texto expresado en la mayoría de los sistemas de escritura del mundo.

54
¿Por qué printf "encoge" la diéresis?

Si ejecuto el siguiente script simple: #!/bin/bash printf "%-20s %s\n" "Früchte und Gemüse" "foo" printf "%-20s %s\n" "Milchprodukte" "bar" printf "%-20s %s\n" "12345678901234567890" "baz" Imprime: Früchte und Gemüse foo Milchprodukte bar 12345678901234567890 baz es decir, el texto con diéresis...

50
Filtrado de utf8 inválido

Tengo un archivo de texto en una codificación desconocida o mixta. Quiero ver las líneas que contienen una secuencia de bytes que no es válida UTF-8 (canalizando el archivo de texto en algún programa). De manera equivalente, quiero filtrar las líneas que son válidas para UTF-8. En otras palabras,...

16
Encuentra la mejor fuente para representar un punto de código

¿Cómo encontrar la fuente adecuada para representar puntos de código Unicode? gnome-terminaldescubra que los caracteres como «🉃 ⼼ 😻🕲🝤» se pueden representar con fuentes como Symbola en lugar de la fuente de mi terminal o la alternativa de codepoint-in-square (????). Cómo...