Preguntas etiquetadas con unicode

Unicode está destinado a ser un conjunto de caracteres universal para describir todos los caracteres necesarios para el texto escrito que incorpora todos los sistemas de escritura, símbolos técnicos y puntuación.

432
¿Debe UTF-16 considerarse nocivo?

Voy a preguntar lo que probablemente sea una pregunta bastante controvertida: "¿Debería una de las codificaciones más populares, UTF-16, considerarse nociva?" ¿Por qué hago esta pregunta? ¿Cuántos programadores son conscientes del hecho de que UTF-16 es en realidad una codificación de longitud...

41
¿Por qué hay múltiples codificaciones Unicode?

Pensé que Unicode fue diseñado para solucionar el problema de tener muchas codificaciones diferentes debido a un pequeño espacio de direcciones (8 bits) en la mayoría de los intentos anteriores (ASCII, etc.). ¿Por qué entonces hay tantas codificaciones Unicode? Incluso múltiples versiones de la...

35
Licencia Unicode

Los Términos de uso de Unicode establecen que cualquier software que use sus archivos de datos (o una modificación de ellos) debe llevar las referencias de licencia de Unicode. Me parece que la mayoría de las bibliotecas Unicode tienen funciones para verificar si un carácter es un dígito, una...

19
¿Por qué hay tantos espacios y saltos de línea en Unicode?

Unicode tiene quizás 50 espacios \ u0009 \ u000A- \ u000D \ u0020 \ u0085 \ u00A0 \ u1680 \ u180E \ u2000- \ u200A \ u2028 \ u2029 \ u202F \ u205F \ u3000] [\ u0009 \ u000A- \ u000D \ u0020 \ u0085 \ u00A0 \ u16A u180E \ u2000- \ u200A \ u2028 \ u2029 \ u202F \ u205F \ u3000 y 6 saltos de...

14
¿Un valor centinela Unicode que puedo usar?

Estoy diseñando un formato de archivo y quiero hacerlo bien. Como es un formato binario, el primer byte (o bytes) del archivo no debe formar caracteres de texto válidos (como en el encabezado 1 del archivo PNG ). Esto permite que las herramientas que no reconocen el formato sigan viendo que no se...

12
Implementación eficiente de Trie para cadenas unicode

He estado buscando una implementación eficiente de String trie. Principalmente he encontrado un código como este: Implementación referencial en Java (según wikipedia) No me gustan estas implementaciones principalmente por dos razones: Solo admiten 256 caracteres ASCII. Necesito cubrir cosas...