¿Por qué hay caracteres separados de ancho fijo para 0-9 en japonés, en comparación con el típico 0-9?

9

Japonés (日本語) -0123456789

ASCII típico para cualquier otro lugar: 0 1 2 3 4 5 6 7 8 9

¿Por qué era necesario crear un conjunto de caracteres separado para los mismos números?

Zaenille
fuente

Respuestas:

11

Estos son caracteres de ancho completo .

  • Estos caracteres, que están en Unicode U + FF00 a U + FFEF, están destinados a ser utilizados con caracteres CJK. Existen para que los caracteres latinos puedan alinearse con texto CJK de ancho fijo. Históricamente, los caracteres Han se configuraron de doble ancho en terminales 80x24, y estos caracteres se usaron para coincidir con el ancho del texto CJK.

  • Estos caracteres no están limitados a números. El alfabeto latino completo está disponible en forma de ancho completo.

    ABCDEFGHIJKLMNOPQRSTUVWXYZ
    abcdefghijklmnopqrstuvwxyz
    0123456789
    

Símbolo del sistema en Windows que muestra formularios de ancho completo para caracteres latinos junto con caracteres Han
Fuente de imagen

bwDraco
fuente
3

Esos caracteres de ancho completo no son solo para japonés sino también para coreano y chino porque tienen un juego de caracteres de doble ancho (también conocido como ancho completo). Debido a su complejidad visual y la pobre resolución de pantalla del pasado, no era físicamente posible mostrar esos idiomas en caracteres de medio ancho, especialmente para los caracteres coreanos y chinos.

(El japonés también tiene caracteres de medio ancho, pero en japonés, es algo raro usar solo caracteres japoneses. Principalmente viene con caracteres chinos mezclados. Por lo tanto, tener caracteres de medio ancho no ayuda mucho).

Esos caracteres numéricos de gran tamaño se introdujeron para eso. Cuando escribían, por ejemplo, una tabla o texto de estilo de cuadrícula sin usar gráficos, los caracteres numéricos típicos no se mezclaban bien. Además, tenían culturas de "escritura vertical", así como la escritura horizontal que usamos ahora. Imagínese, si escribe esos caracteres verticalmente, los caracteres numéricos convencionales probablemente se verán feos cuando se mezclen.

También ocurrían cosas similares en el lado de la estructura de datos porque los caracteres de medio ancho ocupaban 1 byte cada uno, mientras que los caracteres de ancho completo tenían 2 bytes o más.

Hacer que la mayoría de los personajes tomen el mismo espacio y memoria simplificó muchas cosas como estas. Del mismo modo, también hay caracteres romanos de ancho completo.

Entiendo por qué hiciste esta pregunta: hoy en día, todo está en la GUI. Las tablas ya no se escriben exclusivamente en textos. Los escritos verticales se están volviendo obsoletos. Para tener caracteres más anchos, solo podemos ajustar el ancho en lugar de usar caracteres gruesos. La mayoría de los caracteres toman múltiples bytes de todos modos a medida que se introducen codificaciones más complejas. Entonces, tal vez sea cierto que esos caracteres alfanuméricos de ancho completo son una especie de herencias de la vejez como la tecla "Bloqueo de desplazamiento" en su teclado.

Scott Rhee
fuente
0

Creo que tiene que ver con el ancho de los caracteres y el japonés es uno de esos idiomas donde puedes escribir verticalmente.

Nelson
fuente