En muchas fuentes, de hecho, no encontrará casi ninguna diferencia entre usar los caracteres Unicode para números romanos y simplemente componerlos a partir de letras latinas. Por ejemplo, lo siguiente muestra Louis VII
(arriba) y Louis Ⅶ
(abajo, usando puntos de código para números romanos) renderizados con FreeSans:
Además de una pequeña diferencia en el espacio, que probablemente no fue intencional, la salida es idéntica.
Aquí está el mismo texto representado con DejaVu Sans:
Si bien los caracteres aún se ven idénticos, hay una diferencia considerable en el espaciado. Puede ser una cuestión de gusto si este último es preferible para los números romanos, pero ciertamente no sería una buena opción de interletraje para mayúsculas regulares.
Linux Libertine va un paso más allá:
Aquí los números romanos son ligeramente más pequeños que las letras mayúsculas, por lo que coinciden con los números arábigos de la fuente. Lo más importante es que están conectados, reproduciendo una característica que a menudo se encuentra en números romanos dibujados a mano.
Ahora, algunos aún pueden argumentar que no hay mejoras en lo anterior o que no valen la pena el esfuerzo. Así que aquí hay un caso en el que no usar los caracteres Unicode producirá resultados horribles:
(Tenga en cuenta que el pequeño tamaño de los números refleja cierta composición histórica real). Algo similar puede ocurrir con el script o las fuentes caligráficas.
Sin puntos Unicode específicos para números romanos, la solución del último problema solo sería posible con:
Usando una característica OpenType compleja (o similar) que intenta detectar si una secuencia de letras mayúsculas es un número romano. Esto inevitablemente causará problemas con las palabras que también serían un número romano válido.
Usando una característica simple de OpenType, que necesita ser activada manualmente para cada número romano.
Uso del área de uso privado de Unicode. Es probable que surjan problemas de compatibilidad incluso al cambiar entre dos fuentes que admiten números romanos.
Desde el punto de vista de Unicode, la gran diferencia semántica entre letras mayúsculas latinas y números romanos ya debería haber sido suficiente para una codificación separada de números romanos.
TL; DR El consorcio Unicode recomienda usar la letra latina donde sea posible y no el número, que se incluyó para compatibilidad con la tipografía de Asia oriental.
La historia completa: (con justificación de la afirmación anterior)
A menos que esté haciendo una tipografía de Asia oriental, usar los caracteres de números romanos (no arcaicos) de Unicode (U + 2160 - U + 217F) es un truco.
Estos caracteres se han incluido para compatibilidad con estándares pre-Unicode de Asia Oriental. Estos caracteres permanecen verticales donde el texto de Asia oriental está compuesto de arriba a abajo, mientras que, por lo general, el texto en caracteres latinos (por ejemplo, nombres) se escribe de lado en este contexto.
Para citar la última versión del estándar Unicode (v 7.0, cap. 22, p. 20) :
Entonces, en teoría, la distinción entre números romanos y letras es una cuestión de texto enriquecido, como cursiva, un cambio de fuente o ligaduras opcionales. Dicho esto, como muestra @Wrzlprmft, algunas fuentes lo usan para evitar un cambio de fuente para cada número romano, manteniendo una buena tipografía.
La existencia de un personaje para XII y no para XIII implica que hay varias codificaciones diferentes con el mismo número, lo que genera dificultades en la búsqueda de texto: si escribe sobre Louis XII y Louis XIII, probablemente escriba XIII como X + I + I + I, pero ¿escribirás XII como un solo personaje? ¿O como X + I + I para tener una pantalla consistente con XIII? No hay una sola respuesta buena a esta pregunta mientras se usan los caracteres de números romanos, y es por eso que el consorcio Unicode recomienda usar las letras latinas cuando sea posible y no los números.
Editar: se agregó la aserción TL; DR al principio
fuente
Desde una perspectiva de cómo se ve, puede que no haya mucha diferencia. Entonces, si publica solo material impreso, entonces no hay diferencia, excepto en algunas fuentes, como señala Wrzlprmft en su excelente respuesta.
La semántica es importante
La diferencia semántica es enorme. Al usar números romanos, deja en claro que está hablando del número 5 en lugar de la letra V. Seguro que se ven iguales, pero significan diferentes. Eso significaría que el motor de búsqueda podría tener una mayor probabilidad de encontrar "XX marca V" cuando busca "XX versión 5".
De hecho, la razón por la que algunas cosas funcionan mal es porque no incorporamos información semántica. El mundo sería un lugar mejor si lo quisiéramos. Por lo tanto, usar el significado semántico correcto es casi lo mismo que usar estilos en un procesador de texto en lugar de diseñar manualmente. Hay poca diferencia en el lado humano, pero gran poder en la automatización.
Las fuentes deben tener diferentes números romanos.
Los creadores de fuentes realmente no los usan porque no se usan con mucha frecuencia. Pero al usarlos, podría obtener las losas de números romanos en las letras que las diferencian del texto. Por lo tanto, la función está infrautilizada porque es un uso poco frecuente. Las fuentes realmente no implementan todo, ni deberían hacerlo. Al usar estos, se beneficiaría si están presentes.
Conclusión
Todo esto es sin duda un problema de tipo pollo y huevo. Si las personas no usan los rangos de caracteres especiales, entonces no se harán asignaciones especiales para esos rangos. Por lo tanto, la fuente no admitirá literales romanos con un estilo especial, ya que hacerlo sería desperdiciar el esfuerzo en funciones que nadie usa. Lo mismo se aplica a la búsqueda: si nadie usa literales romanos, entonces ningún motor de búsqueda encontrará literales romanos y la semántica se perderá. La semántica sufre por no adoptar el significado semántico correcto. Ciertamente, lo mismo se aplica a una gama más amplia de caracteres Unicode.
En cuanto a la complejidad de entrada, sí, la mayoría de los usuarios no pueden escribir caracteres extendidos, pero eso no es excusa para que una persona con conocimientos omita hacerlo si tiene sentido. Si nadie mejora las cosas, nunca se logrará ningún progreso. Incluso la palabra tiene modos para escribir alfa escribiendo / alpha. Entonces, realmente no hay razón por la cual no podría haber una manera fácil de etiquetar números o incluso sugerirlos automáticamente como tales. De nuevo, si nadie hace esto, nunca tendrá una adopción más generalizada.
fuente
<compat>
equivalentes a las secuencias correspondientes de letras latinas, lo que sugiere que la única razón por la que están en Unicode es para la compatibilidad de ida y vuelta con algunos conjuntos de caracteres heredados (probablemente CJK) que los tenían. Tales caracteres generalmente no deben usarse, excepto para documentos de ida y vuelta fieles creados en codificaciones heredadas.