Prueba la utilidad Unicode :
$ unicode ‽
U+203D INTERROBANG
UTF-8: e2 80 bd UTF-16BE: 203d Decimal: ‽
‽
Category: Po (Punctuation, Other)
Bidi: ON (Other Neutrals)
O la uconv
utilidad del paquete ICU :
$ printf %s ‽ | uconv -x any-name
\N{INTERROBANG}
También puede obtener información a través de la recode
utilidad:
$ printf %s ‽ | recode ..dump
UCS2 Mne Description
203D point exclarrogatif
O con Perl:
$ printf %s ‽ | perl -CLS -Mcharnames=:full -lne 'print charnames::viacode(ord) for /./g'
INTERROBANG
Tenga en cuenta que estos dan información sobre los caracteres que componen ese glifo, no sobre el glifo en su conjunto. Por ejemplo, para é
(e con la combinación de acento agudo):
$ printf é | uconv -x any-name
\N{LATIN SMALL LETTER E}\N{COMBINING ACUTE ACCENT}
A diferencia del personaje independiente é:
$ printf é | uconv -x any-name
\N{LATIN SMALL LETTER E WITH ACUTE}
Puede solicitar uconv
recombinarlos (para aquellos que tienen una forma combinada):
$ printf 'e\u0301b\u0301' | uconv -x '::nfc;::name;'
\N{LATIN SMALL LETTER E WITH ACUTE}\N{LATIN SMALL LETTER B}\N{COMBINING ACUTE ACCENT}
(é tiene una forma combinada, pero no b́).
unicode
? Parece que no tengo eso instalado (y no puedo encontrarlo en los repositorios de Arch Linux). Además, ¿qué demonios esexclarrogatif
? [EDITAR: también lo entiendo aquí, aunque mi sistema no es francés.]exclamatif
yinterrogatif
.recode
fue escrito por un chico franco-canadiense a principios de los 80.unicode
paquete en Debian, no tengo idea sobre el empaque en Arch.%s
es como un marcador de posición, llamado especificador de formato (o especificador de conversión). printf lo reemplazará con los argumentos siguientes, tratándolo como una cadena (en lugar de un número, por ejemplo) (en general, como esperaría con laprintf()
función de C ). Consulte los documentos ( pubs.opengroup.org/onlinepubs/9699919799//basedefs/… ).La mejor manera que conozco es a través de Perl's
uniprops
. Viene con elUnicode::Tussle
módulo de Perl . Puedes instalarlo conLuego puede ejecutarlo en cualquier glifo que desee probar:
fuente
uniprops
también usa charnames :: viacode internamente.uniprops
es mucho, mucho más fácil de escribir que llamar explícitamente al módulo. También proporciona más información que solo el nombre.Puede usar la función Perl viacode del módulo charnames :
charnames se lanzó por primera vez con perl v5.6.0
Con Perl 6 estará listo para la producción en este día de Navidad, vale la pena mencionarlo aquí, ya que tiene el mejor soporte para personajes Unicode que he visto. Solo necesita llamar al método / rutina uniname :
é
(e combinando acento agudo) yé
carácter independiente , ambos le dan:(
.uniname
es la abreviatura de$_.uniname
)fuente
Puede usar
unicode
, que también genera más información que solo el nombre:fuente
unicode
? Parece que no tengo eso instalado (y no puedo encontrarlo en los repositorios de Arch Linux).unicode
paquete. Debería poder obtenerlo descargando el paquete fuente de los repositorios de Debian .Crea un script bash con esto:
Póngale el nombre que desee, por ejemplo,
namechar
y dele permisos de ejecución.Ahora, puede llamar por ejemplo:
y el resultado será:
fuente
🐄
y produce resultados repetidos para€
. El último podría arreglarse mediante tubería| sort -u
.Compose
clave.