Llamo a count-words-region
( M-x =) en la cadena US / RU / IPA:
HelloПривheləʊ
Se imprime el siguiente mensaje:
Region has 1 line, 4 words, and 14 characters.
Todos los símbolos tienen w
sintaxis, pero difieren en la secuencia de comandos:
(char-syntax ?H) ; ?w
(char-syntax ?П) ; ?w
(char-syntax ?ʊ) ; ?w
(aref char-script-table ?H) ; script: latin
(aref char-script-table ?П) ; script: cyrillic
(aref char-script-table ?ʊ) ; script: phonetic
¿Eso significa que el límite de la palabra se define no solo por la sintaxis char sino también por el script char ?
Me gustaría deshabilitar este comportamiento para los modos seleccionados para poder navegar por las palabras pero no por los scripts. ¿Cómo se puede lograr esto?
ACTUALIZACIÓN Discusión útil adicional sobre debbugs .
M-x report-emacs-bug
para tener la documentación actualizada.De hecho,
forward-word
ybackward-word
también muestran que hay varias palabras aquí. Para mí tiene sentido que los caracteres de diferentes guiones no puedan estar en la misma palabra, pero la documentación debe hacerse explícita al respecto ( aquí ). Sugiero alM-x report-emacs-bug
respecto.Si solo quiere moverse a través de "palabras" ignorando el script, puede usar
skip-syntax-forward
yskip-syntax-backward
(descrito aquí )fuente