Estoy probando hunspell en la línea de comando con un diccionario sueco. La entrada en el modo interactivo reemplaza todos los caracteres especiales (por ejemplo å ä ö) con espacios en blanco antes de la corrección ortográfica.

Hunspell 1.3.2
sjögräs
& sj 15 0: SJ, aj, dj, sk, s, j, sej, sju, sjö, sjå, sa, se, ej, st, si
& gr 15 3: ge, g, r, ger, gir, gro, gör, grå, går, gry, er, nr, dr, go, kr
*

sj gr s
& sj 15 0: SJ, aj, dj, sk, s, j, sej, sju, sjö, sjå, sa, se, ej, st, si
& gr 15 3: ge, g, r, ger, gir, gro, gör, grå, går, gry, er, nr, dr, go, kr
*

Como puede ver, la codificación de la solicitud está funcionando, mostrando å ä y ö tanto en la entrada como en la salida.

La tubería da el mismo resultado:

echo sjögräs | hunspell -d sv_SE

He tratado de dar diferentes opciones para hunspell, entre ellos -i UTF-8, -i UTF-16y mantener el archivo de aff SET ISO8859-1. Nada funcionó.

Lo mismo sucede con el francés:

C:\Users\gauthier>echo résultat | hunspell -d fr-moderne
Hunspell 1.3.2
*
& sultat 2 2: sultan, rAcsultat

con además problemas con la salida.

Compilé hunspell en MinGW y moví los archivos necesarios resultantes a algún lugar en mi camino, pero no creo que esta información sea muy relevante.

¿Cómo hago para que hunspell reconozca caracteres especiales en su entrada?

Gauthier
fuente