A veces edito texto en inglés que incluye caracteres Unicode. Por alguna razón, en mi PC, Notepad ++ convierte los caracteres Unicode a ???, corrompiendo el texto y perdiendo todos esos datos. Estoy buscando una manera de editar dicho texto, al tiempo que conserva los caracteres Unicode. Estoy usando Consolas como mi fuente. Si la fuente no tiene todos esos caracteres, ¿por qué debería perder los datos cuando copio el texto de Notepad ++ (a través del portapapeles de Windows)?
notepad++
text-editing
unicode
Robinicks
fuente
fuente
Respuestas:
Si el archivo está realmente codificado en Unicode, Notepad ++ debería detectarlo automáticamente. La fuente Consolas me funciona bien. Puede probar una de estas dos opciones de menú:
Estoy bastante seguro de que el primero hará lo que quieras.
fuente
El problema descrito en la pregunta ocurre cuando un documento vacío / nuevo se establece en "ANSI" y se pegan caracteres Unicode en él.
No hay detección automática cuando se usa con un documento vacío / nuevo, al menos no en la versión de Notepad ++ Lo probé (v5.4.5). "ANSI" es el valor predeterminado en Notepad ++ para un documento nuevo, a menos que se configure en el menú Configuración → Preferencias → pestaña Nuevo documento / Abrir Guardar directorio .
Solución
La solución es establecer la codificación en UTF-8 antes de pegar, menú Formato → Codificar en UTF-8 :
Ejemplo
Copié algo de texto en un nuevo documento de Notepad ++, ruso (русский язык, russkiy yazyk) , de Firefox que muestra la página de Wikipedia en idioma ruso .
Si la codificación no se cambia de "ANSI", este es el resultado:
Si se cambia la codificación, este es el resultado:
Como se puede ver en la figura a continuación (la parte cirílica está resaltada), Notepad ++ en realidad convierte los caracteres Unicode en ASCII 63 (hexadecimal 3F), signos de interrogación. Es por eso que los caracteres Unicode se pierden (en "ANSI" modo) al copiar el texto a través del portapapeles (que es no un problema de fuente - la información se pierde).
Probado en: Notepad ++ v5.4.5 (UNICODE).
fuente
Hay buenas noticias y malas noticias.
Buenas noticias: Notepad ++ es compatible con Unicode (al menos por lo que puedo reunir).
Malas noticias: aparentemente, la compatibilidad con Unicode solo está en Windows XP.
De hecho, no tengo una máquina Windows frente a mí. Por lo que recuerdo, hay un menú de codificación debajo del menú Formato en alguna parte. La codificación para Unicode es en realidad más comúnmente UTF-8.
Aquí hay una imagen 'bonita' del soporte de Unicode en Notepad ++,
fuente
Unicode funciona perfectamente en Windows 7. El único problema que surge es que debe volver a escribir los caracteres que se han cambiado. Me ha pasado a mi. Estoy escribiendo con letras escandinavas así que ä -> E4, ö -> F6. Reemplazarlos a todos es una molestia, pero vale la pena.
Si codifica una página desde ANSI -> UTF-8, entonces habrá algunos problemas de caracteres.
Sugeriría que primero cree una nueva página en UTF-8 y luego copie / pegue su información. No habrá / no habrá ningún problema entonces.
fuente
Esto me funcionó:
Cambié la fuente a Courier New en el configurador de estilo en mi PC (Windows 7 con juego de caracteres inglés / estadounidense y rumano para juegos que no son Unicode). Está trabajando con fuentes Courier New & Tahoma + codificación UTF-8.
fuente
En el menú superior, seleccione y
Encoding
luego elijaEncode in UTF-8
oEncode in UTF-8 Without BOM
puede editar el texto en codificación Unicode.fuente