Busqué mucho, pero en ninguna parte está escrito cómo eliminar caracteres no ASCII de Notepad ++.
Necesito saber qué comando escribir en buscar y reemplazar (con la imagen sería genial).
Si quiero hacer una lista blanca y marcar todas las palabras / líneas ASCII para que las líneas no ASCII no estén marcadas
Si el archivo es bastante grande y no puede seleccionar todas las líneas ASCII y solo desea seleccionar las líneas que contienen caracteres no ASCII ...
Encoding->Encode in ANSI
. No pude encontrar nada de otra manera.En Notepad ++, si va al menú Buscar → Buscar caracteres en el rango → Caracteres no ASCII (128-255) , puede pasar por el documento a cada carácter no ASCII.
Asegúrese de marcar " Ajustar " si desea hacer un bucle en el documento para todos los caracteres no ASCII.
fuente
Además de la respuesta de ProGM, en caso de que vea caracteres en cuadros como NUL o ACK y quiera deshacerse de ellos, esos son caracteres de control ASCII (0 a 31), puede encontrarlos con la siguiente expresión y eliminarlos:
Para eliminar todos los caracteres de control que no sean ASCII Y ASCII, debe eliminar todos los caracteres que coincidan con esta expresión regular:
fuente
\x00
y\x1F
ya coinciden en la respuesta de ProGM.mgsub("[^\x1F-\x7F]+", "", text_vector, fixed = FALSE)
Para eliminar todos los caracteres no ASCII, puede usar el siguiente reemplazo:
[^\x00-\x7F]+
Para resaltar caracteres, recomiendo usar la función Marcar en la ventana de búsqueda: esto resalta los caracteres que no son ASCII y pone un marcador en las líneas que contienen uno de ellos
Si desea resaltar y poner un marcador en los caracteres ASCII, puede usar la expresión regular
[\x00-\x7F]
para hacerlo.Salud
fuente
Para mantener nuevas líneas:
Próximo:
Ahora, seleccione la opción Reemplazar Extendida y Reemplace # con \ n
:) ahora, tienes un archivo ASCII limpio;)
fuente
Otro buen truco es ir al modo UTF8 en su editor para que pueda ver estos divertidos personajes y eliminarlos usted mismo.
fuente
De otra manera...
Esto es bueno si no puedes recordar la expresión regular o no te importa buscarla. Pero la expresión regular mencionada por otros también es una buena solución.
fuente