Preguntas etiquetadas con unicode

235
¿Cómo puedo cambiar la codificación de un archivo con vim?

Estoy acostumbrado a usar vim para modificar las terminaciones de línea de un archivo: $ file file file: ASCII text, with CRLF line terminators $ vim file :set ff=mac :wq $ file file file: ASCII text, with CR line terminators ¿Es posible utilizar un proceso similar para cambiar la codificación...

213
Python __str__ versus __unicode__

¿Existe una convención de Python sobre cuándo debe implementar __str__()versus __unicode__()? He visto que las clases se anulan con __unicode__()más frecuencia __str__()pero no parece ser consistente. ¿Existen reglas específicas cuando es mejor implementar una versus la otra? ¿Es necesario / una...

204
¿Cómo convertir wstring en cadena?

La pregunta es cómo convertir wstring en cadena. Tengo el siguiente ejemplo: #include <string> #include <iostream> int main() { std::wstring ws = L"Hello"; std::string s( ws.begin(), ws.end() ); //std::cout <<"std::string = "<<s<<std::endl;

193
Cómo convertir una cadena a utf-8 en Python

Tengo un navegador que envía caracteres utf-8 a mi servidor Python, pero cuando lo recupero de la cadena de consulta, la codificación que Python devuelve es ASCII. ¿Cómo puedo convertir la cadena simple a utf-8? NOTA: La cadena que se pasa de la web ya está codificada en UTF-8, solo quiero hacer...

169
(grep) Regex para que coincida con caracteres no ASCII?

En Linux, tengo un directorio con muchos archivos. Algunos de ellos tienen caracteres no ASCII, pero todos son UTF-8 válidos . Un programa tiene un error que impide que funcione con nombres de archivo que no son ASCII, y tengo que averiguar cuántos están afectados. Iba a hacer esto findy luego...

164
Carácter Unicode en cadena PHP

Esta pregunta parece vergonzosamente simple, pero no he podido encontrar una respuesta. ¿Cuál es el equivalente de PHP a la siguiente línea de código C #? string str = "\u1000"; Esta muestra crea una cadena con un solo carácter Unicode cuyo "valor numérico Unicode" es 1000 en hexadecimal (4096...