Preguntas etiquetadas con utf-8

245
Urd decodificar UTF-8 en Python

He pasado mucho tiempo hasta donde soy novato en Python. ¿Cómo podría decodificar una URL así? example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 a este en python 2.7: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8"))...

243
UTF-8 byte [] a String

Supongamos que acabo de utilizar a BufferedInputStreampara leer los bytes de un archivo de texto codificado UTF-8 en una matriz de bytes. Sé que puedo usar la siguiente rutina para convertir los bytes en una cadena, pero ¿hay una manera más eficiente / inteligente de hacer esto que simplemente...

204
Escribir en el archivo UTF-8 en Python

Estoy realmente confundido con el codecs.open function. Cuando lo hago: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Me da el error UnicodeDecodeError: el códec 'ascii' no puede decodificar el byte 0xef en la posición 0: el ordinal no está en el rango...

193
Cómo convertir una cadena a utf-8 en Python

Tengo un navegador que envía caracteres utf-8 a mi servidor Python, pero cuando lo recupero de la cadena de consulta, la codificación que Python devuelve es ASCII. ¿Cómo puedo convertir la cadena simple a utf-8? NOTA: La cadena que se pasa de la web ya está codificada en UTF-8, solo quiero hacer...

190
Codificar cadena a UTF-8

Tengo una cadena con un carácter "ñ" y tengo algunos problemas con ella. Necesito codificar esta cadena a la codificación UTF-8. Lo he intentado de esta manera, pero no funciona: byte ptext[] = myString.getBytes(); String value = new String(ptext, "UTF-8"); ¿Cómo codifico esa cadena a...

180
¿Cómo escribir un archivo UTF-8 con Java?

Tengo un código actual y el problema es que está creando un archivo de página de códigos 1252, quiero forzarlo a crear un archivo UTF-8 ¿Alguien puede ayudarme con este código, ya que digo que actualmente funciona ... pero necesito forzar el guardado en utf ... ¿puedo pasar un parámetro o...

171
¿Cómo determino la codificación de archivos en OS X?

Estoy tratando de ingresar algunos caracteres UTF-8 en un archivo LaTeX en TextMate (que dice que su codificación predeterminada es UTF-8), pero LaTeX no parece entenderlos. La ejecución cat my_file.texmuestra los caracteres correctamente en la Terminal. La ejecución ls -almuestra algo que nunca...

153
u '\ ufeff' en la cadena Python

Me sale un error con el siguiente patrón: UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128) No estoy seguro de qué u'\ufeff'es, aparece cuando estoy raspando web. ¿Cómo puedo remediar la situación? El .replace()método de cadena no...