Preguntas etiquetadas con encoding

109
ruby 1.9: secuencia de bytes no válida en UTF-8

Estoy escribiendo un rastreador en Ruby (1.9) que consume mucho HTML de muchos sitios aleatorios. Al intentar extraer enlaces, decidí usar simplemente en .scan(/href="(.*?)"/i)lugar de nokogiri / hpricot (mayor aceleración). El problema es que ahora recibo muchos " invalid byte sequence in UTF-8"...

104
¿Cómo lograr la codificación segura de URL Base64 en C #?

Quiero lograr una codificación segura de URL Base64 en C #. En Java, tenemos la Codecbiblioteca común que me da una cadena codificada segura para URL. ¿Cómo puedo lograr lo mismo usando C #? byte[] toEncodeAsBytes = System.Text.ASCIIEncoding.ASCII.GetBytes("StringToEncode"); string returnValue =...

104
Androide. WebView y loadData

Es posible utilizar el siguiente método para la configuración de contenido de una vista web loadData (datos de cadena, tipo de cadena mime, codificación de cadena) ¿Cómo manejar el problema con la codificación desconocida de datos html? ¿Hay una lista de codificaciones? Sé por mi universidad...

102
Lectura de caracteres de un archivo en Python

En un archivo de texto, hay una cadena "No me gusta esto". Sin embargo, cuando lo leo en una cadena, se convierte en "No me gusta esto \ xe2 \ x80 \ x98t". Entiendo que \ u2018 es la representación Unicode de "'". yo suelo f1 = open (file1, "r") text = f1.read() comando para hacer la...