Preguntas etiquetadas con utf-8

137
¿Diferencia entre UTF-8 y UTF-16?

¿Diferencia entre UTF-8 y UTF-16? ¿Por qué necesitamos estos? MessageDigest md = MessageDigest.getInstance("SHA-256"); String text = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest =

135
Caracteres Unicode en URL

En 2010, ¿publicaría URL que contengan caracteres UTF-8 en un gran portal web? Los caracteres Unicode están prohibidos según el RFC en las URL (ver aquí ). Tendrían que estar codificados por ciento para cumplir con los estándares. Sin embargo, mi punto principal es servir los caracteres no...

122
¿Por qué declarar unicode por cadena en python?

Todavía estoy aprendiendo Python y tengo una duda: En python 2.6.x, generalmente declaro la codificación en el encabezado del archivo de esta manera (como en PEP 0263 ) # -*- coding: utf-8 -*- Después de eso, mis cadenas se escriben como de costumbre: a = "A normal string without declared...

112
Serializar un objeto como UTF-8 XML en .NET

Se eliminó la eliminación adecuada de objetos por brevedad, pero me sorprende si esta es la forma más sencilla de codificar un objeto como UTF-8 en la memoria. Tiene que haber una manera más fácil, ¿no? var serializer = new XmlSerializer(typeof(SomeSerializableObject)); var memoryStream = new...

110
¿ESTABLECER NOMBRES utf8 en MySQL?

A menudo veo algo similar a esto a continuación en los scripts PHP que usan MySQL query("SET NAMES utf8"); Nunca he tenido que hacer esto para ningún proyecto, así que tengo un par de preguntas básicas al respecto. ¿Es esto algo que se hace solo con DOP? Si no es una cosa específica de DOP,...

110
¿Cómo puedo generar UTF-8 desde Perl?

Estoy intentando escribir un script en Perl usando el pragma "utf8" y obtengo resultados inesperados. Estoy usando Mac OS X 10.5 (Leopard) y estoy editando con TextMate. Todas mis configuraciones tanto para mi editor como para mi sistema operativo están predeterminadas para escribir archivos en...

109
ruby 1.9: secuencia de bytes no válida en UTF-8

Estoy escribiendo un rastreador en Ruby (1.9) que consume mucho HTML de muchos sitios aleatorios. Al intentar extraer enlaces, decidí usar simplemente en .scan(/href="(.*?)"/i)lugar de nokogiri / hpricot (mayor aceleración). El problema es que ahora recibo muchos " invalid byte sequence in UTF-8"...