Preguntas etiquetadas con utf-8

UTF-8 es una codificación de caracteres que describe cada punto de código Unicode utilizando una secuencia de bytes de uno a cuatro bytes. Es compatible con versiones anteriores de ASCII y, al mismo tiempo, admite la representación de todos los puntos de código Unicode.

1191
UTF-8 hasta el final

Estoy configurando un nuevo servidor y quiero admitir UTF-8 completamente en mi aplicación web. He intentado esto en el pasado en servidores existentes y siempre parece que tengo que recurrir a ISO-8859-1. ¿Dónde exactamente necesito configurar la codificación / charsets? Soy consciente de que...

607
Excel a CSV con codificación UTF8 [cerrado]

Cerrado. Esta pregunta no cumple con las pautas de desbordamiento de pila . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que sea sobre el tema de Stack Overflow. Cerrado hace 4 meses . Tengo un...

557
¿Por qué el Perl moderno evita UTF-8 por defecto?

Me pregunto por qué la mayoría de las soluciones modernas creadas con Perl no habilitan UTF-8 de forma predeterminada. Entiendo que hay muchos problemas heredados para los scripts centrales de Perl, donde pueden romper cosas. Pero, desde mi punto de vista, en el 21 st siglo, grandes proyectos...

487
UTF-8, UTF-16 y UTF-32

¿Cuáles son las diferencias entre UTF-8, UTF-16 y UTF-32? Entiendo que todos almacenarán Unicode, y que cada uno usa un número diferente de bytes para representar un carácter. ¿Hay alguna ventaja en elegir uno sobre el

395
¿Qué es Unicode, UTF-8, UTF-16?

¿Cuál es la base de Unicode y por qué la necesidad de UTF-8 o UTF-16? Investigué esto en Google y busqué aquí también, pero no me queda claro. En VSS al hacer una comparación de archivos, a veces hay un mensaje que dice que los dos archivos tienen UTF diferentes. Por qué sería este el caso? Por...

279
UTF-8: ¿General? ¿Compartimiento? Unicode?

Estoy tratando de averiguar qué cotejo debería usar para varios tipos de datos. El 100% del contenido que almacenaré es enviado por el usuario. Tengo entendido que debería usar UTF-8 General CI (mayúsculas y minúsculas) en lugar de UTF-8 Binary. Sin embargo, no puedo encontrar una distinción clara...