Preguntas etiquetadas con normalization

209
Estandarizar columnas de datos en R

Tengo un conjunto de datos llamado spamque contiene 58 columnas y aproximadamente 3500 filas de datos relacionados con mensajes de spam. Planeo ejecutar alguna regresión lineal en este conjunto de datos en el futuro, pero me gustaría hacer un preprocesamiento de antemano y estandarizar las...

129
¿De qué se trata el UTF-8 normalizado?

El proyecto ICU (que ahora también tiene una biblioteca PHP ) contiene las clases necesarias para ayudar a normalizar las cadenas UTF-8 para facilitar la comparación de valores al buscar. Sin embargo, estoy tratando de averiguar qué significa esto para las aplicaciones. Por ejemplo, ¿en qué casos...