Entiendo lo que hace Standard Scalar y lo que hace Normalizer, según la documentación de scikit: Normalizer , Standard Scaler .
Sé cuándo se aplica el Escalador estándar. ¿Pero en qué escenario se aplica Normalizer? ¿Hay escenarios en los que se prefiere uno sobre el otro?
python
scikit-learn
data-cleaning
normalization
Heisenbug
fuente
fuente
Respuestas:
Se usan para dos propósitos diferentes.
StandardScaler
cambia cada columna de función aNormalizer
cambia cada muestra a donde paral1
la norma es,l2
la norma es ,max
la norma es .Para ilustrar el contraste, considere el conjunto de datos que es unidimensional (cada punto de datos tiene una característica). Después de aplicar , el conjunto de datos se convierte en . Después de aplicar cualquier tipo de , el conjunto de datos se convierte en , ya que la única característica se divide por sí misma. Entonces no tiene uso para este caso. Tampoco tiene uso cuando las características tienen unidades diferentes, por ejemplo .{ 1 , 2 , 3 , 4 , 5 }
{ - 1.41 , - 0.71 , 0. , 0.71 , 1.41 }
{ 1. , 1. , 1. , 1. , 1. } ( h e i gh t , a ge , i n c o m e )
StandardScaler
Normalizer
Normalizer
Como se menciona en esta respuesta ,
Normalizer
es principalmente útil para controlar el tamaño de un vector en un proceso iterativo, por ejemplo, un vector de parámetros durante el entrenamiento, para evitar inestabilidades numéricas debido a valores grandes.fuente
StandardScaler
: Transforma los datos de tal manera que tiene una media de 0 y una desviación estándar de 1. En resumen, estandariza los datos . La estandarización es útil para datos que tienen valores negativos. Se organiza los datos en una distribución normal estándar . Es más útil en clasificación que en regresión . Puedes leer este blog mío.Normalizer
: Exprime los datos entre 0 y 1. Realiza la normalización . Debido a la disminución del rango y la magnitud, los gradientes en el proceso de entrenamiento no explotan y no obtienes valores más altos de pérdida. Es más útil en regresión que en clasificación . Puedes leer este blog mío.fuente