Estoy trabajando en un conjunto de datos ficticio con 25 características. Dos de las características son la latitud y longitud de un lugar y otras son valores de pH, elevación, velocidad del viento, etc., con rangos variables. Puedo realizar la normalización en las otras funciones, pero ¿cómo me acerco a las funciones de latitud / longitud?
Editar: Este es un problema para predecir el rendimiento agrícola. Creo que lat / long es muy importante ya que las ubicaciones pueden ser vitales en la predicción y, por lo tanto, en el dilema.
machine-learning
python
feature-engineering
feature-scaling
normalization
AllThingsScience
fuente
fuente
Respuestas:
Las coordenadas largas de Lat tienen el problema de que son 2 características que representan un espacio tridimensional. Esto significa que la coordenada larga da la vuelta, lo que significa que los dos valores más extremos están realmente muy juntos. He tratado este problema varias veces y lo que hago en este caso es mapearlos a las coordenadas x, y y z. Esto significa que los puntos cercanos en estas 3 dimensiones también están cerca en realidad. Dependiendo del caso de uso, puede ignorar los cambios de altura y asignarlos a una esfera perfecta. Estas características se pueden estandarizar correctamente.
Para aclarar (resumido de los comentarios):
fuente