Al trabajar en el problema de regresión, comencé a pensar en la representación de la función "día de la semana". Me pregunto qué enfoque funcionaría mejor:
- una característica valor 1/7 para el lunes; 2/7 para el martes ...
- 7 características: (1, 0, 0, 0, 0, 0, 0) para el lunes; (0, 1, 0, 0, 0, 0, 0) para el martes ...
Es difícil medirlo debido a las diferencias de configuración de la red. (Creo que seis características adicionales deberían reflejarse en la cantidad de nodos ocultos).
El número de todas las características es de aproximadamente 20. Utilizo backprop simple para aprender la red neuronal de retroalimentación normal.
Respuestas:
Su segunda representación es más tradicional para variables categóricas como el día de la semana.
Esto también se conoce como crear variables ficticias y es un método ampliamente utilizado para codificar variables categóricas. Si utilizó la codificación 1-7, le está diciendo al modelo que los días 4 y 5 son muy similares, mientras que los días 1 y 7 son muy diferentes. De hecho, los días 1 y 7 son tan similares como los días 4 y 5. La misma lógica es válida para la codificación 0-30 durante los días del mes.
El día del mes es un poco más complicado, porque si bien cada semana tiene los mismos 7 días, no todos los meses tienen los mismos 30 días: algunos meses tienen 31 días, y algunos meses tienen 28 días. Dado que tanto las semanas como los meses son cíclicos, podría usar transformaciones de Fourier para convertirlas en variables lineales suaves.
Por ejemplo ( usando R, mi lenguaje de programación de elección ):
(Escalé las variables seno / coseno para que sea 0/30, en lugar de -1/1 para que el gráfico se vea mejor)
Como puede ver, mientras que la "variable del día del mes" vuelve a cero al final de cada mes, las transformaciones seno y coseno hacen una transición suave que le permite al modelo saber que los días al final de un mes son similares a días a principios del próximo mes.
Puede agregar el resto de los términos de Fourier de la siguiente manera:
Cada par de ondas seno / coseno forma un círculo:
Esta página tiene una explicación muy útil de cómo manipular las ondas seno y coseno.
fuente