He estado jugando en el patio de juegos de Tensorflow . Uno de los conjuntos de datos de entrada es una espiral. No importa qué parámetros de entrada elijo, no importa cuán ancha y profunda sea la red neuronal que forme, no puedo ajustar la espiral. ¿Cómo encajan los científicos de datos en datos de esta forma?
neural-networks
classification
tensorflow
Souradeep Nanda
fuente
fuente
Respuestas:
Hay muchos enfoques para este tipo de problema. La más obvia es crear nuevas funciones . Las mejores características que se me ocurren es transformar las coordenadas en coordenadas esféricas .
No he encontrado una manera de hacerlo en el patio de recreo, así que acabo de crear algunas características que deberían ayudar con esto (características de pecado). Después de 500 iteraciones se saturará y fluctuará a un puntaje de 0.1. Esto sugiere que no se realizarán más mejoras y probablemente debería ampliar la capa oculta o agregar otra capa.
No es una sorpresa que después de agregar solo una neurona a la capa oculta, obtenga fácilmente 0.013 después de 300 iteraciones. Algo similar ocurre al agregar una nueva capa (0.017, pero después de 500 iteraciones significativamente más largas. Tampoco sorprende ya que es más difícil propagar los errores). Lo más probable es que puedas jugar con un ritmo de aprendizaje o hacer un aprendizaje adaptativo para hacerlo más rápido, pero este no es el punto aquí.
fuente
fuente
theta
fuente
Este es un ejemplo del patio de juegos Tensorflow de vainilla sin características adicionales y sin modificaciones. La carrera por Spiral fue entre 187 y ~ 300 Epoch, dependiendo. Utilicé Lasso Regularization L1 para poder eliminar los coeficientes. Disminuí el tamaño del lote en 1 para evitar que la salida se ajuste demasiado. En mi segundo ejemplo, agregué algo de ruido al conjunto de datos y luego subí el L1 para compensar.
fuente
La solución que alcancé después de una hora de prueba generalmente converge en solo 100 épocas .
Sí, sé que no tiene el límite de decisión más uniforme que existe, pero converge bastante rápido.
Aprendí algunas cosas de este experimento en espiral:
Casualmente, la solución que se me ocurrió es muy similar a la proporcionada por Salvador Dalí .
Agregue amablemente un comentario, si encuentra más intuiciones o razonamientos.
fuente