¿Por qué usar softmax en lugar de la normalización estándar? En el área de comentarios de la respuesta principal de esta pregunta, @Kilian Batzner planteó 2 preguntas que también me confunden mucho. Parece que nadie da una explicación, excepto los beneficios numéricos. Obtengo las razones para...