Digamos que queremos hacer una regresión simple f = x * y
usando una red neuronal profunda estándar.
Recuerdo que hay investigaciones que indican que NN con una capa oculta puede aproximarse a cualquier función, pero he intentado y sin normalización, NN no pudo aproximar ni siquiera esta simple multiplicación. Solo ayudó la normalización logarítmica de los datos, m = x*y => ln(m) = ln(x) + ln(y).
pero eso parece una trampa. ¿Puede NN hacer esto sin normalización logarítmica? La respuesta es obviamente (en cuanto a mí), sí, así que la pregunta es más, ¿cuál debería ser el tipo / configuración / diseño de tal NN?