Soy consciente del descenso del gradiente y del algoritmo de propagación hacia atrás. Lo que no entiendo es: ¿cuándo es importante utilizar un sesgo y cómo se usa? Por ejemplo, cuando mapeo la ANDfunción, cuando uso 2 entradas y 1 salida, no da los pesos correctos, sin embargo, cuando uso 3...