A menudo escucho a personas hablando de redes neuronales como algo así como una caja negra que no entiendes lo que hace o lo que significan. ¡En realidad no puedo entender lo que quieren decir con eso! Si comprende cómo funciona la retropropagación, ¿cómo es una caja negra?
¿Significan que no entendemos cómo se calcularon los pesos o qué?
machine-learning
neural-networks
Jack Twain
fuente
fuente
Respuestas:
Una red neuronal es una caja negra en el sentido de que, si bien puede aproximarse a cualquier función, estudiar su estructura no le dará ninguna idea sobre la estructura de la función que se aproxima.
Como ejemplo, un uso común de las redes neuronales en el negocio bancario es clasificar a los prestamistas en "buenos pagadores" y "malos pagadores". Tiene una matriz de características de entrada (sexo, edad, ingresos, etc.) y un vector de resultados ("predeterminado", "no predeterminado", etc.). Cuando modela esto usando una red neuronal, está suponiendo que hay una función , en el sentido apropiado de una función matemática. Esta función f puede ser arbitrariamente compleja y puede cambiar de acuerdo con la evolución del negocio, por lo que no puede derivarla a mano.C R F( C) = R
Luego, utiliza la red neuronal para crear una aproximación de que tenga una tasa de error aceptable para su aplicación. Esto funciona, y la precisión puede ser arbitrariamente pequeña: puede expandir la red, ajustar sus parámetros de entrenamiento y obtener más datos hasta que la precisión alcance sus objetivos.F
El problema del recuadro negro es: la aproximación dada por la red neuronal no le dará ninguna idea sobre la forma de f. No existe un vínculo simple entre los pesos y la función que se aproxima. Incluso el análisis de qué característica de entrada es irrelevante es un problema abierto (vea este enlace ).
Además, desde el punto de vista estadístico tradicional, una red neuronal es un modelo no identificable: dado un conjunto de datos y una topología de red, puede haber dos redes neuronales con diferentes pesos y el mismo resultado. Esto hace que el análisis sea muy difícil.
Como ejemplo de "modelos de caja no negra" o "modelos interpretables", tiene ecuaciones de regresión y árboles de decisión. El primero le da una aproximación en forma cerrada de f donde la importancia de cada elemento es explícito, el segundo es una descripción gráfica de algunos riesgos relativos / cocientes de probabilidades.
fuente
Google ha publicado Inception-v3 . Es una red neuronal (NN) para el algoritmo de clasificación de imágenes (distinguir un gato de un perro).
En el artículo hablan sobre el estado actual de la clasificación de imágenes.
y esa es básicamente la razón por la que llamamos a NN para cajas negras. Si entreno un modelo de clasificación de imágenes, con 10 millones de parámetros, y se lo entrego. ¿Qué puedes hacer con eso?
Ciertamente puede ejecutarlo y clasificar imágenes. ¡Funcionará genial! Pero no puede responder ninguna de las siguientes preguntas al estudiar todos los pesos, sesgos y la estructura de la red.
Quizás pueda responder las preguntas simplemente ejecutando el NN y ver el resultado (recuadro negro), pero no tiene ningún cambio en la comprensión de por qué se comporta de la misma manera que en los casos extremos.
fuente