¿Puede explicar las redes neuronales en palabras simples con un ejemplo?
neural-networks
LifeH2O
fuente
fuente
Respuestas:
Una red neuronal es una clase de sistema informático. Se crean a partir de nodos de procesamiento muy simples formados en una red. Se inspiran en la forma en que funcionan los sistemas biológicos como el cerebro, aunque muchos órdenes de magnitud menos complejos en este momento.
Son fundamentalmente sistemas de reconocimiento de patrones y tienden a ser más útiles para tareas que pueden describirse en términos de reconocimiento de patrones. Están 'capacitados' al alimentarlos con conjuntos de datos con salidas conocidas.
Como ejemplo, imagine que está tratando de entrenar una red para generar un 1 cuando se le da una imagen de un gato y un 0 cuando ve una imagen que no es un gato. Entrenaría la red ejecutando muchas imágenes de gatos a través de ella y utilizando un algoritmo para ajustar los parámetros de la red hasta que dé la respuesta correcta. Los parámetros suelen ser una ganancia en cada entrada y un peso en cada nodo, así como la estructura real de la red (cuántos nodos, en cuántas capas, con qué interconexiones).
Reconocer imágenes de gatos es en realidad un problema bastante complejo y requeriría una red neuronal compleja (posiblemente comenzando con un nodo por píxel). Un punto de partida habitual para experimentar con redes neuronales es intentar implementar puertas lógicas simples, como AND, OR, NOT, etc. como redes neuronales.
Las redes neuronales pueden ser una forma muy rápida de lograr un resultado complejo. Son muy interesantes para la investigación de IA porque son un modelo para el cerebro animal.
Una de las principales desventajas de las redes neuronales es que es muy difícil aplicar ingeniería inversa. Si su red decide que una imagen particular de un elefante es en realidad un gato, realmente no puede determinar "por qué" en ningún sentido útil. Todo lo que realmente puede hacer es intentar entrenar / ajustar aún más la red.
Las redes neuronales tienden a usarse para tareas bien delimitadas, como el reconocimiento de monedas / billetes en máquinas expendedoras o la detección de defectos en las líneas de producción.
El mejor lugar para comenzar si está interesado es probablemente en google 'perceptron', que es el nombre de uno de los primeros elementos de la red neuronal.
fuente
Estudio inteligencia artificial en un programa de maestría, y usamos bastante las redes neuronales. En realidad son bastante útiles.
Creo que el problema para las redes neuronales son su nombre. Esto confunde qué es una red neuronal real y hace que algunas personas cuestionen sus méritos porque esperan que actúen como cerebros, cuando realmente son un tipo de función elegante.
La mejor manera de entender una red neuronal es pasar el nombre. No piense en ello como un modelo de cerebro ... no es ... esta era la intención en la década de 1960 pero es 2011 y se usan todo el tiempo para el aprendizaje automático y la clasificación.
Una red neuronal es en realidad solo una función matemática. Ingresa un vector de valores, esos valores se multiplican por otros valores y se genera un valor o vector de valores. Eso es todo lo que es .
Son muy útiles en dominios problemáticos donde no hay una función conocida para aproximar las características (o entradas) dadas a sus salidas (clasificación o regresión). Un ejemplo sería el clima: hay muchas características del clima: tipo, temperatura, movimiento, cobertura de nubes, eventos pasados, etc., pero nadie puede decir exactamente cómo calcular el clima dentro de 2 días. Una red neuronal es una función que está estructurada de una manera que hace que sea fácil alterar sus parámetros para aproximar la predicción del clima en función de las características.
Esa es la cosa ... es una función y tiene una estructura agradable adaptada al "aprendizaje". Uno tomaría los últimos cinco años de información climática, completa con las características del clima y la condición del clima 2 días en el futuro, por cada día en los últimos cinco años. Los pesos de la red (factores de multiplicación que residen en los bordes) se generan aleatoriamente y los datos se procesan. Para cada predicción, el NN generará valores incorrectos. Usando un algoritmo de aprendizaje basado en cálculo, como la retropropagación, uno puede usar los valores de error de salida para actualizar todos los pesos en la red. Después de que se corran suficientes datos, los niveles de error alcanzarán el punto más bajo (hay más, pero no voy a entrar aquí, lo más importante es el ajuste excesivo). El objetivo es detener el algoritmo de aprendizaje cuando los niveles de error están en el mejor punto. La red se repara y en este punto essolo una función matemática que asigna valores de entrada a valores de salida como cualquier ecuación anterior. Introduce nuevos datos y confía en que los valores de salida son una buena aproximación.
Para aquellos que afirman que han fallado: no lo son. Son extremadamente útiles en muchos dominios. ¿Cómo crees que los investigadores calculan las correlaciones entre genes y enfermedades? Los NN, así como otros algoritmos de aprendizaje, se utilizan en bioinformática y otras áreas. Se ha demostrado que producen resultados extremadamente buenos. La NASA ahora los usa para las rutinas de la estación espacial, como predecir la duración de la batería. Algunas personas dirán que las máquinas de vectores de soporte, etc. son mejores ... pero no hay evidencia de eso, otros algoritmos son simplemente más nuevos.
Es realmente una lástima que la gente todavía afirme que las redes neuronales fallan porque son mucho más simples que el cerebro humano (las redes neuronales ya no se usan para modelar cerebros), eso fue hace 50 años.
fuente
Es un esquema matemático para construir una ecuación (tomar múltiples entradas numéricas y proporcionar una única salida numérica) con pesos de coeficientes ajustables. Existen algoritmos que pueden ajustar los coeficientes para hacer que la ecuación se aproxime a las salidas esperadas, dado un conjunto de entrenamiento que consta de entradas y salidas esperadas.
El ejemplo más simple, junto con los gráficos, está disponible en Wikipedia . Este ejemplo se conoce como XOR.
fuente
En palabras simples, como usted preguntó, Neural Network es una idea fallida de imitar redes neuronales biológicas. Nunca dio resultados interesantes y probablemente nunca lo hará, porque:
(1) es demasiado simplista en comparación con lo que puede hacer con cualquier lenguaje de programación completo de Turing
(2) es demasiado simplista en comparación con las redes neuronales biológicas: resultaron ser más complejas de lo que se pensaba cuando se creó la teoría NN.
Cualquier afirmación de que las redes neuronales tienen éxito en cualquier tarea utilizada en aplicaciones del mundo real es una exageración.
Vamos, vótame.
fuente