¿Hay alguna guía general sobre dónde colocar capas de abandono en una red
¿Hay alguna guía general sobre dónde colocar capas de abandono en una red
Un niño humano a los 2 años necesita alrededor de 5 instancias de un automóvil para poder identificarlo con una precisión razonable independientemente del color, la marca, etc. Cuando mi hijo tenía 2 años, pudo identificar tranvías y trenes, a pesar de que había visto sólo algunos. Como...
Estoy entrenando una red neuronal para clasificar un conjunto de objetos en n-clases. Cada objeto puede pertenecer a múltiples clases al mismo tiempo (multi-clase, multi-etiqueta). Leí que para problemas de varias clases generalmente se recomienda usar softmax y entropía cruzada categórica como la...
Tengo la impresión de que cuando las personas se refieren a una red de "creencias profundas", se trata básicamente de una red neuronal pero muy grande. ¿Es esto correcto o una red de creencias profundas también implica que el algoritmo en sí mismo es diferente (es decir, no alimenta la red neuronal...
Veo que muchos algoritmos de aprendizaje automático funcionan mejor con la cancelación media y la ecualización de covarianza. Por ejemplo, las redes neuronales tienden a converger más rápido, y K-Means generalmente ofrece una mejor agrupación con características preprocesadas. No veo que la...
¿Cuál es la diferencia entre una red neuronal recurrente y de retroalimentación ? ¿Por qué usarías uno sobre el otro? ¿Existen otras topologías de red?
Encontré dos preguntas aquí y aquí sobre este problema, pero todavía no hay una respuesta o explicación obvia. Hago cumplir el mismo problema donde el error de validación es menor que el error de entrenamiento en mi red neuronal de convolución. Qué significa
Me preguntaba si hay buenas bibliotecas R para redes neuronales de aprendizaje profundo. Sé que está el nnet,, neuralnety RSNNS, pero ninguno de estos parece implementar métodos de aprendizaje profundo. Estoy especialmente interesado en el aprendizaje no supervisado seguido del aprendizaje...
Tanto PCA como autoencoder pueden reducir la degradación, entonces, ¿cuál es la diferencia entre ellos? ¿En qué situación debo usar uno sobre
¿Alguien puede explicar qué es una capa de agrupación máxima global y por qué y cuándo la usamos para entrenar una red neuronal? ¿Tienen alguna ventaja sobre la capa de agrupación máxima
Soy nuevo en el área de aprendizaje profundo y para mí el primer paso fue leer artículos interesantes del sitio deeplearning.net. En artículos sobre aprendizaje profundo, Hinton y otros hablan principalmente de aplicarlo a problemas de imagen. ¿Puede alguien intentar responderme? ¿Se puede aplicar...
Parece que es posible obtener resultados similares a una red neuronal con una regresión lineal multivariada en algunos casos, y la regresión lineal multivariada es súper rápida y fácil. ¿En qué circunstancias pueden las redes neuronales dar mejores resultados que la regresión lineal...
En la mayoría de los códigos de Tensorflow, he visto que Adam Optimizer se usa con una tasa de aprendizaje constante de 1e-4(es decir, 0,0001). El código generalmente tiene el siguiente aspecto: ...build the model... # Add the optimizer train_op =
Entiendo cómo artificial neural network (ANN)se puede entrenar de forma supervisada usando la propagación hacia atrás para mejorar el ajuste al disminuir el error en las predicciones. He oído que un ANN se puede utilizar para el aprendizaje no supervisado, pero ¿cómo se puede hacer sin una función...
Muchos autores de artículos que leí afirman que las SVM son una técnica superior para enfrentar su problema de regresión / clasificación, conscientes de que no podrían obtener resultados similares a través de las NN. A menudo, la comparación establece que SVM, en lugar de NN, Tener una fuerte...
Dado que estamos utilizando la función logística para transformar una combinación lineal de la entrada en una salida no lineal, ¿cómo se puede considerar la regresión logística como un clasificador lineal? La regresión lineal es como una red neuronal sin la capa oculta, entonces, ¿por qué las...
Entiendo que el descenso de gradiente estocástico puede usarse para optimizar una red neuronal usando la propagación hacia atrás actualizando cada iteración con una muestra diferente del conjunto de datos de entrenamiento. ¿Qué tan grande debe ser el tamaño del
Hay redes neuronales recurrentes y redes neuronales recursivas. Ambos generalmente se denotan con el mismo acrónimo: RNN. Según Wikipedia , los NN recurrentes son de hecho NN recursivos, pero realmente no entiendo la explicación. Además, no parece encontrar cuál es mejor (con ejemplos más o menos)...
Gradient Descent tiene el problema de quedarse atascado en los mínimos locales. Necesitamos correr tiempos exponenciales de descenso de gradiente para encontrar mínimos globales. ¿Alguien puede decirme acerca de las alternativas de descenso de gradiente que se aplican en el aprendizaje de redes...
En una reciente publicación de blog de Rong Ge, se dijo que: Se cree que para muchos problemas, incluido el aprendizaje de redes profundas, casi todos los mínimos locales tienen un valor de función muy similar al óptimo global y, por lo tanto, encontrar un mínimo local es lo suficientemente...