Preguntas etiquetadas con networks

542

¿Cómo elegir el número de capas y nodos ocultos en una red neuronal de avance?

¿Existe un método estándar y aceptado para seleccionar el número de capas y el número de nodos en cada capa, en una red neuronal de avance? Estoy interesado en formas automatizadas de construir redes

model-selection neural-networks

222

Intercambie el tamaño del lote frente al número de iteraciones para entrenar una red neuronal

Al entrenar una red neuronal, qué diferencia hace establecer: tamaño del lote a y el número de iteraciones para bunaaasibb vs. tamaño de lote a y número de iteraciones a dCccredd donde ?a b = c dab=cd ab = cd Para decirlo de otra manera, suponiendo que entrenemos la red neuronal con la misma...

neural-networks train

187

¿Qué calcula la capa oculta en una red neuronal?

Estoy seguro de que muchas personas responderán con enlaces para 'déjame buscar eso en Google', así que quiero decir que he tratado de resolver esto, así que perdona mi falta de comprensión aquí, pero no puedo entender cómo La implementación práctica de una red neuronal realmente funciona....

machine-learning neural-networks nonlinear-regression

176

¿Cuál es el tamaño del lote en la red neuronal?

Estoy usando Python Keras packagepara la red neuronal. Este es el enlace . ¿Es batch_sizeigual al número de muestras de prueba? De Wikipedia tenemos esta información: Sin embargo, en otros casos, evaluar el gradiente de suma puede requerir evaluaciones costosas de los gradientes de todas las...

neural-networks python terminology keras

148

¿Qué debo hacer cuando mi red neuronal no aprende?

Estoy entrenando una red neuronal pero la pérdida de entrenamiento no disminuye. ¿Cómo puedo arreglar esto? No estoy preguntando sobre el sobreajuste o la regularización. Estoy preguntando cómo resolver el problema donde el rendimiento de mi red no mejora en el conjunto de entrenamiento . Esta...

neural-networks deep-learning

141

¿Cuáles son las ventajas de ReLU sobre la función sigmoidea en redes neuronales profundas?

El estado del arte de la no linealidad es utilizar unidades lineales rectificadas (ReLU) en lugar de la función sigmoidea en la red neuronal profunda. ¿Cuáles son las ventajas? Sé que entrenar una red cuando se usa ReLU sería más rápido, y tiene más inspiración biológica, ¿cuáles son las otras...

machine-learning neural-networks deep-learning

133

Una lista de funciones de costo utilizadas en redes neuronales, junto con aplicaciones

¿Cuáles son las funciones de costo comunes utilizadas en la evaluación del rendimiento de las redes neuronales? Detalles (siéntase libre de omitir el resto de esta pregunta, mi intención aquí es simplemente proporcionar una aclaración sobre la notación que las respuestas pueden usar para...

machine-learning neural-networks

123

¿Cuál es la diferencia entre redes neuronales convolucionales, máquinas de Boltzmann restringidas y codificadores automáticos?

Recientemente he estado leyendo sobre el aprendizaje profundo y estoy confundido acerca de los términos (o decir tecnologías). Cuál es la diferencia entre Redes neuronales convolucionales (CNN), Máquinas de Boltzmann restringidas (RBM) y Codificadores

neural-networks deep-learning conv-neural-network autoencoders rbm

114

¿Cuál es la diferencia entre una red neuronal y una red neuronal profunda y por qué las profundas funcionan mejor?

No he visto la pregunta precisamente en estos términos, y es por eso que hago una nueva pregunta. Lo que me interesa saber no es la definición de una red neuronal, sino comprender la diferencia real con una red neuronal profunda. Para más contexto: sé qué es una red neuronal y cómo funciona la...

neural-networks deep-learning

106

¿Qué significa convolución 1x1 en una red neuronal?

Actualmente estoy haciendo el Tutorial de aprendizaje profundo de Udacity. En la Lección 3, hablan sobre una convolución 1x1. Esta convolución 1x1 se usa en el Módulo de inicio de Google. Tengo problemas para entender qué es una convolución 1x1. También he visto esta publicación de Yann...

neural-networks deep-learning convolution conv-neural-network

94

Diferencia entre el deterioro del peso neto neural y la tasa de aprendizaje

En el contexto de las redes neuronales, ¿cuál es la diferencia entre la tasa de aprendizaje y la pérdida de peso?

neural-networks terminology

94

¿Es posible entrenar una red neuronal sin propagación hacia atrás?

Muchos libros y tutoriales de redes neuronales dedican mucho tiempo al algoritmo de retropropagación, que es esencialmente una herramienta para calcular el gradiente. Supongamos que estamos construyendo un modelo con ~ 10K parámetros / pesos. ¿Es posible ejecutar la optimización usando algunos...

machine-learning neural-networks optimization backpropagation

92

¿Qué es una capa de incrustación en una red neuronal?

En muchas bibliotecas de redes neuronales, hay 'capas de incrustación', como en Keras o Lasagne . No estoy seguro de entender su función, a pesar de leer la documentación. Por ejemplo, en la documentación de Keras dice: Convierta enteros positivos (índices) en vectores densos de tamaño fijo,...

machine-learning neural-networks python word-embeddings

83

¿Cómo aplicar la red neuronal al pronóstico de series de tiempo?

Soy nuevo en el aprendizaje automático, y he estado tratando de descubrir cómo aplicar la red neuronal al pronóstico de series temporales. He encontrado recursos relacionados con mi consulta, pero parece que todavía estoy un poco perdido. Creo que una explicación básica sin demasiados detalles...

time-series forecasting neural-networks

82

función de activación de tanh vs función de activación sigmoidea

La función de activación de tanh es: tanh(x)=2⋅σ(2x)−1tanh(x)=2⋅σ(2x)−1tanh \left( x \right) = 2 \cdot \sigma \left( 2 x \right) - 1 Donde σ(x)σ(x)\sigma(x) , la función sigmoide, se define como: σ(x)=ex1+exσ(x)=ex1+ex\sigma(x) = \frac{e^x}{1 + e^x} . Preguntas: ¿Realmente importa entre...

machine-learning neural-networks optimization cost-maximization

73

¿Por qué las redes neuronales se vuelven más profundas, pero no más anchas?

En los últimos años, las redes neuronales convolucionales (o quizás redes neuronales profundas en general) se han vuelto cada vez más profundas, con redes de vanguardia que van de 7 capas ( AlexNet ) a 1000 capas ( Redes residuales) en el espacio de 4 años. La razón detrás del aumento en el...

machine-learning classification neural-networks deep-learning conv-neural-network

71

Generar una variable aleatoria con una correlación definida con una variable o variables existentes

Para un estudio de simulación tengo para generar variables aleatorias que muestran un (población) de correlación prefined a una variable existente .YYY Miré en los Rpaquetes copulay CDVineque pueden producir distribuciones aleatorias multivariadas con una estructura de dependencia dada. Sin...

r correlation random-variable random-generation independence assumptions random-variable unbiased-estimator regression hypothesis-testing heteroscedasticity generalized-least-squares distributions networks data-visualization sas reproducible-research philosophical time-series variance outliers quality-control mean multilevel-analysis average weighted-mean regression confidence-interval prediction-interval correlation matlab matrix data-mining maximum-likelihood r time-series survival predictive-models

69

¿Por qué los investigadores de redes neuronales se preocupan por las épocas?

Una época en el descenso de gradiente estocástico se define como un solo paso a través de los datos. Para cada minibatch SGD, se extraen muestras, se calcula el gradiente y se actualizan los parámetros. En la configuración de época, las muestras se extraen sin reemplazo.kkk Pero esto parece...

neural-networks deep-learning gradient-descent

68

¿Cuáles son los buenos pesos iniciales en una red neuronal?

Acabo de escuchar que es una buena idea elegir los pesos iniciales de una red neuronal del rango , donde es el cantidad de entradas a una neurona dada. Se supone que los conjuntos están normalizados: media 0, varianza 1 (no sé si esto importa).d( - 1re√, 1re√)(−1d,1d)(\frac{-1}{\sqrt d} ,...

neural-networks normalization

67

Forma adecuada de usar la red neuronal recurrente para el análisis de series temporales

Las redes neuronales recurrentes difieren de las "regulares" por el hecho de que tienen una capa de "memoria". Debido a esta capa, se supone que los NN recurrentes son útiles en el modelado de series temporales. Sin embargo, no estoy seguro de entender correctamente cómo usarlos. Digamos que tengo...

time-series machine-learning neural-networks