Preguntas etiquetadas con neural-networks

14

Preguntas sobre Q-Learning usando redes neuronales

He implementado Q-Learning como se describe en, http://web.cs.swarthmore.edu/~meeden/cs81/s12/papers/MarkStevePaper.pdf Para aprox. P (S, A) Uso una estructura de red neuronal como la siguiente, Activación sigmoidea Entradas, número de entradas + 1 para neuronas de acción (todas las entradas...

machine-learning neural-networks reinforcement-learning

14

¿Cuántos datos necesita para una red neuronal convolucional?

Si tengo una red neuronal convolucional (CNN), que tiene aproximadamente 1,000,000 de parámetros, ¿cuántos datos de entrenamiento se necesitan (supongo que estoy haciendo un descenso de gradiente estocástico)? ¿Hay alguna regla general? Notas adicionales: cuando realicé el descenso de gradiente...

machine-learning neural-networks deep-learning conv-neural-network

14

¿Hay alguna diferencia entre entrenar un autoencoder apilado y una red neuronal de 2 capas?

Digamos que estoy escribiendo un algoritmo para construir un autoencoder apilado de 2 capas y una red neuronal de 2 capas. ¿Son las mismas cosas o diferencias? Lo que entiendo es que cuando construyo un codificador automático apilado, construiría capa por capa. Para la red neuronal, inicializaría...

neural-networks deep-learning autoencoders

14

¿Cuál es la diferencia entre episodio y época en el aprendizaje profundo de Q?

Estoy tratando de entender el famoso artículo "Playing Atari with Deep Reinforcement Learning" ( pdf ). No estoy claro acerca de la diferencia entre una época y un episodio . En el algoritmo , el bucle externo está sobre episodios , mientras que en la figura 2 el eje x está etiquetado como epoch ....

neural-networks terminology reinforcement-learning q-learning

14

¿Por qué las redes neuronales necesitan selección / ingeniería de características?

Particularmente en el contexto de las competencias de kaggle, he notado que el rendimiento del modelo tiene que ver con la selección de características / ingeniería. Si bien puedo entender completamente por qué sucede esto cuando se trata de los algoritmos ML más convencionales / de la vieja...

neural-networks deep-learning feature-selection feature-engineering

14

Red neuronal: entrada binaria versus entrada discreta / continua

¿Existen buenas razones para preferir los valores binarios (0/1) sobre los valores normalizados discretos o continuos , por ejemplo (1; 3), como entradas para una red de alimentación directa para todos los nodos de entrada (con o sin propagación hacia atrás)? Por supuesto, solo estoy hablando de...

neural-networks

14

Entrene una red neuronal para distinguir entre números pares e impares

Pregunta: ¿es posible entrenar a un NN para distinguir entre números pares e impares solo usando como entrada los números mismos? Tengo el siguiente conjunto de datos: Number Target 1 0 2 1 3 0 4 1 5 0 6 1 ... ... 99 0 100 1 Entrené a un NN con dos neuronas de entrada (una es el Número...

machine-learning classification categorical-data neural-networks genetic-algorithms

14

Caret glmnet vs cv.glmnet

Parece haber mucha confusión en la comparación de usar glmnetdentro caretpara buscar una lambda óptima y usar cv.glmnetpara hacer la misma tarea. Se plantearon muchas preguntas, por ejemplo: Modelo de clasificación train.glmnet vs. cv.glmnet? ¿Cuál es la forma correcta de usar glmnet con...

r caret glmnet machine-learning neural-networks maximum softmax probability distributions mathematical-statistics random-variable cdf statistical-significance variance expected-value ratio sample-size reliability tolerance-interval wilcoxon-signed-rank self-study variance sampling mean machine-learning svm libsvm self-study sampling ranks data-visualization histogram machine-learning classification normal-distribution mathematical-statistics maximum-likelihood mixture predictive-models prediction seasonality

14

¿Cuál es exactamente la diferencia entre un modelo paramétrico y no paramétrico?

Estoy confundido con la definición de modelo no paramétrico después de leer este enlace Modelos paramétricos versus no paramétricos y responder comentarios de mi otra pregunta . Originalmente pensé que "paramétrico vs no paramétrico" significa si tenemos supuestos de distribución en el modelo...

machine-learning neural-networks nonparametric terminology parametric

14

Redes neuronales profundas: ¿solo para clasificar imágenes?

Todos los ejemplos que encontré usando creencias profundas o redes neuronales convolucionales las usan para la clasificación de imágenes, detección de caracteres o reconocimiento de voz. ¿Las redes neuronales profundas también son útiles para las tareas de regresión clásicas, donde las...

regression machine-learning neural-networks deep-learning

14

Teorema de aproximación universal para redes convolucionales

El teorema de aproximación universal es un resultado bastante famoso para las redes neuronales, básicamente afirmando que, bajo algunos supuestos, una función puede ser aproximada uniformemente por una red neuronal con cualquier precisión. ¿Hay algún resultado análogo que se aplique a las redes...

neural-networks conv-neural-network approximation

14

CNN xavier peso inicialización

En algunos tutoriales descubrí que se decía que la inicialización del peso "Xavier" (documento: Comprender la dificultad de entrenar redes neuronales de alimentación profunda ) es una forma eficiente de inicializar los pesos de las redes neuronales. Para las capas completamente conectadas, había...

normal-distribution variance neural-networks conv-neural-network

14

¿Algoritmo de aprendizaje de conjunto de vanguardia en tareas de reconocimiento de patrones?

La estructura de esta pregunta es la siguiente: al principio, proporciono el concepto de aprendizaje en conjunto , luego proporciono una lista de tareas de reconocimiento de patrones , luego doy ejemplos de algoritmos de aprendizaje en conjunto y, finalmente, presento mi pregunta. Aquellos que no...

machine-learning neural-networks pattern-recognition ensemble ocr

13

RNN para intervalos de tiempo irregulares?

Los RNN son notablemente buenos para capturar la dependencia temporal de los datos secuenciales. Sin embargo, ¿qué sucede cuando los elementos de secuencia no están igualmente espaciados en el tiempo? Por ejemplo, la primera entrada a la celda LSTM ocurre el lunes, luego no hay datos de martes a...

machine-learning neural-networks lstm rnn unevenly-spaced-time-series

13

¿Por qué se utilizan características derivadas en redes neuronales?

Por ejemplo, uno quiere predecir los precios de la vivienda y tener dos características de entrada de longitud y anchura de la vivienda. A veces, uno también incluye características de entrada polinomiales 'derivadas', como el área, que es largo * ancho. 1) ¿Cuál es el punto de incluir...

machine-learning neural-networks

13

¿Cómo obtener una salida continua de valor real de la red neuronal?

En la mayoría de los ejemplos que he visto hasta ahora de las redes neuronales, la red se usa para la clasificación y los nodos se transforman con una función sigmoidea. Sin embargo, me gustaría usar una red neuronal para generar un valor real continuo (de manera realista, la salida generalmente...

regression neural-networks

13

¿Por qué los RNN con unidades LSTM también pueden sufrir "gradientes explosivos"?

Tengo un conocimiento básico de cómo funcionan los RNN (y, en particular, con las unidades LSTM). Tengo una idea pictórica de la arquitectura de una unidad LSTM, que es una celda y algunas puertas, que regulan el flujo de valores. Sin embargo, al parecer, no he entendido completamente cómo LSTM...

neural-networks lstm rnn backpropagation

13

Procedimiento de análisis de series de tiempo y métodos que utilizan R

Estoy trabajando en un pequeño proyecto en el que intentamos predecir los precios de los productos básicos (petróleo, aluminio, estaño, etc.) para los próximos 6 meses. Tengo 12 variables para predecir y tengo datos de abril de 2008 a mayo de 2013. ¿Cómo debo ir sobre predicción? He hecho lo...

r time-series forecasting neural-networks arima

13

Clasificación con etiquetas ruidosas?

Estoy tratando de entrenar una red neuronal para la clasificación, pero las etiquetas que tengo son bastante ruidosas (alrededor del 30% de las etiquetas están equivocadas). La pérdida de entropía cruzada realmente funciona, pero me preguntaba si hay alguna alternativa más efectiva en este caso. o...

machine-learning neural-networks loss-functions noise

13

¿Los datos de entrada correlacionados conducen a un sobreajuste con redes neuronales?

En mi opinión, los datos de entrada correlacionados deben conducir a un sobreajuste en las redes neuronales porque la red aprende la correlación, por ejemplo, el ruido en los datos. ¿Es esto

correlation neural-networks overfitting