Estoy tratando de entender el significado matemático de los modelos de clasificación no lineal: Acabo de leer un artículo que habla de que las redes neuronales son un modelo de clasificación no lineal. Pero me doy cuenta de que: La primera
Estoy tratando de entender el significado matemático de los modelos de clasificación no lineal: Acabo de leer un artículo que habla de que las redes neuronales son un modelo de clasificación no lineal. Pero me doy cuenta de que: La primera
He visto conclusiones similares en muchas discusiones, que a medida que el tamaño del minibatch aumenta, la convergencia de SGD en realidad se vuelve más difícil / peor, por ejemplo, este documento y esta respuesta . También he oído hablar de personas que utilizan trucos como pequeñas tasas de...
Muchos tutoriales en línea hablan sobre el descenso del gradiente y casi todos usan un tamaño de paso fijo (tasa de aprendizaje ). ¿Por qué no se utiliza la búsqueda de línea (como la búsqueda de línea de retroceso o la búsqueda de línea
Estoy leyendo el siguiente blog sobre la red neuronal LSTM: http://machinelearningmastery.com/understanding-stateful-lstm-recurrent-neural-networks-python-keras/ El autor da nueva forma al vector de entrada X como [muestras, pasos de tiempo, características] para diferentes configuraciones de...
Si tiene media página para explicar el abandono , ¿cómo procedería? ¿Cuál es la razón detrás de esta
Los siguientes son los 6 límites de decisión a continuación. Los límites de decisión son las líneas violett. Los puntos y cruces son dos conjuntos de datos diferentes. Tenemos que decidir cuál es un: SVM lineal SVM kernelized (núcleo polinomial de orden 2) Perceptrón Regresión logística Red...
Me sumergí en el campo de las redes neuronales y me cautivé con ellas. Finalmente, he desarrollado un marco de aplicación para probar sistemas de comercio en bolsas de valores y ahora voy a implementar mi primera red neuronal en él. Muy simple y primitivo, no destinado al comercio real, solo para...
En el libro de Bishop "Clasificación de patrones y aprendizaje automático", describe una técnica para la regularización en el contexto de redes neuronales. Sin embargo, no entiendo un párrafo que describa que durante el proceso de capacitación, el número de grados de libertad aumenta junto con la...
Tengo un par de preguntas que me confunden con respecto a la CNN. 1) ¿Las características extraídas usando CNN son invariantes de escala y rotación? 2) ¿Los núcleos que utilizamos para convolucionar con nuestros datos ya están definidos en la literatura? ¿Qué tipo de estos núcleos son? ¿Es...
Recientemente, he estado estudiando autoencoders. Si entendí correctamente, un autoencoder es una red neuronal donde la capa de entrada es idéntica a la capa de salida. Entonces, la red neuronal intenta predecir la salida utilizando la entrada como estándar dorado. ¿Cuál es la utilidad de este...
Estoy tratando de identificar el mejor modelo para predecir los precios de los automóviles, utilizando los precios y las funciones disponibles en los sitios de anuncios clasificados de automóviles. Para esto utilicé un par de modelos de la biblioteca scikit-learn y modelos de redes neuronales de...
Soy nuevo en las redes neuronales recurrentes (RNN) y sigo aprendiendo los conceptos. Entiendo en un nivel abstracto que una Red de estado de eco (ESN) puede (re) producir una secuencia de entradas, es decir, una señal, incluso después de que la entrada se haya eliminado. Sin embargo, el artículo...
Estoy entrenando una red neuronal usando i) SGD y ii) Adam Optimizer. Cuando uso SGD normal, obtengo una curva de pérdida de entrenamiento suave versus iteración como se ve a continuación (la roja). Sin embargo, cuando utilicé el Adam Optimizer, la curva de pérdida de entrenamiento tiene algunos...
He encontrado algunas formas básicas para medir la complejidad de las redes neuronales: Ingenuo e informal: cuente la cantidad de neuronas, neuronas ocultas, capas o capas ocultas Dimensión VC (Eduardo D. Sontag [1998] "Dimensión VC de redes neuronales" [ pdf ].) Un curso medido de complejidad...
Estoy estudiando redes neuronales convolucionales (CNN) debido a sus aplicaciones en visión por computadora. Ya estoy familiarizado con las redes neuronales estándar de alimentación hacia adelante, por lo que espero que algunas personas aquí puedan ayudarme a dar un paso adicional para comprender...
Esta es una cuestión de terminología. A veces veo que las personas se refieren a las redes neuronales profundas como "perceptrones de varias capas", ¿por qué es esto? Un perceptrón, me enseñaron, es un clasificador (o regresor) de una sola capa con una salida de umbral binario que usa una forma...
Al aprender la red neuronal convolucional, tengo preguntas sobre la siguiente figura. 1) C1 en la capa 1 tiene 6 mapas de características, ¿eso significa que hay seis núcleos convolucionales? Cada núcleo convolucional se utiliza para generar un mapa de características basado en la entrada. 2) S1...
Estoy tratando de entender el contexto del famoso libro de Minsky y Papert "Perceptrons" de 1969, tan crítico para las redes neuronales. Hasta donde sé, todavía no había otros algoritmos genéricos de aprendizaje supervisado, excepto el perceptrón: los árboles de decisión comenzaron a ser...
Pido disculpas de antemano por el hecho de que todavía estoy avanzando en esto. Estoy tratando de entender los pros y los contras de usar tanh (mapa -1 a 1) versus sigmoide (mapa 0 a 1) para mi función de activación neuronal. De mi lectura sonaba como algo menor con diferencias marginales. En la...
Estoy tratando de entender la función de pérdida Yolo v2: λc o o r d∑i = 0S2∑j = 0si1o b jyo j[ ( xyo- x^yo)2+ ( yyo- y^yo)2]+ λc o o r d∑i = 0S2∑j = 0si1o b jyo j[ ( wyo--√- w^yo--√)2+ ( hyo--√- h^yo--√)2]+ ∑i = 0S2∑j = 0si1o b jyo j( Cyo- C^yo)2+ λn o o b j∑i = 0S2∑j = 0si1n o o b jyo j( Cyo-...