Estoy usando redes neuronales para resolver diferentes problemas de aprendizaje automático. Estoy usando Python y pybrain pero esta biblioteca está casi descontinuada. ¿Hay otras buenas alternativas en
Métodos y principios para construir "sistemas informáticos que mejoren automáticamente con la experiencia".
Estoy usando redes neuronales para resolver diferentes problemas de aprendizaje automático. Estoy usando Python y pybrain pero esta biblioteca está casi descontinuada. ¿Hay otras buenas alternativas en
En referencia a las notas del curso de Stanford sobre Redes neuronales convolucionales para el reconocimiento visual , un párrafo dice: "Desafortunadamente, las unidades ReLU pueden ser frágiles durante el entrenamiento y pueden" morir ". Por ejemplo, un gran gradiente que fluye a través de una...
En MNIST For ML Beginners definen la entropía cruzada como Hy′(y):=−∑iy′ilog(yi)Hy′(y):=−∑iyi′log(yi)H_{y'} (y) := - \sum_{i} y_{i}' \log (y_i) yiyiy_i es el valor de probabilidad pronosticado para la clase e es la probabilidad real para esa clase.y ′ iiiiy′iyi′y_i' Pregunta 1 ¿No es un...
Estoy empezando a desarrollar una aplicación de aprendizaje automático para fines académicos. Actualmente estoy usando R y entrenándome en ello. Sin embargo, en muchos lugares, he visto personas que usan Python . ¿Qué utilizan las personas en la academia y la industria, y cuál es la...
Actualmente estoy trabajando en implementar el Descenso de gradiente estocástico SGD, para redes neuronales que usan propagación hacia atrás, y aunque entiendo su propósito, tengo algunas preguntas sobre cómo elegir valores para la tasa de aprendizaje. ¿La tasa de aprendizaje está relacionada con...
Al escribir un artículo / hacer una presentación sobre un tema que trata sobre redes neuronales, generalmente se visualiza la arquitectura de redes. ¿Cuáles son las formas buenas / simples de visualizar arquitecturas comunes
He construido mi modelo. Ahora quiero dibujar el diagrama de arquitectura de red para mi trabajo de investigación. El ejemplo se muestra a
Recién estoy comenzando con algo de aprendizaje automático, y hasta ahora he estado lidiando con la regresión lineal sobre una variable. He aprendido que hay una hipótesis, que es: hθ( x ) = θ0 0+ θ1Xhθ(x)=θ0+θ1xh_\theta(x)=\theta_0+\theta_1x Para encontrar buenos valores para los parámetros y θ...
¿Cuáles son las diferencias, si las hay, entre un "científico de datos" y un "ingeniero de aprendizaje automático"? Durante el año pasado, el "ingeniero de aprendizaje automático" comenzó a aparecer mucho en las ofertas de trabajo. Esto es particularmente notable en San Francisco, que es...
¿Alguien puede explicar prácticamente la razón detrás de la impureza de Gini frente a la ganancia de información (basada en la entropía)? ¿Qué métrica es mejor usar en diferentes escenarios al usar árboles de
Estoy haciendo algunos problemas en una aplicación de árbol de decisión / bosque aleatorio. Estoy tratando de ajustar un problema que tiene números y cadenas (como el nombre del país) como características. Ahora, la biblioteca, scikit-learn toma solo números como parámetros, pero quiero inyectar...
Estaba empezando a mirar el área bajo la curva (AUC) y estoy un poco confundido acerca de su utilidad. Cuando me lo explicaron por primera vez, el AUC parecía ser una gran medida de rendimiento, pero en mi investigación descubrí que algunos afirman que su ventaja es mayormente marginal, ya que es...
Antecedentes del problema: estoy trabajando en un proyecto que involucra archivos de registro similares a los que se encuentran en el espacio de monitoreo de TI (para mi mejor comprensión del espacio de TI). Estos archivos de registro son datos de series temporales, organizados en cientos / miles...
¿Cómo podría dividir aleatoriamente una matriz de datos y el vector de etiqueta correspondiente en un X_train, X_test, X_val, y_train, y_test, y_val con Sklearn? Que yo sepa, sklearn.cross_validation.train_test_splitsolo es capaz de dividirse en dos, no en tres
He estado pensando en las redes neuronales recurrentes (RNN) y sus variedades y las redes neuronales convolucionales (CNN) y sus variedades. ¿Sería justo decir estos dos puntos: Use CNN para dividir un componente (como una imagen) en subcomponentes (como un objeto en una imagen, como el contorno...
¿Cuál es el enfoque correcto y el algoritmo de agrupación para la agrupación de geolocalización? Estoy usando el siguiente código para agrupar las coordenadas de geolocalización: import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates=...
La lógica a menudo establece que al sobreajustar un modelo, su capacidad de generalizar es limitada, aunque esto solo puede significar que el sobreajuste impide que un modelo mejore después de una cierta complejidad. ¿El sobreajuste hace que los modelos empeoren independientemente de la complejidad...
Estoy usando TensorFlow para experimentos principalmente con redes neuronales. Aunque he realizado bastantes experimentos (XOR-Problema, MNIST, algunas cosas de Regresión, ...) ahora, me cuesta elegir la función de costo "correcta" para problemas específicos porque en general podría ser considerado...
Mi tarea de "aprendizaje automático" es separar el tráfico benigno de Internet del tráfico malicioso. En el escenario del mundo real, la mayoría (digamos 90% o más) del tráfico de Internet es benigno. Por lo tanto, sentí que debería elegir una configuración de datos similar para entrenar a mis...
Las redes neuronales obtienen los mejores resultados en tareas de visión por computadora (ver MNIST , ILSVRC , Kaggle Galaxy Challenge ). Parecen superar a cualquier otro enfoque en Computer Vision. Pero también hay otras tareas: Desafío de actividad molecular de Kaggle Regresión: predicción de...