Estoy usando redes neuronales para resolver diferentes problemas de aprendizaje automático. Estoy usando Python y pybrain pero esta biblioteca está casi descontinuada. ¿Hay otras buenas alternativas en
Úselo para preguntas de ciencia de datos relacionadas con el lenguaje de programación Python. No está destinado a preguntas generales de codificación (-> stackoverflow).
Estoy usando redes neuronales para resolver diferentes problemas de aprendizaje automático. Estoy usando Python y pybrain pero esta biblioteca está casi descontinuada. ¿Hay otras buenas alternativas en
Soy novato en la ciencia de datos y no entiendo la diferencia entre fity fit_transformmétodos en scikit-learn. ¿Alguien puede simplemente explicar por qué podríamos necesitar transformar los datos? ¿Qué significa ajustar el modelo en los datos de entrenamiento y transformarlos en datos de prueba?...
Estoy empezando a desarrollar una aplicación de aprendizaje automático para fines académicos. Actualmente estoy usando R y entrenándome en ello. Sin embargo, en muchos lugares, he visto personas que usan Python . ¿Qué utilizan las personas en la academia y la industria, y cuál es la...
Estoy tratando de ejecutar SVR usando scikit learn (python) en un conjunto de datos de entrenamiento que tiene 595605 filas y 5 columnas (características) y un conjunto de datos de prueba que tiene 397070 filas. Los datos han sido preprocesados y regularizados. Puedo ejecutar con éxito los...
He estado usando pandas por bastante tiempo. Pero, no entendí cuál es la diferencia entre isna()y isnull()en los pandas. Y, lo que es más importante, cuál usar para identificar los valores faltantes en el marco de datos. ¿Cuál es la diferencia básica subyacente de cómo se detecta un valor como nao...
Estoy haciendo algunos problemas en una aplicación de árbol de decisión / bosque aleatorio. Estoy tratando de ajustar un problema que tiene números y cadenas (como el nombre del país) como características. Ahora, la biblioteca, scikit-learn toma solo números como parámetros, pero quiero inyectar...
Estoy tratando de comenzar a aprender sobre RNN y estoy usando Keras. Entiendo la premisa básica de las capas RNN y LSTM de vainilla, pero tengo problemas para comprender un cierto punto técnico para el entrenamiento. En la documentación de Keras , dice que la entrada a una capa RNN debe tener...
Antecedentes del problema: estoy trabajando en un proyecto que involucra archivos de registro similares a los que se encuentran en el espacio de monitoreo de TI (para mi mejor comprensión del espacio de TI). Estos archivos de registro son datos de series temporales, organizados en cientos / miles...
¿Cuál es el enfoque correcto y el algoritmo de agrupación para la agrupación de geolocalización? Estoy usando el siguiente código para agrupar las coordenadas de geolocalización: import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates=...
Estoy trabajando en un proyecto de ciencia de datos usando Python. El proyecto tiene varias etapas. Cada etapa consiste en tomar un conjunto de datos, usar scripts de Python, datos auxiliares, configuración y parámetros, y crear otro conjunto de datos. Guardo el código en git, para que esa parte...
Estoy usando TensorFlow para experimentos principalmente con redes neuronales. Aunque he realizado bastantes experimentos (XOR-Problema, MNIST, algunas cosas de Regresión, ...) ahora, me cuesta elegir la función de costo "correcta" para problemas específicos porque en general podría ser considerado...
Obtuve ValueError al predecir datos de prueba usando un modelo RandomForest. Mi código: clf = RandomForestClassifier(n_estimators=10, max_depth=6, n_jobs=1, verbose=2) clf.fit(X_fit, y_fit) df_test.fillna(df_test.mean()) X_test = df_test.values y_pred = clf.predict(X_test) El...
Tengo un marco de datos de pandas con varias entradas, y quiero calcular la correlación entre los ingresos de algún tipo de tiendas. Hay una serie de tiendas con datos de ingresos, clasificación del área de actividad (teatro, tiendas de ropa, comida ...) y otros datos. Intenté crear un nuevo marco...
¿Cómo puede programar en la biblioteca de keras (o flujo de tensor) para particionar el entrenamiento en múltiples GPU? Digamos que se encuentra en una instancia de Amazon ec2 que tiene 8 GPU y desea utilizarlas todas para entrenar más rápido, pero su código es solo para una sola CPU o...
Actualmente estoy tratando de abrir un archivo con pandas y python para fines de aprendizaje automático, sería ideal para mí tenerlos a todos en un DataFrame. Ahora el archivo es de 18 GB y mi RAM es de 32 GB, pero sigo recibiendo errores de memoria. Desde su experiencia, ¿es posible? Si no,...
Estoy trabajando en la investigación, en la necesidad de una GANADOR clasificar de tres eventos = ( win, draw, lose) WINNER LEAGUE HOME AWAY MATCH_HOME MATCH_DRAW MATCH_AWAY MATCH_U2_50 MATCH_O2_50 3 13 550 571 1.86 3.34 4.23 1.66 2.11 3 7 322 334 7.55 4.1 1.4 2.17 1.61 Mi modelo actual es: def...
Estoy tratando de entrenar un modelo de aumento de gradiente en más de 50k ejemplos con 100 características numéricas. XGBClassifiermaneja 500 árboles en 43 segundos en mi máquina, mientras que GradientBoostingClassifiermaneja solo 10 árboles (!) en 1 minuto y 2 segundos :( No me molesté en tratar...
XGBoost ha estado haciendo un gran trabajo cuando se trata de lidiar con variables dependientes categóricas y continuas. Pero, ¿cómo selecciono los parámetros optimizados para un problema de XGBoost? Así es como apliqué los parámetros para un problema reciente de Kaggle: param <- list(...
Estoy usando una regresión lineal estándar usando scikit-learn en python. Sin embargo, me gustaría obligar a los pesos a ser todos positivos para cada característica (no negativa), ¿hay alguna forma de lograrlo? Estaba buscando en la documentación pero no pude encontrar una manera de lograrlo....
Tanto PyTorch como Tensorflow Fold son marcos de aprendizaje profundo destinados a tratar situaciones en las que los datos de entrada tienen una longitud o dimensiones no uniformes (es decir, situaciones en las que los gráficos dinámicos son útiles o necesarios). Me gustaría saber cómo se...