Ciencia de los datos

10
Calificaciones para programas de doctorado

Yann LeCun mencionó en su AMA que considera que tener un doctorado es muy importante para conseguir un trabajo en una empresa de primer nivel. Tengo una maestría en estadística y mi licenciatura estaba en economía y matemática aplicada, pero ahora estoy estudiando programas de doctorado de ML. La...

10
Depuración de redes neuronales

Construí una red neuronal artificial en Python usando la función de optimización scipy.optimize.minimize (gradiente conjugado). Implementé la verificación de gradiente, verifiqué todo, etc., y estoy bastante seguro de que funciona correctamente. Lo he ejecutado varias veces y llega a...

10
¿Cómo depurar el análisis de datos?

Me he encontrado con el siguiente problema, que reconozco es bastante típico. Tengo algunos datos grandes, por ejemplo, unos pocos millones de filas. Ejecuto algunos análisis no triviales, por ejemplo, una consulta SQL que consta de varias subconsultas. Obtengo algún resultado, indicando, por...

10
Los mejores idiomas para la informática científica [cerrado]

Cerrada . Esta pregunta necesita estar más centrada . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que se centre en un problema solo editando esta publicación . Cerrado hace 5 años . Parece que la...

10
Aprendizaje regresión ordinal en R?

Estoy trabajando en un proyecto y necesito recursos para ponerme al día. El conjunto de datos es de alrededor de 35000 observaciones en aproximadamente 30 variables. Aproximadamente la mitad de las variables son categóricas y algunas tienen muchos valores posibles diferentes, es decir, si divide...

10
Conjuntos de datos clásicos de análisis de red

Existen varios conjuntos de datos clásicos para tareas de clasificación / regresión de aprendizaje automático. Los más populares son: Conjunto de datos de flor de iris ; Conjunto de datos titánicos ; Automóviles de tendencia de motor ; etc. ¿Pero alguien conoce conjuntos de datos similares para...

10
Pronóstico del mercado de divisas con redes neuronales

Me gustaría utilizar ANN para automatizar el comercio de divisas, preferiblemente USD / EUR o USD / GBP. Sé que esto es difícil y puede que no sea sencillo. Ya leí algunos documentos y realicé algunos experimentos, pero sin mucha suerte. Me gustaría recibir consejos de EXPERTOS para que esto...

10
Predicción con características no atómicas.

Me gustaría utilizar datos no atómicos, como una característica para una predicción. Supongamos que tengo una tabla con estas características: - Column 1: Categorical - House - Column 2: Numerical - 23.22 - Column 3: A Vector - [ 12, 22, 32 ] - Column 4: A Tree - [ [ 2323, 2323 ],[2323, 2323] , [...

10
Datos sesgados de varias clases

Tengo un conjunto de datos que contiene ~ 100,000 muestras de 50 clases. He estado usando SVM con un núcleo RBF para entrenar y predecir nuevos datos. Sin embargo, el problema es que el conjunto de datos está sesgado hacia diferentes clases. Por ejemplo, Clase 1 - 30 (~ 3% cada uno), Clase 31 - 45...

10
Datos comerciales de NASDAQ

Estoy tratando de encontrar datos de stock para practicar, ¿hay un buen recurso para esto? Encontré esto: ftp://emi.nasdaq.com/ITCH/ pero solo tiene el año actual. Ya tengo una forma de analizar el protocolo, pero me gustaría tener más datos para comparar. No tiene que estar en el mismo formato,...