Preguntas etiquetadas con bigdata

12
¿Cuántas celdas LSTM debo usar?

¿Existen reglas generales (o reglas reales) relacionadas con la cantidad mínima, máxima y "razonable" de celdas LSTM que debo usar? Específicamente me relaciono con BasicLSTMCell de TensorFlow y la num_unitspropiedad. Suponga que tengo un problema de clasificación definido por: t - number of time...

12
¿Qué es un 'antiguo nombre' de científico de datos?

Términos como 'ciencia de datos' y 'científico de datos' se usan cada vez más en estos días. Muchas empresas están contratando 'científico de datos'. Pero no creo que sea un trabajo completamente nuevo. Los datos han existido en el pasado y alguien tuvo que lidiar con los datos. Supongo que el...

11
Trabajando con clústeres HPC

En mi universidad, tenemos un clúster de computación HPC. Yo uso el clúster para entrenar clasificadores, etc. Entonces, por lo general, para enviar un trabajo al clúster (por ejemplo, script de python scikit-learn), necesito escribir un script de Bash que contenga (entre otros) un comando como...

10
¿Cómo hacer lotes de productos internos en Tensorflow?

Tengo dos tensor a:[batch_size, dim] b:[batch_size, dim]. Quiero hacer un producto interno para cada par en el lote, generando c:[batch_size, 1], dónde c[i,0]=a[i,:].T*b[i,:].

10
¿Cuándo elegir regresión lineal o árbol de decisión o regresión de bosque aleatorio? [cerrado]

Cerrada . Esta pregunta necesita estar más centrada . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que se centre en un problema solo editando esta publicación . Cerrado hace 4 años . Estoy...

10
Los mejores idiomas para la informática científica [cerrado]

Cerrada . Esta pregunta necesita estar más centrada . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que se centre en un problema solo editando esta publicación . Cerrado hace 5 años . Parece que la...

9
Diferencia entre interpolar () y fillna () en pandas

Dado que el método interpolar y llenar hace el mismo trabajo de llenar valores n. ¿Cuál es la diferencia básica entre los dos? ¿Cuál es el significado de tener estos dos métodos diferentes? ¿Alguien puede explicarme en términos simples? Ya visité la documentación oficial y quería saber la...

8
Error en cascada en la tormenta de Apache

Revisando la presentación y el material de Summingbird por Twitter, una de las razones que se mencionan para usar los clústeres de Storm y Hadoop juntos en Summingbird es que el procesamiento a través de Storm produce una cascada de errores. Para evitar esta cascada de errores y su acumulación, el...