Ciencia de los datos

16
¿Los pandas ahora son más rápidos que data.table?

https://github.com/Rdatatable/data.table/wiki/Benchmarks-%3A-Grouping Los puntos de referencia data.table no se han actualizado desde 2014. Escuché en algún lugar que Pandasahora es más rápido que data.table. ¿Es esto cierto? ¿Alguien ha hecho alguna referencia? ¿Nunca he usado Python antes pero...

16
¿Qué es un puntaje LB en aprendizaje automático?

Estaba leyendo un artículo en los blogs de kaggle. En repetidas ocasiones, el autor menciona 'puntaje LB' y 'ajuste LB') como una métrica para la efectividad del aprendizaje automático (junto con el puntaje de validación cruzada (CV)). Con una investigación sobre el significado de 'LB', pasé...

16
¿Qué más ofrece TensorFlow a los keras?

Soy consciente de que Keras sirve como una interfaz de alto nivel para TensorFlow. Pero me parece que los keras pueden hacer muchas funcionalidades por sí mismos (entrada de datos, creación de modelos, capacitación, evaluación). Además, parte de la funcionalidad de TensorFlow se puede portar...

16
Método de puntuación RandomForestClassifier OOB

¿La implementación aleatoria del bosque en scikit-learn utiliza la precisión media como método de puntuación para estimar el error de generalización con muestras fuera de bolsa? Esto no se menciona en la documentación, pero el método score () informa la precisión media. Tengo un conjunto de datos...

16
agrandar el mapa de calor marino

Creo un corr()df a partir de un df original. El corr()DF salió 70 X 70 y es imposible de visualizar el mapa de calor ... sns.heatmap(df). Si trato de mostrar corr = df.corr(), la tabla no se ajusta a la pantalla y puedo ver todas las correlaciones. ¿Es una forma de imprimir todo dfsin importar su...