Ciencia de los datos

17
Visualizando un gráfico con un millón de vértices

¿Cuál es la mejor herramienta para visualizar (dibujar los vértices y bordes) un gráfico con 1000000 vértices? Hay alrededor de 50000 aristas en el gráfico. Y puedo calcular la ubicación de vértices y aristas individuales. Estoy pensando en escribir un programa para generar un svg. ¿Cualquier otra...

17
¿Qué utilizas para generar un tablero en R?

Necesito generar informes periódicos (diarios, mensuales) del panel de análisis web. Serán estáticos y no requieren interacción, así que imagine un archivo PDF como salida de destino. Los informes mezclarán tablas y gráficos (principalmente gráficos minigráficos y viñetas creados con ggplot2)....

16
Método de puntuación RandomForestClassifier OOB

¿La implementación aleatoria del bosque en scikit-learn utiliza la precisión media como método de puntuación para estimar el error de generalización con muestras fuera de bolsa? Esto no se menciona en la documentación, pero el método score () informa la precisión media. Tengo un conjunto de datos...

16
¿Los pandas ahora son más rápidos que data.table?

https://github.com/Rdatatable/data.table/wiki/Benchmarks-%3A-Grouping Los puntos de referencia data.table no se han actualizado desde 2014. Escuché en algún lugar que Pandasahora es más rápido que data.table. ¿Es esto cierto? ¿Alguien ha hecho alguna referencia? ¿Nunca he usado Python antes pero...