Al evaluar la calidad de una pieza de software que está a punto de usar (ya sea algo que haya escrito o un paquete enlatado) en el trabajo computacional, a menudo es una buena idea ver qué tan bien funciona en conjuntos de datos estándar o problemas. ¿Dónde se pueden obtener estas pruebas para verificar las rutinas computacionales?
(Un sitio web / libro por respuesta, por favor).
Respuestas:
Si está interesado en realizar un análisis de matrices dispersas, también consideraría la Colección de matrices dispersas de la Universidad de Florida de Davis y el Mercado de matrices .
fuente
El método de soluciones fabricadas es un estándar para probar PDE y otros solucionadores. La mayoría de los sistemas de álgebra simbólica tienen facilidades para generar código, esto es útil para crear soluciones fabricadas. SymPy y Maple tienen la función ccode, entre otros para este propósito.
fuente
Las personas de la Universidad de Bari, Italia, que se hicieron cargo de CWI Amsterdam, actualmente mantienen un conjunto de pruebas para IVP (problemas de valor inicial para solucionadores de EDO).
fuente
Para probar los algoritmos de partición de gráficos, existe el Archivo de particiones de gráficos de Walshaw .
fuente
En el electromagnetismo computacional, existe un famoso (o infame debido a las dificultades en algunos) problemas de prueba: Prueba de métodos de análisis electromagnético (TEAM) .
Algunos de ellos realmente necesitan técnicas numéricas de vanguardia para obtener los resultados correctos de simulación alineados con los datos experimentales. Por ejemplo, el problema de la bobina conductora .
Dauge compila otro conjunto de problemas de prueba para las ecuaciones de Maxwell: cálculos de referencia para las ecuaciones de Maxwell para la aproximación de soluciones altamente singulares . El que está en el famoso (o infame) cubo de Fichera:
fuente
Si está interesado en algoritmos de evaluación comparativa relacionados con estructuras moleculares, la base de datos de pubchem tiene una gran colección de moléculas principalmente orgánicas. Esto puede ser útil para comparar predicciones de propiedades moleculares obtenidas con diferentes modelos / programas. El sitio tiene varias opciones para descargar grandes lotes de moléculas que satisfacen algunos criterios predefinidos (por ejemplo, composición química).
fuente
Arnold Neumaier mantiene una estabilidad de problemas de prueba para una optimización sin restricciones y restringida (programación no lineal). En esta colección se incluyen los problemas de prueba ahora estándar para la optimización sin restricciones debido a Moré, Garbow y Hillstrom.
fuente
El sitio web CUTEr actualiza el conjunto de pruebas CUTE mencionado en el sitio web de Arnold Neumaier con algunos problemas adicionales para la optimización y los solucionadores lineales. Además, proporciona herramientas de software para la prueba y actualización de álgebra lineal y solucionadores de optimización.
fuente
Las pruebas de Athena si estás resolviendo leyes de conservación hiperbólica.
fuente
Utilizamos conjuntos de datos meteorológicos en nuestro software de simulación de energía del edificio. Para los Estados Unidos, los conjuntos de datos consisten en observaciones meteorológicas tomadas (generalmente en aeropuertos) cada hora durante los 20 años anteriores.
Conjuntos de datos disponibles para descargar .
Manual para describir el formato del archivo .
fuente
Para probar algoritmos estadísticos, hay un Manual de pequeños conjuntos de datos de DJ Hand, F. Daly, K. McConway, D. Lunn y E. Ostrowski. Algunos de esos conjuntos de datos se pueden descargar desde aquí .
fuente
Para probar análisis estadísticos multivariados y algoritmos de aprendizaje automático, existe el repositorio de conjuntos de datos UCI en http://www.ics.uci.edu/~mlearn/
fuente
El sitio web de Hans Mittelman es un excelente recurso para navegar por las opciones de software actuales en optimización numérica. Incluye sus propios puntos de referencia, así como enlaces a otros puntos de referencia para problemas de prueba en la optimización .
fuente
Alan Genz propuso un conjunto de funciones de prueba en el documento Prueba de rutinas de integración multidimensional . No puedo encontrar una versión en línea de este documento, pero se pueden encontrar referencias a él en los documentos sobre la biblioteca CUBA .
fuente
Hay una colección de problemas de optimización con restricciones de PDE de referencia mantenidos por Roland Herzog en la TU-Chemnitz aquí .
fuente
Se debe haber probado un buen software, y debe decir cómo lo han hecho los autores y proporcionar los conjuntos de datos de prueba ellos mismos (por ejemplo, en forma de pruebas de regresión) o al menos proporcionar enlaces a los datos con los que se probó.
fuente
Si está buscando gráficos grandes o datos de red para probar. El Stanford Network Analysis Project (SNAP) tiene muchos conjuntos de datos de gráficos grandes típicamente en forma de una lista de adyacencia anonimizada. Algunas de sus opciones incluyen:
Datos
Propiedades de los datos
Estadísticas de verdad sobre el terreno disponibles en los conjuntos de datos:
Herramientas
fuente
Los datos son fáciles; La API para obtenerlo puede ser difícil. Recomiendo Quandl . Este sitio tiene más de 10 millones de conjuntos de datos disponibles públicamente accesibles a través de una API REST-ful fácil y sencilla. Todos los datos se devuelven en CSV o JSON. O, si la programación no es su punto fuerte, hay formas fáciles de llevar los datos a Excel. Los programadores de R, Python y Ruby estarán en casa con bibliotecas nativas.
fuente