Opciones de alojamiento para datos disponibles públicamente

12

Por lo tanto, ha decidido apoyar la idea de una investigación reproducible y desea que sus datos estén disponibles en línea para que la gente los vea y los use. La pregunta es, ¿dónde lo aloja?

Mi primera inclinación es, por supuesto, el espacio web privado que tengo en el servidor de una universidad, pero estas cosas no son realmente tan persistentes: si me voy, el directorio permanece abierto un período de tiempo muy corto antes de que desaparezca. Difícilmente es la configuración correcta para mantener los datos disponibles para que las personas los utilicen y trabajen en el futuro.

¿Utilizas algo como GitHub o SourceForge? U otro servicio?

Los datos en cuestión son el resultado de algunas simulaciones de interés muy limitado, por lo que no creo necesariamente que algún lugar como InfoChimps u otro de los repositorios de datos públicos sea el hogar adecuado para ello. Esto es menos "¡Puedes aprender cosas con este código!" y más "Puede replicar la Figura 3 en este documento".

Fomite
fuente
1
Relevante, quizás duplicado: stats.stackexchange.com/questions/10045/…
Matt Parker
1
Absolutamente relevante: agregar algunos detalles que sugieren por qué no pensé que fuera un duplicado.
Fomite
@EpiGrad: ¿Qué tipo de fecha tienes en mente? Si es un código fuente relacionado con su proyecto de investigación, puede adjuntarlo a su preimpresión arXiv .
Piotr Migdal
@PiotrMigdal Idealmente, me gustaría que los datos puedan pasar el tiempo durante varios años, el tiempo suficiente para que funcione la propagación habitual de citas en papel, etc. Lo adjuntaría a una preimpresión de arXiv si solo mi campo lo usara;)
Fomite
@EpiGrad Entonces, quizás un buen lugar para buscar es Open Data como un aspecto de Open Science: michaelnielsen.org/blog/open-science .
Piotr Migdal

Respuestas:

4

Una opción simple es github .

Lo uso un poco para compartir datos y código de análisis de datos. En esta pregunta se enumeran algunos buenos ejemplos de otros que comparten código y datos en el sitio .

Beneficios de github

  • Fácil de cargar una vez que se familiarice con git, y por qué no usar git para sus necesidades de control de versiones.
  • Puede usar gists para archivos simples simples
  • Es fácil para otros descargar archivos individuales o múltiples como archivo
  • Tiene una buena cantidad de almacenamiento gratuito.
  • el código fuente se puede navegar en internet
  • y más...

Por supuesto, github no es perfecto para los datos. Puedo ver las ventajas de usar un repositorio institucional más permanente o alguna otra herramienta dedicada para un archivo más serio.

Jeromy Anglim
fuente
1
Esta es realmente la solución con la que fui. Parte del problema con un repositorio institucional es que la institución en la que estoy está cambiando y los datos no son lo suficientemente importantes para uno de los grandes almacenes de datos.
Fomite el
4

Otra opción parece ser Dataverse , que está disponible como servicio y como software de código abierto. Sin embargo, no lo intenté.

Karsten W.
fuente
2

Una posibilidad para aquellos en la academia es el uso de un repositorio digital del campus a menudo alojado por las bibliotecas del campus (para mí, un lugar lógico para los conjuntos de datos que acompañan a las publicaciones).

Un repositorio digital popular (gratuito) es DSpace que, a mi entender, puede alojar conjuntos de datos. Pero este es un servicio que alguien en su institución debe alojar.

MannyG
fuente