Como la ciencia debe ser reproducible, por definición, existe un reconocimiento cada vez mayor de que los datos y el código son un componente esencial de la reproducción, como se discutió en la Mesa Redonda de Yale para compartir datos y códigos .
Al revisar un manuscrito para una revista que no requiere compartir datos y códigos, ¿puedo solicitar que los datos y el código estén disponibles?
- para mí en el momento de la revisión
- públicamente al momento de la publicación (la revista admite suplementos)
Además, ¿cómo podría formular una solicitud de este tipo?
actualización : aunque estoy interesado en el caso general, este caso particular consiste en un metanálisis con todos los datos publicados anteriormente, y el código es modelos lineales simples en SAS
nota al margen la capacidad de realizar inferencias entre estudios (como es el objetivo del metanálisis) se vería enormemente mejorada si más estudios proporcionaran datos sin procesar
actualización 2 :
Solicité los datos y el código al editor para fines de revisión, el editor consideró que la solicitud era razonable y recibí el material solicitado (suficiente pero con nombres de variables crípticas, sin metadatos y pocos comentarios en línea) en un día.
fuente
Respuestas:
En cuanto a la obtención de datos por parte de un revisor, tiene derecho si los necesita para completar su revisión correctamente. Más revisores deberían solicitar datos y evaluarlos. Muchas revistas tienen políticas que pueden requerir los datos y el código de análisis para fines de revisión.
La disponibilidad en el momento de la publicación no está clara para mí. Parece que estás diciendo que quieres forzar el problema de que los datos se hagan públicos como condición de publicación. Esa es una mala idea si no es una política de diario ya. Estás haciendo de la publicación un objetivo móvil injusto. Se presentaron esperando que no fuera un requisito y usted, ni el editor, deberían cambiar el juego.
Sin el conocimiento de muchos investigadores financiados con fondos públicos, se les exige que hagan públicos sus datos. Por ejemplo, la mayoría de las subvenciones de los NIH tienen cláusulas en las que el investigador debe presentar sus datos. La mayoría de las agencias de subvención del gobierno tienen cláusulas de intercambio de datos que obligan al investigador a compartir lo que encuentran (tal vez la fuerza es un poco fuerte dado que es muy difícil perder una subvención por eso ... aunque tal vez perder la renovación). El público pagó por los datos, por lo tanto, el público tiene derecho a ellos --- en el caso de la investigación en humanos, tiene derecho a anonimizarlos.
Algunos de los datos más caros y confidenciales para recopilar, los datos humanos de FMRI, también son algunos de los más disponibles públicamente. No solo PLoS, sino que las principales revistas del campo requieren la presentación de los datos y mantener un banco de datos disponible al público. Creo que esto dice mucho a las personas que se oponen por razones de costo (es muy costoso) y de privacidad (son datos humanos de pequeños estudios y, a veces, poblaciones clínicas únicas que podrían ser muy sensibles). Esas son razones que hacen que esos datos sean más valiosos para el público. Los investigadores que retienen dichos datos están perjudicando a las personas que los compraron (a todos), y necesitan una lección sobre cuáles son sus responsabilidades fuera de su pequeño laboratorio y competencia de publicación.
Si la investigación fue financiada de forma privada, realmente financiada de forma privada, entonces la mejor de las suertes.
fuente
Abordar las dos situaciones por separado:
Como revisor: Sí, creo que tendría motivos para pedir ver los datos o el código. Pero si fuera usted, me prepararía para ver cosas como código reducido o una submuestra de datos. Las personas implementan investigaciones futuras que no se informan en este documento en su código todo el tiempo, y usted no tiene derecho a dicho código. Como hago principalmente investigación biomédica, también estaría preparado para tener que lidiar con algunos acuerdos de uso de datos bastante restrictivos.
En la propia revista: No. Si un investigador quiere reproducir mis resultados, puede acercarse a mí para pedirme un código, por eso tenemos los autores correspondientes. Para datos, absolutamente no, bajo ninguna circunstancia. Mis datos se rigen por IRB y acuerdos de confidencialidad, no solo se harán públicos. Si yo quieroun conjunto de datos público, podría simular un conjunto de datos con propiedades similares (es decir, los datos de red "Faux-Mesa" disponibles en uno de los paquetes de red para R), pero como revisor, no tiene ninguna llamada para forzar eso . Si es un requisito de toda la revista, los autores sabían que sus datos / código serían públicos al enviarlo, pero si no es así, entonces no. Su función es evaluar la calidad del documento en sí (de ahí que esté de acuerdo con él para los fines de la revisión), no utilizar su capacidad para contribuir a la aceptación / rechazo del documento para impulsar lo que es esencialmente un punto filosófico / político fuera del alcance de la revista.
En el mejor de los casos, pondría un "Insto encarecidamente a los autores a que pongan a disposición su código y sus datos, siempre que sea posible" en sus comentarios, pero no lo expresaría con más fuerza que eso, y no lo pondría en la lista formal de "Cosas que creo que necesitan arreglarse antes de que esto vea la luz del día".
fuente
Como John dice, la disponibilidad de datos para los revisores debería ser obvia; Una revisión cuidadosa debe incluir la replicación del análisis y, como tal, requiere acceso a los datos.
Con respecto a la disponibilidad pública de los datos después de la publicación, diría que la batalla se debe librar con la revista en general en lugar de con respecto a una presentación específica.
En una nota más general, las agencias de financiación y los IRB están cada vez más conscientes de que el intercambio de datos es un componente de investigación tanto científica como éticamente necesario. Al aumentar la disponibilidad para un nuevo análisis que podría generar nuevos resultados de informes erróneos correctos, el intercambio de datos aumenta los beneficios potenciales para la investigación, modificando así la compensación costo / beneficio para la ventaja de los participantes de la investigación. Ciertamente, es necesario informar a los participantes sobre la posibilidad de que se compartan sus datos, y también es necesario establecer salvaguardas para evitar un mayor riesgo de identificación para los participantes, pero esto se puede lograr en la mayoría de las circunstancias. En mi propia investigación, les aseguro a los participantes (y a mi IRB) que (1) los datos se almacenarán en un formato cifrado seguro (actualizado a medida que avanza la tecnología de descifrado),
fuente
No tengo ninguna experiencia con esto, pero me parece que podría insistir en el # 1 como parte de su propia diligencia debida en la revisión de sus resultados. Sin embargo, no veo cómo puedes insistir en el # 2.
fuente