El intercambio de datos es la práctica de poner a disposición de otros investigadores los datos utilizados para la investigación académica. Muchas agencias de financiación, instituciones y lugares de publicación tienen políticas con respecto al intercambio de datos porque muchos consideran que la transparencia y la apertura son parte del método científico . [1]
Varias agencias de financiación y revistas científicas exigen a los autores de artículos revisados por pares que compartan cualquier información complementaria ( datos brutos , métodos estadísticos o código fuente ) necesaria para comprender, desarrollar o reproducir la investigación publicada. Una gran parte de la investigación científica no está sujeta a requisitos de intercambio de datos, y muchas de estas políticas tienen amplias excepciones. En ausencia de cualquier requisito vinculante, el intercambio de datos queda a discreción de los propios científicos. Además, en ciertas situaciones, los gobiernos [2] y las instituciones prohíben o limitan severamente el intercambio de datos para proteger los intereses de propiedad, la seguridad nacional y la confidencialidad del sujeto/paciente/víctima. El intercambio de datos también puede restringirse para proteger a las instituciones y a los científicos del uso de los datos con fines políticos.
Los datos y métodos pueden ser solicitados a un autor años después de su publicación. Con el fin de fomentar el intercambio de datos [3] y evitar la pérdida o corrupción de los mismos, varias agencias de financiación y revistas establecieron políticas sobre el archivo de datos . El acceso a los datos archivados públicamente es un avance reciente en la historia de la ciencia, posibilitado por los avances tecnológicos en las comunicaciones y la tecnología de la información . Para aprovechar al máximo la rápida comunicación moderna puede ser necesario un acuerdo consensuado sobre los criterios subyacentes al reconocimiento mutuo de las respectivas contribuciones. Los modelos reconocidos para mejorar el intercambio oportuno de datos para una respuesta más eficaz a las amenazas emergentes de enfermedades infecciosas incluyen el mecanismo de intercambio de datos introducido por la Iniciativa GISAID . [4] [5]
A pesar de las políticas sobre el intercambio y el archivo de datos, todavía se producen casos de retención de datos. Los autores pueden no archivar los datos o solo archivar una parte de ellos. El hecho de no archivar los datos por sí solo no constituye retención de datos. Cuando un investigador solicita información adicional, a veces el autor se niega a proporcionarla. [6] Cuando los autores retienen datos de esta manera, corren el riesgo de perder la confianza de la comunidad científica. [7] Un estudio de 2022 identificó alrededor de 3500 artículos de investigación que contenían declaraciones de que los datos estaban disponibles, pero, tras solicitarlos y buscarlos más a fondo, se descubrió que no estaban disponibles en el 94 % de los artículos. [8]
El intercambio de datos también puede indicar el intercambio de información personal en una plataforma de redes sociales.
El 9 de agosto de 2007, el presidente Bush firmó la Ley America COMPETES (o la "Ley de creación de oportunidades para promover significativamente la excelencia en tecnología, educación y ciencia"), que exige que las agencias federales civiles proporcionen directrices, políticas y procedimientos para facilitar y optimizar el intercambio abierto de datos e investigaciones entre las agencias, el público y los responsables de las políticas. Véase la Sección 1009. [9]
'La Declaración de política de subvenciones de los Institutos Nacionales de Salud (NIH) define "datos" como "información registrada, independientemente de la forma o el medio en que pueda registrarse, e incluye escritos, películas, grabaciones de sonido, reproducciones pictóricas, dibujos, diseños u otras representaciones gráficas, manuales de procedimientos, formularios, diagramas, diagramas de flujo de trabajo, descripciones de equipos, archivos de datos, programas de procesamiento de datos o de computadora (software), registros estadísticos y otros datos de investigación".
— Consejo de Relaciones Gubernamentales [10]
La Declaración final del NIH sobre el intercambio de datos de investigación dice:
'Los NIH reafirman su apoyo al concepto de compartir datos. Creemos que compartir datos es esencial para traducir rápidamente los resultados de las investigaciones en conocimientos, productos y procedimientos para mejorar la salud humana. Los NIH respaldan el intercambio de datos de investigación finales para servir a estos y otros objetivos científicos importantes. Los NIH esperan y apoyan la publicación y el intercambio oportunos de los datos de investigación finales de los estudios financiados por los NIH para que los utilicen otros investigadores. 'Los NIH reconocen que los investigadores que recopilan los datos tienen un interés legítimo en beneficiarse de su inversión de tiempo y esfuerzo. Por lo tanto, hemos revisado nuestra definición de "publicación y uso compartido oportunos" para que no sea posterior a la aceptación para la publicación de los hallazgos principales del conjunto de datos finales. Los NIH siguen esperando que los investigadores iniciales puedan beneficiarse del primer uso y de la continuación de los mismos, pero no del uso exclusivo prolongado.'
— “Declaración final del NIH sobre el intercambio de datos de investigación” [11]
36. Intercambio de resultados, datos y otros productos de investigación
a. La NSF… espera que los investigadores compartan con otros investigadores, sin que ello suponga un coste mayor y en un plazo razonable, los datos, muestras, colecciones físicas y otros materiales de apoyo creados o reunidos en el curso de su trabajo. También alienta a los premiados a compartir software e invenciones o a actuar de otro modo para que las innovaciones que incorporan sean ampliamente útiles y utilizables.
b. Se podrán permitir ajustes y, cuando sea esencial, excepciones para salvaguardar los derechos de las personas y los sujetos, la validez de los resultados o la integridad de las colecciones o para atender los intereses legítimos de los investigadores.
— "National Science Foundation: Condiciones generales de subvención (GC-1)", 1 de abril de 2001 (pág. 17).
Las acusaciones de mala conducta en la investigación médica conllevan graves consecuencias. El Departamento de Salud y Servicios Humanos de los Estados Unidos creó una oficina para supervisar las investigaciones de las acusaciones de mala conducta, incluida la retención de datos. El sitio web define la misión:
"La Oficina de Integridad en la Investigación (ORI) promueve la integridad en la investigación biomédica y conductual con el apoyo del Servicio de Salud Pública de los Estados Unidos (PHS) en aproximadamente 4000 instituciones en todo el mundo. La ORI supervisa las investigaciones institucionales sobre mala conducta en la investigación y facilita la realización responsable de la investigación (RCR) a través de actividades educativas, preventivas y regulatorias".
— Oficina de Integridad de la Investigación.
Algunas organizaciones de investigación tienen una opinión particularmente fuerte sobre el intercambio de datos. El WaveLab de la Universidad de Stanford tiene una filosofía sobre la investigación reproducible y la divulgación de todos los algoritmos y códigos fuente necesarios para reproducir la investigación. En un artículo titulado "WaveLab and Reproducible Research", los autores describen algunos de los problemas que encontraron al intentar reproducir su propia investigación después de un período de tiempo. En muchos casos, fue tan difícil que desistieron del esfuerzo. Estas experiencias son las que los convencieron de la importancia de divulgar el código fuente. [12] La filosofía se describe así:
La Red de Observación de Datos de la Tierra ( DataONE ) y Data Conservancy [15] son proyectos apoyados por la Fundación Nacional de la Ciencia para alentar y facilitar el intercambio de datos entre científicos investigadores y apoyar mejor el metaanálisis . En las ciencias ambientales, la comunidad de investigación está reconociendo que los principales avances científicos que implican la integración del conocimiento en y entre campos requerirán que los investigadores superen no solo las barreras tecnológicas para el intercambio de datos sino también las barreras institucionales y sociológicas históricamente arraigadas. [16] El Dr. Richard J. Hodes, director del Instituto Nacional sobre el Envejecimiento ha declarado que "el viejo modelo en el que los investigadores guardaban celosamente sus datos ya no es aplicable". [17]
La Alianza para el Acceso de los Contribuyentes es un grupo de organizaciones que apoyan el acceso abierto a la investigación patrocinada por el gobierno. El grupo ha expresado una "Declaración de Principios" en la que explica por qué creen que el acceso abierto es importante. [18] También enumeran una serie de políticas internacionales de acceso público. [19] Esto no es más que una comunicación oportuna de información esencial para responder eficazmente a las emergencias sanitarias. [20] Si bien se han adoptado los archivos de dominio público para depositar datos, principalmente después de la publicación formal, no han logrado fomentar el intercambio rápido de datos durante las emergencias sanitarias, entre ellas los brotes de ébola [21] y zika, [22] [23] . Se requieren principios más claramente definidos para reconocer los intereses de quienes generan los datos y, al mismo tiempo, permitir el acceso libre y sin trabas a los datos y su uso (antes de la publicación) para la investigación y la aplicación práctica, como los adoptados por la Iniciativa GISAID para contrarrestar las amenazas emergentes de la gripe. [24] [25]
La retención de datos se ha vuelto tan común en genética que los investigadores del Hospital General de Massachusetts publicaron un artículo en una revista sobre el tema. El estudio concluyó que "debido a que se les negó el acceso a los datos, el 28% de los genetistas informaron que no habían podido confirmar las investigaciones publicadas". [26]
En un estudio de 2006, se observó que, de 141 autores de una publicación de artículos empíricos de la Asociación Estadounidense de Psicología (APA), 103 (73%) no respondieron con sus datos durante un período de 6 meses. [27] En un estudio de seguimiento publicado en 2015, se encontró que 246 de los 394 autores contactados de artículos en revistas de la APA no compartieron sus datos cuando se les solicitó (62%). [28]
Un estudio de 2018 informó sobre el estudio de una muestra aleatoria de 48 artículos publicados entre febrero y mayo de 2017 en el Journal of Archaeological Science, que encontró datos brutos disponibles abiertamente para 18 artículos (53 %), siendo los datos de composición y datación los tipos compartidos con mayor frecuencia. El mismo estudio también envió un correo electrónico a los autores de artículos sobre experimentos con artefactos de piedra que se publicaron durante 2009 y 2015 para solicitar datos relacionados con las publicaciones. Se comunicaron con los autores de 23 artículos y recibieron 15 respuestas, lo que resultó en una tasa de respuesta del 70 %. Recibieron cinco respuestas que incluían archivos de datos, lo que dio una tasa de intercambio general del 20 %. [29]
Un estudio sobre científicos en formación indicó que muchos ya habían experimentado retención de datos. [30] Este estudio ha generado temor de que la futura generación de científicos no respete las prácticas establecidas.
En el caso de las ciencias médicas y biológicas, las instituciones, los organismos de financiación y los medios de publicación imponen con más frecuencia requisitos para compartir datos que en el caso de las ciencias físicas. Los requisitos varían ampliamente en cuanto a si se deben compartir los datos, con quién se deben compartir y quién debe asumir los gastos de compartirlos.
Las agencias de financiamiento como el NIH y la NSF tienden a exigir un mayor intercambio de datos, pero incluso estos requisitos tienden a reconocer las preocupaciones sobre la confidencialidad del paciente, los costos incurridos en el intercambio de datos y la legitimidad de la solicitud. [31] Los intereses privados y las agencias públicas con intereses de seguridad nacional (defensa y aplicación de la ley) a menudo desalientan el intercambio de datos y métodos a través de acuerdos de confidencialidad.
El intercambio de datos plantea desafíos específicos en las iniciativas de monitoreo participativo , por ejemplo, cuando las comunidades forestales recopilan datos sobre las condiciones sociales y ambientales locales. En este caso, un enfoque basado en los derechos para el desarrollo de protocolos de intercambio de datos puede basarse en los principios del consentimiento libre, previo e informado y priorizar la protección de los derechos de quienes generaron los datos y/o de aquellos potencialmente afectados por el intercambio de datos. [32]
Comité sobre cuestiones relacionadas con el flujo transfronterizo de datos científicos, Consejo Nacional de Investigación (1997). Bits of Power: Issues in Global Access to Scientific Data. Washington, DC: National Academy Press. doi :10.17226/5504. ISBN 978-0-309-05635-9.— analiza el intercambio internacional de datos en las ciencias naturales.