stringtranslate.com

Archivo de datos de investigación

El archivo de datos de investigación es el almacenamiento a largo plazo de datos de investigaciones académicas , incluidas las ciencias naturales, las ciencias sociales y las ciencias de la vida. Las distintas revistas académicas tienen diferentes políticas con respecto a la cantidad de datos y métodos que los investigadores deben almacenar en un archivo público, y lo que realmente se archiva varía ampliamente entre las diferentes disciplinas. De manera similar, las principales instituciones que otorgan subvenciones tienen diferentes actitudes hacia el archivo público de datos. En general, la tradición de la ciencia ha sido que las publicaciones contengan información suficiente para permitir a los investigadores replicar y, por lo tanto, probar la investigación. En los últimos años, este enfoque se ha vuelto cada vez más tenso, ya que la investigación en algunas áreas depende de grandes conjuntos de datos que no pueden replicarse fácilmente de forma independiente.

El archivo de datos es más importante en algunos campos que en otros. En algunos campos, todos los datos necesarios para replicar el trabajo ya están disponibles en el artículo de la revista. En el desarrollo de fármacos , se genera una gran cantidad de datos que deben archivarse para que los investigadores puedan verificar que los informes que publican las compañías farmacéuticas reflejan con precisión los datos.

La necesidad de archivar datos es un desarrollo reciente en la historia de la ciencia . Fue posible gracias a los avances en la tecnología de la información que permitieron almacenar y acceder a grandes cantidades de datos desde ubicaciones centrales. Por ejemplo, la Unión Geofísica Americana (AGU) adoptó su primera política sobre archivo de datos en 1993, unos tres años después del inicio de la WWW . [1] Esta política exige que los conjuntos de datos citados en los documentos de la AGU deben ser archivados en un centro de datos reconocido; permite la creación de "documentos de datos"; y establece el papel de la AGU en el mantenimiento de archivos de datos. Pero no exige que los autores de artículos archiven sus datos.

Antes del archivo organizado de datos, los investigadores que quisieran evaluar o replicar un artículo tendrían que solicitar información sobre datos y métodos al autor. La comunidad académica espera que los autores compartan datos complementarios . Se reconoció que este proceso era una pérdida de tiempo y energía y obtuvo resultados mixtos. La información podría perderse o corromperse con el paso de los años. En algunos casos, los autores simplemente se niegan a proporcionar la información.

La necesidad de archivo de datos y diligencia debida aumenta considerablemente cuando la investigación aborda cuestiones de salud o la formación de políticas públicas. [2] [3]

Políticas seleccionadas por revistas

biotropica

Biotropica exige, como condición para la publicación, que los datos que respaldan los resultados del artículo y los metadatos que los describen se archiven en un archivo público apropiado, como Dryad, Figshare, GenBank, TreeBASE o NCBI. Los autores pueden optar por hacer que los datos estén disponibles públicamente tan pronto como se publique el artículo o, si la tecnología del archivo lo permite, embargar el acceso a los datos hasta tres años después de la publicación del artículo. Se incluirá en el manuscrito una declaración que describa la disponibilidad de datos como se describe en las instrucciones para los autores. Se pueden otorgar excepciones al archivo requerido de datos a discreción del Editor en Jefe para estudios que incluyan información confidencial (por ejemplo, la ubicación de especies en peligro de extinción). Nuestro editorial que explica la motivación de esta política se puede encontrar aquí. Una lista más completa de repositorios de datos está disponible aquí. Promover una cultura de colaboración con investigadores que recopilan y archivan datos: los datos recopilados por los biólogos tropicales suelen ser de largo plazo, complejos y costosos de recopilar. La Junta de Editores de Biotropica recomienda encarecidamente a los autores que reutilizan conjuntos de datos archivados que incluyan como colaboradores plenamente comprometidos a los científicos que los recopilaron originalmente. Creemos que esto mejorará en gran medida la calidad y el impacto de la investigación resultante al aprovechar los profundos conocimientos del recopilador de datos sobre la historia natural del sistema de estudio, reducir el riesgo de errores en análisis novedosos y estimular el intercambio interdisciplinario y transcultural. colaboración y capacitación por la cual la ATBC y Biotropica son ampliamente reconocidas.

NB: Biotropica es una de las dos únicas revistas que paga los honorarios de los autores que depositan datos en Dryad.

El naturalista americano

El American Naturalist exige que los autores depositen los datos asociados con los artículos aceptados en un archivo público. Para los datos de secuencia genética y los árboles filogenéticos, se requiere la deposición en GenBank o TreeBASE , respectivamente. Hay muchos archivos posibles que pueden adaptarse a un conjunto de datos particular, incluido el repositorio Dryad para datos ecológicos y de biología evolutiva. Todos los números de acceso de GenBank, TreeBASE y Dryad deben incluirse en los manuscritos aceptados antes de pasar a producción. Si los datos se depositan en otro lugar, proporcione un enlace. Si los datos se han extraído de la literatura publicada, deposite los datos recopilados en Dryad para comodidad de sus lectores. Cualquier impedimento al intercambio de datos debe comunicarse a la atención de los editores en el momento de la presentación para que se puedan elaborar los arreglos apropiados. [4]

Revista de herencia

Los datos primarios que subyacen a las conclusiones de un artículo son fundamentales para la verificabilidad y transparencia de la empresa científica y deben conservarse en forma utilizable durante décadas en el futuro. Por esta razón, Journal of Heredity requiere que las secuencias de nucleótidos o aminoácidos recientemente reportadas y las coordenadas estructurales se envíen a bases de datos públicas apropiadas (p. ej., GenBank; EMBL Nucleotide Sequence Database; DNA Database of Japan; Protein Data Bank ; y Swiss -Prot ). Los números de acceso deben incluirse en la versión final del manuscrito. Para otras formas de datos (por ejemplo, genotipos de microsatélites, mapas de vinculación, imágenes), la Revista respalda los principios de la Política Conjunta de Archivado de Datos (JDAP) al alentar a todos los autores a archivar conjuntos de datos primarios en un archivo público apropiado, como Dryad, TreeBASE. , o la Red de Conocimiento para la Biocomplejidad. Se anima a los autores a poner los datos a disposición del público en el momento de la publicación o, si la tecnología del archivo lo permite, optar por embargar el acceso a los datos durante un período de hasta un año después de la publicación. La Asociación Estadounidense de Genética también reconoce la gran inversión de investigadores individuales en generar y curar grandes conjuntos de datos. En consecuencia, recomendamos que esta inversión se respete en los análisis secundarios o metanálisis con un espíritu colaborativo amable.

-oxfordjournals.org  [ 5 ]

Ecología molecular

Molecular Ecology espera que los datos que respaldan los resultados del artículo se archiven en un archivo público apropiado, como GenBank, Gene Expression Omnibus , TreeBASE, Dryad, Knowledge Network for Biocomplexity, su propio repositorio institucional o de financiadores, o como información de respaldo sobre el sitio web de Ecología Molecular. Los datos son productos importantes de la empresa científica y deberían conservarse y utilizarse durante décadas en el futuro. Los autores pueden optar por tener los datos disponibles públicamente en el momento de la publicación o, si la tecnología del archivo lo permite, pueden optar por embargar el acceso a los datos por un período de hasta un año después de la publicación. Se pueden conceder excepciones a discreción del editor, especialmente para información sensible como datos de sujetos humanos o la ubicación de especies en peligro de extinción.

-  Wiley [6]

Naturaleza

Dicho material debe alojarse en un sitio independiente acreditado (la URL y los números de acceso los proporcionará el autor), o enviarse a la revista Nature en el momento del envío, ya sea cargado a través del servicio de envío en línea de la revista, o si los archivos son demasiado grandes o están en mal estado. un formato inadecuado para este fin, en CD/DVD (cinco copias). Dicho material no puede alojarse únicamente en el sitio web personal o institucional de un autor. [7] La ​​naturaleza requiere que el revisor determine si todos los datos y métodos complementarios han sido archivados. La política aconseja a los revisores que consideren varias preguntas, entre ellas: "¿Se debería pedir a los autores que proporcionen métodos o datos complementarios para acompañar el artículo en línea? (Dichos datos podrían incluir código fuente para estudios de modelado, protocolos experimentales detallados o derivaciones matemáticas).

—  Naturaleza [8]

Ciencia

La ciencia apoya los esfuerzos de las bases de datos que agregan datos publicados para uso de la comunidad científica. Por lo tanto, antes de la publicación, se deben depositar grandes conjuntos de datos (incluidos datos de microarrays, secuencias de proteínas o ADN y coordenadas atómicas o mapas de microscopía electrónica para estructuras macromoleculares) en una base de datos aprobada y se debe proporcionar un número de acceso para su inclusión en el artículo publicado. [9] "Materiales y métodos": ahora la ciencia solicita que, en general, los autores coloquen la mayor parte de su descripción de materiales y métodos en línea como material de apoyo, proporcionando en el manuscrito impreso sólo la descripción de los métodos que sea necesaria para seguir la lógica. del texto. (Obviamente, esta restricción no se aplicará si el artículo es fundamentalmente un estudio de un nuevo método o técnica).

—  Ciencia [10]

Sociedad de la realeza

Para permitir que otros verifiquen y desarrollen el trabajo publicado en las revistas de la Royal Society , es una condición de publicación que los autores pongan a disposición los datos, el código y los materiales de investigación que respaldan los resultados del artículo.

Los conjuntos de datos y el código deben depositarse en un repositorio apropiado, reconocido y disponible públicamente. Cuando no exista un repositorio de datos específico, los autores deben depositar sus conjuntos de datos en un repositorio general como Dryad (repositorio) o Figshare .

—  Sociedad Real [11]

Revista de ciencia arqueológica

El Journal of Archaeological Science ha tenido una política de divulgación de datos desde al menos 2013. Su política establece que "todos los datos relacionados con el artículo deben estar disponibles en archivos complementarios o depositados en repositorios externos y vinculados dentro del artículo". La política recomienda que los datos se depositen en un repositorio como el Servicio de Datos Arqueológicos , el Registro Arqueológico Digital o PANGEA . Un estudio de 2018 encontró una tasa de disponibilidad de datos del 53 %, lo que refleja una aplicación débil de esta política o una comprensión incompleta entre los editores, revisores y autores sobre cómo interpretar e implementar esta política. [12]

Políticas de las agencias de financiación

En Estados Unidos, la Fundación Nacional para la Ciencia (NSF) ha endurecido los requisitos sobre el archivo de datos. Los investigadores que buscan financiación de la NSF ahora deben presentar un plan de gestión de datos como complemento de dos páginas a la solicitud de subvención. [13]

La iniciativa NSF Datanet ha resultado en la financiación del proyecto Red de Observación de Datos para la Tierra ( DataONE ), que proporcionará archivo de datos científicos para datos ecológicos y ambientales producidos por científicos de todo el mundo. El objetivo declarado de DataONE es preservar y proporcionar acceso a datos de múltiples escalas, multidisciplinarios y multinacionales. La comunidad de usuarios de DataONE incluye científicos, administradores de ecosistemas, formuladores de políticas, estudiantes, educadores y el público.

La DFG alemana exige que los datos de la investigación se archiven en la propia institución del investigador o en una infraestructura nacional adecuada durante al menos 10 años. [14]

El Centro Británico de Curación Digital mantiene una descripción general de las políticas de datos de los financiadores. [15]

biblioteca de datos

Repositorio de datos y repositorio de archivos

Los datos de la investigación se archivan en bibliotecas de datos o archivos de datos . Una biblioteca de datos , un archivo de datos o un repositorio de datos es una colección de conjuntos de datos numéricos y/o geoespaciales para uso secundario en la investigación. Una biblioteca de datos normalmente forma parte de una institución más grande (académica, corporativa, científica, médica, gubernamental, etc.). establecido para el archivo de datos de investigación y para servir a los usuarios de datos de esa organización. La biblioteca de datos tiende a albergar colecciones de datos locales y proporciona acceso a ellas a través de diversos medios ( CD -/ DVD -ROM o servidor central para descarga). Una biblioteca de datos también puede mantener suscripciones a recursos de datos con licencia para que sus usuarios accedan a la información. El hecho de que una biblioteca de datos se considere también un archivo de datos puede depender del alcance de los fondos únicos de la colección, de si se ofrecen servicios de preservación a largo plazo y de si sirve a una comunidad más amplia (como lo hacen los archivos de datos nacionales). La mayoría de las bibliotecas de datos públicas figuran en el Registro de Repositorios de Datos de Investigación .

Importancia y servicios

En agosto de 2001, la Asociación de Bibliotecas de Investigación (ARL) publicó un informe [16] presentando los resultados de una encuesta de instituciones miembros de la ARL involucradas en la recopilación y prestación de servicios de recursos de datos numéricos.

Servicio de biblioteca que brinda apoyo a nivel institucional para el uso de conjuntos de datos numéricos y de otro tipo en la investigación. Entre las actividades de apoyo típicamente disponibles:

Ejemplos de bibliotecas de datos

Ciencias Naturales

La siguiente lista se refiere a archivos de datos científicos.

Ciencias Sociales

En las ciencias sociales, las bibliotecas de datos se denominan archivos de datos. [17] Los archivos de datos son instituciones profesionales para la adquisición, preparación, preservación y difusión de datos sociales y de comportamiento. Los archivos de datos en las ciencias sociales evolucionaron en la década de 1950 y han sido percibidos como un movimiento internacional:

En 1964, el Consejo Internacional de Ciencias Sociales (CISS) había patrocinado una segunda conferencia sobre archivos de datos de ciencias sociales y tenía un Comité permanente sobre datos de ciencias sociales, los cuales estimularon el movimiento de archivos de datos. A principios del siglo XXI, la mayoría de los países desarrollados y algunos países en desarrollo habían organizado archivos de datos nacionales formales y que funcionaban bien. Además, los campus universitarios suelen tener "bibliotecas de datos" que ponen los datos a disposición de sus profesores, personal y estudiantes; la mayoría de ellos tienen una responsabilidad mínima de archivo, confiando para esa función en una institución nacional (Rockwell, 2001, p. 3227). [18]

Ver también

Referencias

  1. ^ "Política sobre referenciación de datos y archivo de datos para publicaciones de AGU" [1]
  2. ^ "El caso de la debida diligencia cuando se utiliza la investigación empírica en la formación de políticas" por Bruce McCullough y Ross McKitrick. [2]
  3. ^ "Intercambio y replicación de datos", un sitio web de Gary King Archivado el 28 de marzo de 2007 en Wayback Machine.
  4. ^ Datos y material de respaldo
  5. ^ Política de archivo de datos
  6. ^ Política de archivo de datos
  7. ^ "Disponibilidad de datos y materiales: la política de la revista Nature
  8. ^ "Guía de políticas de publicación de las revistas de naturaleza" (PDF) . 14 de marzo de 2007.
  9. ^ "Revista Políticas Generales de la Ciencia"
  10. ^ "Preparación de su material de apoyo en línea"
  11. ^ "Intercambio y minería de datos"
  12. ^ Marwick, Ben; Birch, Suzanne E. Pilaar (5 de abril de 2018). "Un estándar para la cita académica de datos arqueológicos como incentivo para el intercambio de datos". Avances en la práctica arqueológica . 6 (2): 125-143. doi : 10.1017/aap.2018.3 .
  13. ^ "NSF solicitará a cada solicitante de subvención un plan de gestión de datos"
  14. ^ "Directrices de la DFG sobre el manejo de datos de investigación"
  15. ^ "Descripción general de las políticas de datos de los financiadores | Centro de curación digital"
  16. ^ SPEC Kit 263: Productos y servicios de datos numéricos
  17. ^ Blanco, Howard D. (1977). Datos de ciencias sociales legibles por máquina. Biblioteca Drexel Quarterly 13 (enero de 1977): 1-110.
  18. ^ Rockwell, RC (2001). Archivos de datos: internacional. EN: Smelser, NJ & Baltes, PB (eds.) Enciclopedia internacional de ciencias sociales y del comportamiento (vol. 5, págs. 3225-3230). Ámsterdam: Elsevier

Notas

Otras lecturas

enlaces externos

Asociaciones