Los datos FAIR son aquellos que cumplen con los principios FAIR de facilidad de búsqueda , accesibilidad, interoperabilidad y reutilización (FAIR). [1] [2] El acrónimo y los principios fueron definidos en un artículo de marzo de 2016 en la revista Scientific Data por un consorcio de científicos y organizaciones. [1]
Los principios FAIR enfatizan la capacidad de acción de las máquinas (es decir, la capacidad de los sistemas computacionales de encontrar, acceder, interoperar y reutilizar datos sin intervención humana o con una intervención mínima) porque los humanos dependen cada vez más del soporte computacional para manejar datos como resultado del aumento en el volumen, la complejidad y la tasa de producción de datos. [3]
La abreviatura " datos FAIR/O" se utiliza a veces para indicar que el conjunto de datos o la base de datos en cuestión cumple con los principios FAIR y también lleva una licencia abierta explícita con capacidad para datos .
Encontrable
El primer paso para (re)utilizar datos es encontrarlos. Los metadatos y los datos deben ser fáciles de encontrar tanto para humanos como para computadoras. Los metadatos legibles por máquinas son esenciales para el descubrimiento automático de conjuntos de datos y servicios, por lo que este es un componente esencial del proceso de FAIRificación.
F1. A los (meta)datos se les asigna un identificador global único y persistente
F2. Los datos se describen con metadatos enriquecidos (definidos por R1 a continuación)
F3. Los metadatos incluyen de forma clara y explícita el identificador de los datos que describen.
F4. Los (meta)datos se registran o indexan en un recurso que se puede buscar
Accesible
Una vez que el usuario encuentra los datos requeridos, necesita saber cómo acceder a ellos, posiblemente incluyendo autenticación y autorización .
A1. Los (meta)datos se pueden recuperar por su identificador utilizando un protocolo de comunicaciones estandarizado
A1.1 El protocolo es abierto, gratuito y de implementación universal.
A1.2 El protocolo permite un procedimiento de autenticación y autorización, cuando sea necesario
A2. Los metadatos son accesibles, incluso cuando los datos ya no están disponibles
Interoperable
Por lo general, los datos deben integrarse con otros datos. Además, los datos deben interoperar con aplicaciones o flujos de trabajo para su análisis , almacenamiento y procesamiento .
I1. Los (meta)datos utilizan un lenguaje formal, accesible, compartido y ampliamente aplicable para la representación del conocimiento.
I2. Vocabularios de uso de (meta)datos que siguen los principios FAIR
I3. Los (meta)datos incluyen referencias calificadas a otros (meta)datos
Reutilizable
El objetivo final de FAIR es optimizar la reutilización de los datos. Para lograrlo, los metadatos y los datos deben estar bien descritos para que puedan reproducirse y/o combinarse en diferentes entornos.
R1. Los (meta)datos se describen detalladamente con una pluralidad de atributos precisos y relevantes.
R1.1. Los (meta)datos se publican con una licencia de uso de datos clara y accesible
R1.2. Los (meta)datos están asociados con la procedencia detallada
R1.3. Los (meta)datos cumplen con los estándares comunitarios relevantes para el dominio
Los principios hacen referencia a tres tipos de entidades: datos (o cualquier objeto digital), metadatos (información sobre ese objeto digital) e infraestructura. Por ejemplo, el principio F4 define que tanto los metadatos como los datos se registran o indexan en un recurso que permite realizar búsquedas (el componente de infraestructura).
— Fundación GO FAIR, Principios FAIR, https://www.gofair.foundation/
Antes de FAIR, un artículo de 2007 fue el primer artículo que discutía ideas similares relacionadas con la accesibilidad de los datos. [4]
En la cumbre del G20 de Hangzhou de 2016 , los líderes del G20 emitieron una declaración en la que respaldaban la aplicación de los principios FAIR a la investigación. [5] [6] También en 2016, un grupo de organizaciones australianas elaboró una Declaración sobre el acceso FAIR a los resultados de investigación de Australia, que tenía como objetivo extender los principios a los resultados de investigación de manera más general. [7] En 2017, Alemania, los Países Bajos y Francia acordaron establecer [8] una oficina internacional para apoyar la iniciativa FAIR, la Oficina de Apoyo y Coordinación Internacional GO FAIR. [9]
Otras organizaciones internacionales activas en el ecosistema de datos de investigación, como CODATA o Research Data Alliance (RDA), también apoyan la implementación de los principios FAIR por parte de sus comunidades. El Grupo de Trabajo del Modelo de Madurez de Datos FAIR de RDA está explorando la evaluación de la implementación de los principios FAIR [10] . El Programa Decenal Estratégico de CODATA "Datos para el Planeta: Hacer que los datos funcionen para los desafíos interdisciplinarios" [11] menciona los principios de datos FAIR como un facilitador fundamental de la ciencia basada en datos. La Asociación de Bibliotecas de Investigación Europeas recomienda el uso de los principios FAIR [12] .
Un artículo de 2017 elaborado por defensores de los datos FAIR informó que la conciencia sobre el concepto FAIR estaba aumentando entre varios investigadores e institutos, pero también que la comprensión del concepto se estaba volviendo confusa a medida que diferentes personas aplicaban sus propias perspectivas diferentes al mismo. [13]
Las guías sobre la implementación de prácticas de datos FAIR establecen que el costo de un plan de gestión de datos que cumpla con las prácticas de datos FAIR debe ser del 5% del presupuesto total de investigación. [14]
En 2019, la Alianza Global de Datos Indígenas (GIDA) publicó los Principios CARE para la Gobernanza de Datos Indígenas como guía complementaria. [15] Los principios CARE amplían los principios delineados en los datos FAIR para incluir el beneficio colectivo, la autoridad para controlar, la responsabilidad y la ética para garantizar que las pautas de datos aborden los contextos históricos y las diferencias de poder. Los Principios CARE para la Gobernanza de Datos Indígenas se redactaron en el evento organizado conjuntamente por la Semana Internacional de Datos y la Alianza de Datos de Investigación, "Principios de soberanía de datos indígenas para el taller de gobernanza de datos indígenas", que se llevó a cabo el 8 de noviembre de 2018 en Gaborone , Botsuana. [16]
La falta de información sobre cómo implementar las directrices ha dado lugar a interpretaciones inconsistentes de las mismas. [17]
En enero de 2020, representantes de nueve grupos de universidades de todo el mundo elaboraron la declaración de la Sorbona sobre los derechos de los datos de investigación , [18] que incluía un compromiso con los datos FAIR y pedía a los gobiernos que brindaran apoyo para hacerlo posible. [19] En 2021, los investigadores identificaron los principios FAIR como un componente conceptual de las herramientas de software de catálogo de datos, siendo los otros componentes la gestión de metadatos, el contexto empresarial y las funciones de responsabilidad de los datos. [20] En abril de 2022, Matthias Scheffler y sus colegas argumentaron en Nature que los principios FAIR son "imprescindibles" para que la minería de datos y la inteligencia artificial puedan extraer información científica útil de los datos. [21]
Sin embargo, lograr que los datos (y los resultados de las investigaciones) sean JUSTOS es una tarea difícil, y es difícil evaluar su carácter JUSTO. [22]
{{cite web}}
: CS1 maint: nombres numéricos: lista de autores ( enlace )