Los datos FAIR son datos que cumplen con los principios de búsqueda , accesibilidad, interoperabilidad y reutilización (FAIR). [1] [2] El acrónimo y los principios fueron definidos en un artículo de marzo de 2016 en la revista Scientific Data por un consorcio de científicos y organizaciones. [1]
Los principios FAIR enfatizan la capacidad de acción de las máquinas (es decir, la capacidad de los sistemas computacionales para encontrar, acceder, interoperar y reutilizar datos con ninguna o mínima intervención humana) porque los humanos dependen cada vez más del soporte computacional para manejar los datos como resultado del aumento en volumen, complejidad y velocidad de creación de datos. [3]
La abreviatura FAIR/O data se utiliza a veces para indicar que el conjunto de datos o la base de datos en cuestión cumple con los principios FAIR y también lleva una licencia abierta explícita con capacidad de datos .
Encontrable
El primer paso para (re)utilizar datos es encontrarlos. Los metadatos y los datos deberían ser fáciles de encontrar tanto para los humanos como para las computadoras. Los metadatos legibles por máquina son esenciales para el descubrimiento automático de conjuntos de datos y servicios, por lo que este es un componente esencial del proceso de FAIRificación.
F1. A los (meta)datos se les asigna un identificador global único y persistente.
F2. Los datos se describen con metadatos enriquecidos (definidos por R1 a continuación)
F3. Los metadatos incluyen clara y explícitamente el identificador de los datos que describen.
F4. Los (meta)datos se registran o indexan en un recurso con capacidad de búsqueda.
Accesible
Una vez que el usuario encuentra los datos requeridos, necesita saber cómo se puede acceder a ellos, posiblemente incluyendo autenticación y autorización .
A1. Los (meta)datos se pueden recuperar mediante su identificador utilizando un protocolo de comunicación estandarizado.
A1.1 El protocolo es abierto, gratuito y de implementación universal
A1.2 El protocolo permite un procedimiento de autenticación y autorización, cuando sea necesario
A2. Los metadatos son accesibles, incluso cuando los datos ya no están disponibles.
Interoperable
Por lo general, los datos deben integrarse con otros datos. Además, los datos deben interoperar con aplicaciones o flujos de trabajo para su análisis , almacenamiento y procesamiento .
I1. Los (meta)datos utilizan un lenguaje formal, accesible, compartido y ampliamente aplicable para la representación del conocimiento.
I2. (Meta)datos utilizan vocabularios que siguen los principios FAIR
I3. Los (meta)datos incluyen referencias calificadas a otros (meta)datos
Reutilizable
El objetivo final de FAIR es optimizar la reutilización de datos. Para lograr esto, los metadatos y los datos deben estar bien descritos para que puedan replicarse y/o combinarse en diferentes entornos.
R1. Los (meta)datos se describen detalladamente con una pluralidad de atributos precisos y relevantes.
R1.1. Los (meta)datos se publican con una licencia de uso de datos clara y accesible
R1.2. Los (meta)datos están asociados con una procedencia detallada
R1.3. Los (meta)datos cumplen con los estándares comunitarios relevantes para el dominio
Los principios se refieren a tres tipos de entidades: datos (o cualquier objeto digital), metadatos (información sobre ese objeto digital) e infraestructura. Por ejemplo, el principio F4 define que tanto los metadatos como los datos se registran o indexan en un recurso con capacidad de búsqueda (el componente de infraestructura).
— Fundación GO FAIR, Principios FAIR, https://www.gofair.foundation/
Antes de FAIR, un artículo de 2007 fue el primero en discutir ideas similares relacionadas con la accesibilidad de datos. [4]
En la cumbre del G20 de Hangzhou de 2016 , los líderes del G20 emitieron una declaración respaldando la aplicación de los principios FAIR a la investigación. [5] [6]
En 2016, un grupo de organizaciones australianas desarrolló una Declaración sobre el acceso JUSTO a los resultados de la investigación de Australia, cuyo objetivo era extender los principios a los resultados de la investigación de manera más general. [7]
En 2017, Alemania, los Países Bajos y Francia acordaron establecer [8] una oficina internacional para apoyar la iniciativa FAIR, la Oficina de Coordinación y Apoyo Internacional GO FAIR. [9]
Otras organizaciones internacionales activas en el ecosistema de datos de investigación, como CODATA o Research Data Alliance (RDA) también apoyan las implementaciones de FAIR por parte de sus comunidades. La evaluación de la implementación de los principios FAIR está siendo explorada por el Grupo de Trabajo del Modelo de Madurez de Datos FAIR de RDA, [10] El Programa Decenal estratégico de CODATA "Datos para el Planeta: Hacer que los datos funcionen para desafíos entre dominios" [11] menciona los principios de datos FAIR como un facilitador fundamental de ciencia impulsada por datos.
La Asociación de Bibliotecas Europeas de Investigación recomienda el uso de los principios FAIR. [12]
Un artículo de 2017 elaborado por defensores de los datos FAIR informó que la conciencia sobre el concepto FAIR estaba aumentando entre varios investigadores e institutos, pero también, la comprensión del concepto se estaba volviendo confusa a medida que diferentes personas le aplicaban sus propias perspectivas diferentes. [13]
Las guías sobre la implementación de prácticas de datos FAIR establecen que el costo de un plan de gestión de datos que cumpla con las prácticas de datos FAIR debe ser el 5% del presupuesto total de investigación. [14]
En 2019, la Alianza Global de Datos Indígenas (GIDA) publicó los Principios CARE para la Gobernanza de Datos Indígenas como guía complementaria. [15] Los principios de CARE amplían los principios descritos en los datos de FAIR para incluir el beneficio colectivo, la autoridad para controlar, la responsabilidad y la ética para garantizar que las pautas de datos aborden los contextos históricos y las diferencias de poder. Los Principios de CARE para la Gobernanza de Datos Indígenas se redactaron en el evento copatrocinado por la Semana Internacional de Datos y la Plenaria de la Alianza de Datos de Investigación, "Taller sobre Principios de Soberanía de Datos Indígenas para la Gobernanza de Datos Indígenas", celebrado el 8 de noviembre de 2018 en Gaborone , Botswana. [dieciséis]
La falta de información sobre cómo implementar las directrices ha dado lugar a interpretaciones inconsistentes de las mismas. [17]
En enero de 2020, representantes de nueve grupos de universidades de todo el mundo elaboraron la declaración de la Sorbona sobre los derechos de los datos de investigación , [18] que incluía un compromiso con los datos FAIR y pedía a los gobiernos que brindaran apoyo para permitirlo. [19]
En 2021, los investigadores identificaron los principios FAIR como un componente conceptual de las herramientas de software de catálogo de datos, siendo los otros componentes la gestión de metadatos, el contexto empresarial y las funciones de responsabilidad de los datos. [20]
En abril de 2022, Matthias Scheffler y sus colegas argumentaron en Nature que los principios FAIR son "imprescindibles" para que la minería de datos y la inteligencia artificial puedan extraer información científica útil de los datos. [21]
Sin embargo, hacer que los datos (y los resultados de la investigación) sean FAIR es una tarea desafiante, así como también lo es evaluar la FAIRness. [22]
{{cite web}}
: Mantenimiento CS1: nombres numéricos: lista de autores ( enlace )