El Protocolo de la Iniciativa de Archivos Abiertos para la recolección de metadatos ( OAI-PMH ) es un protocolo desarrollado para recolectar descripciones de metadatos de registros en un archivo, de modo que se puedan crear servicios utilizando metadatos de muchos archivos. Una implementación de OAI-PMH debe admitir la representación de metadatos en Dublin Core , pero también puede admitir representaciones adicionales. [1] [2]
Por lo general, el protocolo se denomina simplemente Protocolo OAI.
OAI-PMH utiliza XML sobre HTTP . La versión 2.0 del protocolo se publicó en 2002; el documento fue actualizado por última vez en 2015. Tiene una licencia Creative Commons BY-SA.
A finales de la década de 1990, Herbert Van de Sompel ( Universidad de Gante ) estaba trabajando con investigadores y bibliotecarios del Laboratorio Nacional de Los Álamos (EE.UU.) y convocó una reunión para abordar las dificultades relacionadas con cuestiones de interoperabilidad de los servidores de impresión electrónica y los repositorios digitales . La reunión se celebró en Santa Fe, Nuevo México , en octubre de 1999. [3] Un avance clave de la reunión fue la definición de una interfaz que permitía a los servidores de impresión electrónica exponer los metadatos de los documentos que contenían de forma estructurada para que otros Los repositorios podrían identificar y copiar documentos de interés entre sí. Esta interfaz/protocolo recibió el nombre de "Convención de Santa Fe". [1] [2] [4]
En 2000 se llevaron a cabo varios talleres en la conferencia de Bibliotecas Digitales de ACM, [5] en la primera conferencia conjunta ACM/IEEE-CS sobre bibliotecas digitales [6] [7] y en otros lugares para compartir las ideas de la Convención de Santa Fe. [8] En los talleres se descubrió que los problemas que enfrentaba la comunidad de impresión electrónica también eran compartidos por bibliotecas, museos, editores de revistas y otros que necesitaban compartir recursos distribuidos. Para abordar estas necesidades, la Coalición para la Información en Red [9] y la Federación de Bibliotecas Digitales [10] proporcionaron fondos para establecer una secretaría de la Iniciativa de Archivos Abiertos (OAI) administrada por Herbert Van de Sompel y Carl Lagoze. La OAI celebró una reunión en la Universidad de Cornell ( Ithaca, Nueva York ) en septiembre de 2000 con el objetivo de mejorar la interfaz desarrollada en la Convención de Santa Fe. [11] Las especificaciones se refinaron por correo electrónico.
La versión 1.0 de OAI-PMH se presentó al público en enero de 2001 en un taller en Washington DC , [12] y otro en febrero en Berlín, Alemania . [13] Las modificaciones posteriores al estándar XML realizadas por el W3C requirieron realizar modificaciones menores a OAI-PMH, lo que dio como resultado la versión 1.1. La versión actual, 2.0, se publicó en junio de 2002. Contenía varios cambios y mejoras técnicas y no es compatible con versiones anteriores. [14]
Desde 2001, el CERN , y más tarde en colaboración con la Universidad de Ginebra , ha organizado talleres bianuales de la OAI, [15] que con el tiempo se han desarrollado para cubrir la mayoría de los aspectos de la ciencia abierta . Desde 2021, la serie de talleres se denomina Taller de Ginebra sobre innovaciones en la comunicación académica, y el apodo OAI refleja su origen. [dieciséis]
Algunos motores de búsqueda comerciales utilizan OAI-PMH para adquirir más recursos. Google inicialmente incluyó soporte para OAI-PMH al lanzar mapas de sitio, sin embargo, decidió admitir sólo el formato estándar XML Sitemaps en mayo de 2008. [17] En 2004, Yahoo! adquirió contenido de OAIster ( Universidad de Michigan ) que se obtuvo mediante la recolección de metadatos con OAI-PMH. Wikimedia utiliza un repositorio OAI-PMH para proporcionar feeds de Wikipedia y actualizaciones de sitios relacionados para motores de búsqueda y otros esfuerzos de republicación/análisis masivo. [18] Especialmente cuando se trata de miles de archivos que se recopilan todos los días, OAI-PMH puede ayudar a reducir el tráfico de la red y el uso de otros recursos mediante la recopilación incremental. [19] El sistema de búsqueda de metadatos Mercurio de la NASA utiliza OAI-PMH para indexar miles de registros de metadatos del Global Change Master Directory (GCMD) todos los días. [20]
El proyecto mod_oai utiliza OAI-PMH para exponer contenido a rastreadores web al que se puede acceder desde servidores web Apache .
Posteriormente, OAI-PMH se aplicó para compartir datos científicos. [21]
OAI-PMH se basa en una arquitectura cliente-servidor , en la que los "recolectores" solicitan información sobre registros actualizados de los "repositorios". Las solicitudes de datos pueden basarse en un rango de fecha y pueden restringirse a conjuntos con nombres definidos por el proveedor. Los proveedores de datos deben proporcionar metadatos XML en formato Dublin Core y también pueden proporcionarlos en otros formatos XML.
Varios sistemas de software soportan OAI-PMH, incluidos Fedora , EThOS de la Biblioteca Británica , GNU EPrints de la Universidad de Southampton , Open Journal Systems del Public Knowledge Project , Desire2Learn , DSpace del MIT , HyperJournal de la Universidad de Pisa , Digibib de Digibis, MyCoRe , Koha , Primo, DigiTool, Rosetta y MetaLib de Ex Libris , ArchivalWare de PTFS, DOOR [22] del eLab [23] en Lugano, Suiza, panFMP de PANGEA (biblioteca de datos) , [24] SimpleDL de Roaring Development y jOAI del Centro Nacional de Investigación Atmosférica . [25]
Varios archivos grandes admiten el protocolo, incluidos arXiv y el servidor de documentos del CERN .
{{cite journal}}
: Mantenimiento CS1: fecha y año ( enlace ){{cite book}}
: Mantenimiento CS1: fecha y año ( enlace ){{cite book}}
: Mantenimiento CS1: fecha y año ( enlace )