En tecnología de la información , un repositorio de información o simplemente un repositorio es "un lugar central en el que se guarda y mantiene una agregación de datos de forma organizada, generalmente en un almacenamiento informático ". [1] "Puede ser simplemente la agregación de datos en sí en algún lugar de almacenamiento accesible o también puede implicar alguna capacidad para extraer datos selectivamente". [1]
El concepto de una biblioteca digital universal fue descrito como "al alcance" por una Directiva de Copyright de la Unión Europea de 2012 [2] que hablaba de los intentos de Google de "digitalizar en masa" lo que se denominan "obras huérfanas" (es decir, descatalogadas con derechos de autor). obras).
La Oficina de derechos de autor de EE. UU. y la ley de derechos de autor de la Unión Europea han estado trabajando en esto. Google ha llegado a acuerdos en Francia que "permiten al editor elegir qué obras pueden escanearse o venderse". Por el contrario, Google ha estado intentando en EE.UU. un acuerdo de "libre digitalización y venta de cualquier obra a menos que los titulares de los derechos de autor opten por no participar" y todavía no ha tenido éxito. [3]
Durante décadas se han realizado intentos de desarrollar lo que se llamó un depósito de información :
Un repositorio de información federado es una manera fácil de implementar un nivel secundario de almacenamiento de datos que puede comprender múltiples tecnologías de almacenamiento de datos en red que se ejecutan en diversos sistemas operativos , donde los datos que ya no necesitan estar en el almacenamiento primario están protegidos y clasificados según los metadatos capturados. , procesados, deduplicados y luego depurados, automáticamente, según los objetivos y requisitos del nivel de servicio de datos. En los repositorios de información federados, los recursos de almacenamiento de datos se virtualizan como conjuntos de almacenamiento compuestos y funcionan como un entorno federado . [7]
Se desarrollaron repositorios de información federados para mitigar los problemas que surgen de la proliferación de datos y eliminar la necesidad de implementar soluciones de almacenamiento de datos por separado debido a la implementación simultánea de diversas tecnologías de almacenamiento que ejecutan diversos sistemas operativos. Cuentan con gestión centralizada para todos los recursos de almacenamiento de datos implementados. Son autónomos, admiten recursos de almacenamiento heterogéneos, admiten la gestión de recursos para agregar, mantener, reciclar y terminar medios, rastrear medios fuera de línea y operar de forma autónoma.
Dado que una de las principales razones para la implementación de un repositorio de información federado es reducir la carga de trabajo de mantenimiento que los sistemas tradicionales de almacenamiento de datos imponen al personal de TI, los repositorios de información federados están automatizados. La automatización se logra mediante políticas que pueden procesar datos en función del tiempo, los eventos, la antigüedad de los datos y el contenido de los datos. Las políticas gestionan lo siguiente:
Los datos se procesan según el tipo de medio, el grupo de almacenamiento y la tecnología de almacenamiento .
Dado que los repositorios de información federados están destinados a reducir la carga de trabajo del personal de TI, están diseñados para ser fáciles de implementar y ofrecer flexibilidad de configuración, extensibilidad prácticamente ilimitada, redundancia y conmutación por error confiable.
Los repositorios de información federados cuentan con capacidades sólidas de búsqueda y recuperación de datos basadas en el cliente que, según los permisos, permiten a los usuarios finales buscar en el repositorio de información, ver el contenido del repositorio de información, incluidos datos en medios fuera de línea, y recuperar archivos individuales o múltiples archivos en cualquiera de los dos sitios. su computadora de red original u otra computadora de red.