Repositorio de información

En tecnología de la información , un repositorio de información o simplemente un repositorio es "un lugar central en el que se guarda y mantiene una agregación de datos de forma organizada, generalmente en un almacenamiento informático ". ^[1] "Puede ser simplemente la agregación de datos en sí en algún lugar de almacenamiento accesible o también puede implicar alguna capacidad para extraer datos selectivamente". ^[1]

biblioteca digital universal

El concepto de una biblioteca digital universal fue descrito como "al alcance" por una Directiva de Copyright de la Unión Europea de 2012 ^[2] que hablaba de los intentos de Google de "digitalizar en masa" lo que se denominan "obras huérfanas" (es decir, descatalogadas con derechos de autor). obras).

La Oficina de derechos de autor de EE. UU. y la ley de derechos de autor de la Unión Europea han estado trabajando en esto. Google ha llegado a acuerdos en Francia que "permiten al editor elegir qué obras pueden escanearse o venderse". Por el contrario, Google ha estado intentando en EE.UU. un acuerdo de "libre digitalización y venta de cualquier obra a menos que los titulares de los derechos de autor opten por no participar" y todavía no ha tenido éxito. ^[3]

Repositorio de información

Durante décadas se han realizado intentos de desarrollar lo que se llamó un depósito de información :

En 1989, IBM intentó que OfficeVision combinara mainframes y PC para habilitar "un depósito de información". ^[4]
En 2003, Microsoft introdujo OneNote como una extensión de Microsoft Office 2003; apoyaría "un depósito de información personal". ^[5]
En 1996, una biblioteca fundada en 1898 obtuvo financiación adicional para ampliar su misión y convertirse en un importante "centro de recursos locales y depósito de información regional". ^[6] El New York Times los describió como "los segundos más grandes en la región de la ciudad de Nueva York, sólo superados por la Biblioteca Pública de Nueva York en la Quinta Avenida". Sus servicios incluyen "un centro de información informática dedicado a solicitudes de artículos externos".

Repositorio de información federado

Un repositorio de información federado es una manera fácil de implementar un nivel secundario de almacenamiento de datos que puede comprender múltiples tecnologías de almacenamiento de datos en red que se ejecutan en diversos sistemas operativos , donde los datos que ya no necesitan estar en el almacenamiento primario están protegidos y clasificados según los metadatos capturados. , procesados, deduplicados y luego depurados, automáticamente, según los objetivos y requisitos del nivel de servicio de datos. En los repositorios de información federados, los recursos de almacenamiento de datos se virtualizan como conjuntos de almacenamiento compuestos y funcionan como un entorno federado . ^[7]

Se desarrollaron repositorios de información federados para mitigar los problemas que surgen de la proliferación de datos y eliminar la necesidad de implementar soluciones de almacenamiento de datos por separado debido a la implementación simultánea de diversas tecnologías de almacenamiento que ejecutan diversos sistemas operativos. Cuentan con gestión centralizada para todos los recursos de almacenamiento de datos implementados. Son autónomos, admiten recursos de almacenamiento heterogéneos, admiten la gestión de recursos para agregar, mantener, reciclar y terminar medios, rastrear medios fuera de línea y operar de forma autónoma.

Gestión de datos automatizada

Dado que una de las principales razones para la implementación de un repositorio de información federado es reducir la carga de trabajo de mantenimiento que los sistemas tradicionales de almacenamiento de datos imponen al personal de TI, los repositorios de información federados están automatizados. La automatización se logra mediante políticas que pueden procesar datos en función del tiempo, los eventos, la antigüedad de los datos y el contenido de los datos. Las políticas gestionan lo siguiente:

Gestión del espacio del sistema de archivos
Eliminación de datos irrelevantes (mp3, juegos, etc.)
Gestión de recursos de almacenamiento secundario.

Los datos se procesan según el tipo de medio, el grupo de almacenamiento y la tecnología de almacenamiento .

Dado que los repositorios de información federados están destinados a reducir la carga de trabajo del personal de TI, están diseñados para ser fáciles de implementar y ofrecer flexibilidad de configuración, extensibilidad prácticamente ilimitada, redundancia y conmutación por error confiable.

Recuperación de datos

Los repositorios de información federados cuentan con capacidades sólidas de búsqueda y recuperación de datos basadas en el cliente que, según los permisos, permiten a los usuarios finales buscar en el repositorio de información, ver el contenido del repositorio de información, incluidos datos en medios fuera de línea, y recuperar archivos individuales o múltiples archivos en cualquiera de los dos sitios. su computadora de red original u otra computadora de red.

Referencias

^ ab Rouse, Margaret (abril de 2005). "Definición: repositorio". whatis.com . Objetivo tecnológico . Consultado el 1 de mayo de 2019 .
^ Pamela Samuelson (1 de mayo de 2012). "Una biblioteca digital universal está a nuestro alcance". Los Ángeles Times .
^ Eric Pfanner (25 de agosto de 2011). "En Francia, el editor y Google Reach llegan a un acuerdo". Los New York Times .
^ "Software IBM para integrar sistemas". Los New York Times . 17 de mayo de 1989.
^ John Markoff (11 de diciembre de 2003). "Para Doodlers y tarifas de paquetes, una carpeta multimedia". Los New York Times .
^ F. Romall (12 de mayo de 1996). "La biblioteca de Mt. Vernon cumple 100 años". Los New York Times .
^ Armstrong, Mark (9 de agosto de 2007). "Beneficios de un repositorio de información federado como nivel de almacenamiento secundario". Conferencia SNIA Enterprise Information World 2007 . Asociación de la industria de redes de almacenamiento (SNIA). Archivado desde el original el 21 de noviembre de 2008 . Consultado el 1 de mayo de 2019 .