En bibliotecología y archivística , la preservación digital es un proceso formal para garantizar que la información digital de valor continuo siga siendo accesible y utilizable a largo plazo. [1] Implica planificación, asignación de recursos y aplicación de métodos y tecnologías de preservación , [2] y combina políticas, estrategias y acciones para garantizar el acceso a contenido reformateado y " nacido digital ", independientemente de los desafíos que suponen las fallas de los medios y el cambio tecnológico. El objetivo de la preservación digital es la reproducción precisa de contenido autenticado a lo largo del tiempo. [3]
La Sección de Preservación y Reformateo de la Asociación de Colecciones Bibliotecarias y Servicios Técnicos de la Asociación Americana de Bibliotecas definió la preservación digital como una combinación de "políticas, estrategias y acciones que garantizan el acceso al contenido digital a lo largo del tiempo". [4] Según el Glosario del Bibliotecario de Harrod's , la preservación digital es el método de mantener vivo el material digital para que siga siendo utilizable a medida que los avances tecnológicos hacen que las especificaciones originales de hardware y software queden obsoletas. [5]
La necesidad de conservación digital surge principalmente debido a la vida útil relativamente corta de los medios digitales. Los discos duros ampliamente utilizados pueden volverse inutilizables en unos pocos años debido a una variedad de razones, como motores de husillo dañados, y la memoria flash (que se encuentra en SSD , teléfonos, unidades flash USB y en tarjetas de memoria como SD, microSD y tarjetas CompactFlash ) puede comenzar a perder datos alrededor de un año después de su último uso, dependiendo de su temperatura de almacenamiento y de la cantidad de datos que se hayan escrito en ella durante su vida útil. [ cita requerida ] Actualmente, los medios basados en discos de archivo están disponibles, pero solo están diseñados para durar 50 años y es un formato propietario, vendido solo por dos empresas japonesas, Sony y Panasonic. M-DISC es un formato basado en DVD que afirma retener datos durante 1000 años, pero escribir en él requiere unidades de disco óptico especiales y leer los datos que contiene requiere unidades de disco óptico cada vez menos comunes , además, la empresa detrás del formato se declaró en quiebra. Los datos almacenados en cintas LTO requieren una migración periódica, ya que las cintas más antiguas no pueden ser leídas por las unidades de cinta LTO más nuevas. Se pueden utilizar matrices RAID para proteger contra fallas de discos duros individuales, aunque se debe tener cuidado de no mezclar las unidades de una matriz con las de otra.
La tasación archivística (o, alternativamente, la selección [6] ) se refiere al proceso de identificación de registros y otros materiales que se van a conservar determinando su valor permanente. Por lo general, se consideran varios factores al tomar esta decisión. [7] Es un proceso difícil y crítico porque los registros restantes seleccionados darán forma a la comprensión de los investigadores de ese conjunto de registros o fondo . La tasación se identifica como A4.2 dentro del modelo de Cadena de Preservación (COP) [8] creado por el proyecto InterPARES 2. [9] La tasación archivística no es lo mismo que la tasación monetaria, que determina el valor justo de mercado .
La evaluación de archivos se puede realizar una sola vez o en las distintas etapas de adquisición y procesamiento . La evaluación macro, [10] un análisis funcional de los registros a un alto nivel, se puede realizar incluso antes de que se hayan adquirido los registros para determinar qué registros adquirir. Se puede realizar una evaluación iterativa más detallada mientras se procesan los registros.
La evaluación se realiza sobre todos los materiales de archivo, no solo sobre los digitales. Se ha propuesto que, en el contexto digital, podría ser conveniente conservar más registros de los que se han conservado tradicionalmente después de la evaluación de los registros analógicos, debido principalmente a una combinación del costo decreciente del almacenamiento y la disponibilidad de herramientas de descubrimiento sofisticadas que permitirán a los investigadores encontrar valor en registros de baja densidad de información. [11] [12] En el contexto analógico, estos registros pueden haber sido descartados o solo se ha conservado una muestra representativa. Sin embargo, la selección, evaluación y priorización de los materiales debe considerarse cuidadosamente en relación con la capacidad de una organización para gestionar de manera responsable la totalidad de estos materiales.
A menudo, a las bibliotecas y, en menor medida, a los archivos, se les ofrecen los mismos materiales en varios formatos digitales o analógicos diferentes. Prefieren seleccionar el formato que consideran que tiene el mayor potencial para la conservación a largo plazo del contenido. La Biblioteca del Congreso ha creado un conjunto de formatos recomendados para la conservación a largo plazo. [13] Se utilizarían, por ejemplo, si a la Biblioteca se le ofrecieran artículos para depósito de derechos de autor directamente de un editor.
En la conservación digital y la gestión de colecciones , el descubrimiento y la identificación de objetos se facilitan mediante el uso de identificadores asignados y metadatos descriptivos precisos. Un identificador es una etiqueta única que se utiliza para hacer referencia a un objeto o registro, que normalmente se manifiesta como un número o una cadena de números y letras. Como elemento crucial de los metadatos que se deben incluir en un registro o inventario de una base de datos, se utiliza junto con otros metadatos descriptivos para diferenciar los objetos y sus diversas instancias. [14]
Los metadatos descriptivos hacen referencia a información sobre el contenido de un objeto, como el título, el creador, el tema, la fecha, etc. [14] La determinación de los elementos utilizados para describir un objeto se facilita mediante el uso de un esquema de metadatos. Los metadatos descriptivos extensos sobre un objeto digital ayudan a minimizar los riesgos de que un objeto digital se vuelva inaccesible. [15]
Otro tipo común de identificación de archivos es el nombre de archivo . Implementar un protocolo de nombres de archivos es esencial para mantener la coherencia y la detección y recuperación eficientes de objetos en una colección, y es especialmente aplicable durante la digitalización de medios analógicos. El uso de una convención de nombres de archivos, como el nombre de archivo 8.3 o el nombre de archivo estándar Warez , garantizará la compatibilidad con otros sistemas y facilitará la migración de datos, y la decisión entre nombres de archivo descriptivos (que contienen palabras y números descriptivos) y no descriptivos (a menudo números generados aleatoriamente) generalmente está determinada por el tamaño y el alcance de una colección dada. [16] Sin embargo, los nombres de archivo no son buenos para la identificación semántica, porque son etiquetas no permanentes para una ubicación específica en un sistema y se pueden modificar sin afectar el perfil de nivel de bits de un archivo digital.
La piedra angular de la preservación digital, la " integridad de los datos ", se refiere a la garantía de que los datos están "completos e inalterados en todos los aspectos esenciales"; un programa diseñado para mantener la integridad tiene como objetivo "garantizar que los datos se registren exactamente como se pretende y, en su posterior recuperación, garantizar que los datos sean los mismos que cuando se registraron originalmente". [17]
Se deben evitar los cambios no intencionales en los datos y se deben implementar estrategias responsables para detectar cambios no intencionales y reaccionar según corresponda. Sin embargo, los esfuerzos de preservación digital pueden requerir modificaciones en el contenido o los metadatos mediante procedimientos desarrollados de manera responsable y políticas bien documentadas. Las organizaciones o las personas pueden optar por conservar versiones originales del contenido con integridad comprobada y/o versiones modificadas con metadatos de preservación adecuados. Las prácticas de integridad de los datos también se aplican a las versiones modificadas, ya que su estado de captura debe mantenerse y ser resistente a modificaciones no intencionales.
La integridad de un registro se puede preservar mediante la conservación a nivel de bits, la comprobación de la fiabilidad y la captura de un registro de auditoría completo de todas las acciones de conservación realizadas en el registro. Estas estrategias pueden garantizar la protección contra alteraciones no autorizadas o accidentales. [18]
La fijeza de un archivo es la propiedad de un archivo digital de estar fijo o no haber sufrido modificaciones. La comprobación de la fijeza de un archivo es el proceso de validar que un archivo no haya cambiado ni haya sido alterado con respecto a un estado anterior. [19] Este esfuerzo suele ser posible gracias a la creación, validación y gestión de sumas de comprobación .
Si bien las sumas de comprobación son el mecanismo principal para monitorear la fijeza a nivel de archivo individual, una consideración adicional importante para monitorear la fijeza es la asistencia de archivos. Mientras que las sumas de comprobación identifican si un archivo ha cambiado, la asistencia de archivos identifica si un archivo en una colección designada se creó, eliminó o movió recientemente. El seguimiento y la generación de informes sobre la asistencia de archivos es un componente fundamental de la gestión y la fijeza de colecciones digitales.
La caracterización de materiales digitales es la identificación y descripción de lo que es un archivo y de sus características técnicas definitorias [20] a menudo capturadas por metadatos técnicos, que registran sus atributos técnicos como el entorno de creación o producción. [21]
La sostenibilidad digital abarca una variedad de cuestiones y preocupaciones que contribuyen a la longevidad de la información digital. [22] A diferencia de las estrategias tradicionales, temporales y de las soluciones más permanentes, la sostenibilidad digital implica un proceso más activo y continuo. La sostenibilidad digital se concentra menos en la solución y la tecnología y más en la construcción de una infraestructura y un enfoque que sea flexible con énfasis en la interoperabilidad , el mantenimiento continuo y el desarrollo continuo. [23] La sostenibilidad digital incorpora actividades en el presente que facilitarán el acceso y la disponibilidad en el futuro. [24] [25] El mantenimiento continuo necesario para la preservación digital es análogo al exitoso y centenario mantenimiento comunitario del Caballo Blanco de Uffington (según Stuart M. Shieber) o del Gran Santuario de Ise (según Jeffrey Schnapp ). [26] [27]
La renderizabilidad se refiere a la capacidad continua de usar y acceder a un objeto digital manteniendo sus propiedades significativas inherentes. [28]
La obsolescencia de los medios físicos puede producirse cuando el acceso a contenidos digitales requiere dependencias externas que ya no se fabrican, mantienen ni reciben soporte. Las dependencias externas pueden hacer referencia a hardware, software o soportes físicos. Por ejemplo, la cinta DLT se utilizaba para realizar copias de seguridad y preservar datos, pero ya no se utiliza.
La obsolescencia del formato de archivo puede ocurrir cuando la adopción de nuevos formatos de codificación reemplaza el uso de formatos existentes, o cuando las herramientas de presentación asociadas ya no están fácilmente disponibles. [29]
Si bien el uso de formatos de archivo varía entre las instituciones de archivo dadas sus capacidades, existe una aceptación documentada en el campo de que los formatos de archivo elegidos deben ser "abiertos, estándar, no propietarios y bien establecidos" para permitir el uso de archivo a largo plazo. [30] Los factores que deben tenerse en cuenta al seleccionar formatos de archivo sostenibles incluyen la divulgación, la adopción, la transparencia, la autodocumentación, las dependencias externas, el impacto de las patentes y los mecanismos de protección técnica. [31] Otras consideraciones para seleccionar formatos de archivo sostenibles incluyen "la longevidad y madurez del formato, la adaptación en comunidades profesionales relevantes, los estándares de información incorporados y la accesibilidad a largo plazo de cualquier software de visualización requerido". [30] Por ejemplo, los Archivos del Instituto Smithsoniano consideran que los TIFF sin comprimir son "un buen formato de conservación para imágenes fijas digitales y digitalizadas debido a su madurez, amplia adaptación en varias comunidades y documentación exhaustiva". [30]
Los formatos que son propiedad de un proveedor de software tienen más probabilidades de verse afectados por la obsolescencia del formato. Es más probable que en el futuro se puedan leer estándares muy utilizados, como Unicode y JPEG .
Las propiedades significativas se refieren a los "atributos esenciales de un objeto digital que afectan su apariencia, comportamiento, calidad y facilidad de uso" y que "deben conservarse a lo largo del tiempo para que el objeto digital siga siendo accesible y significativo". [32]
"La comprensión adecuada de las propiedades significativas de los objetos digitales es fundamental para establecer los mejores enfoques prácticos para la conservación digital. Facilita la evaluación y la selección, procesos en los que se toman decisiones sobre qué propiedades significativas de los objetos digitales vale la pena conservar; ayuda al desarrollo de metadatos de conservación, la evaluación de diferentes estrategias de conservación e informa sobre el trabajo futuro para desarrollar estándares comunes en toda la comunidad de conservación". [33]
Ya sean analógicos o digitales, los archivos se esfuerzan por mantener los registros como representaciones confiables de lo que se recibió originalmente. La autenticidad se ha definido como "... la confiabilidad de un registro como registro; es decir, la calidad de un registro que es lo que pretende ser y que está libre de manipulación o corrupción". [34] La autenticidad no debe confundirse con la exactitud; [35] un archivo puede adquirir un registro inexacto y conservar su autenticidad. El contenido y el significado de ese registro inexacto permanecerán inalterados.
Se puede utilizar una combinación de políticas, procedimientos de seguridad y documentación para garantizar y proporcionar evidencia de que el significado de los registros no ha sido alterado mientras estuvieron bajo la custodia de los archivos.
Las iniciativas de preservación digital tienen como objetivo principal facilitar la toma de decisiones en el futuro. Si un archivo o biblioteca decide implementar una estrategia en particular, el contenido y los metadatos asociados deben persistir para permitir que se tomen o no medidas a discreción de la parte que controla el archivo.
Los metadatos de preservación son un elemento clave para la preservación digital e incluyen información técnica sobre objetos digitales, información sobre los componentes de un objeto digital y su entorno informático, así como información que documenta el proceso de preservación y la base de derechos subyacente. Permite a las organizaciones o individuos comprender la cadena de custodia . Preservation Metadata: Implementation Strategies (PREMIS) es el estándar de facto que define los metadatos de preservación básicos e implementables que necesitan la mayoría de los repositorios e instituciones. Incluye pautas y recomendaciones para su uso y ha desarrollado vocabularios comunitarios compartidos. [36] [37]
La comunidad archivística reconoce desde hace años los retos que supone la conservación a largo plazo de la información digital. [38] En diciembre de 1994, el Research Libraries Group (RLG) y la Commission on Preservation and Access (CPA) formaron un grupo de trabajo sobre el archivo de información digital con el objetivo principal de investigar lo que era necesario hacer para garantizar la conservación a largo plazo y el acceso continuo a los registros digitales. El informe final publicado por el grupo de trabajo (Garrett, J. y Waters, D., ed. (1996). "Preserving digital information: Report of the task force on archiving of digital information." [39] ) se convirtió en un documento fundamental en el campo de la conservación digital que ayudó a establecer conceptos, requisitos y retos clave. [38] [40]
El Grupo de Trabajo propuso el desarrollo de un sistema nacional de archivos digitales que se encargaría del almacenamiento a largo plazo y del acceso a la información digital; introdujo el concepto de repositorios digitales de confianza y definió sus funciones y responsabilidades; identificó cinco características de la integridad de la información digital (contenido, fijeza, referencia, procedencia y contexto) que posteriormente se incorporaron a una definición de Información de Descripción de Preservación en el Modelo de Referencia del Sistema Abierto de Información Archivística; y definió la migración como una función crucial de los archivos digitales. Los conceptos y recomendaciones esbozados en el informe sentaron las bases para las investigaciones y las iniciativas de preservación digital posteriores. [41] [42]
Para estandarizar la práctica de la preservación digital y proporcionar un conjunto de recomendaciones para la implementación de programas de preservación, se desarrolló el Modelo de Referencia para un Sistema Abierto de Información Archivística ( OAIS ), y se publicó en 2012. OAIS se ocupa de todos los aspectos técnicos del ciclo de vida de un objeto digital: ingesta, almacenamiento archivístico, gestión de datos, administración, acceso y planificación de la preservación. [43] El modelo también aborda cuestiones de metadatos y recomienda que se adjunten cinco tipos de metadatos a un objeto digital: información de referencia (identificación), procedencia (incluido el historial de preservación), contexto, fijeza (indicadores de autenticidad) y representación (formato, estructura de archivo y lo que "imparte significado al flujo de bits de un objeto"). [44]
En marzo de 2000, el Research Libraries Group (RLG) y el Online Computer Library Center (OCLC) iniciaron una colaboración para establecer los atributos de un repositorio digital para organizaciones de investigación, basándose en el estándar internacional emergente del Modelo de referencia para un sistema abierto de información archivística (OAIS, por sus siglas en inglés) e incorporándolo. En 2002, publicaron "Trusted Digital Repositories: Attributes and Responsibilities" (Repositorios digitales confiables: atributos y responsabilidades). En ese documento, un "repositorio digital confiable" (TDR, por sus siglas en inglés) se define como "aquel cuya misión es proporcionar acceso confiable y a largo plazo a recursos digitales administrados a su comunidad designada, ahora y en el futuro". El TDR debe incluir los siguientes siete atributos: cumplimiento del modelo de referencia para un sistema abierto de información archivística (OAIS, por sus siglas en inglés), responsabilidad administrativa, viabilidad organizacional, sostenibilidad financiera, idoneidad tecnológica y de procedimiento, seguridad del sistema y responsabilidad de procedimiento. El modelo de repositorio digital confiable describe las relaciones entre estos atributos. El informe también recomendó el desarrollo colaborativo de certificaciones de repositorios digitales, modelos para redes cooperativas y el intercambio de investigaciones e información sobre preservación digital con respecto a los derechos de propiedad intelectual. [45]
En 2004, Henry M. Gladney propuso otro enfoque para la conservación de objetos digitales que exigía la creación de "Objetos Digitales Confiables" (TDO, por sus siglas en inglés). Los TDO son objetos digitales que pueden dar testimonio de su propia autenticidad, ya que incorporan un registro que mantiene su historial de uso y cambios, lo que permite a los futuros usuarios verificar que el contenido del objeto es válido. [46]
La investigación internacional sobre registros auténticos permanentes en sistemas electrónicos (InterPARES) es una iniciativa de investigación colaborativa dirigida por la Universidad de Columbia Británica que se centra en abordar cuestiones de conservación a largo plazo de registros digitales auténticos. La investigación está siendo realizada por grupos de expertos de varias instituciones de América del Norte , Europa , Asia y Australia , con el objetivo de desarrollar teorías y metodologías que proporcionen la base para las estrategias, estándares, políticas y procedimientos necesarios para garantizar la fiabilidad, confiabilidad y precisión de los registros digitales a lo largo del tiempo. [47]
Bajo la dirección de la profesora de archivística Luciana Duranti , el proyecto comenzó en 1999 con la primera fase, InterPARES 1, que duró hasta 2001 y se centró en establecer requisitos de autenticidad de registros inactivos generados y mantenidos en grandes bases de datos y sistemas de gestión de documentos creados por agencias gubernamentales. [48] InterPARES 2 (2002-2007) se concentró en cuestiones de fiabilidad, precisión y autenticidad de los registros a lo largo de todo su ciclo de vida, y examinó los registros producidos en entornos dinámicos en el curso de actividades gubernamentales artísticas, científicas y en línea. [49] La tercera fase de cinco años (InterPARES 3) se inició en 2007. Su objetivo es utilizar el conocimiento teórico y metodológico generado por InterPARES y otros proyectos de investigación sobre conservación para desarrollar directrices, planes de acción y programas de formación sobre la conservación a largo plazo de registros auténticos para organizaciones de archivos pequeñas y medianas. [50]
El patrimonio de la sociedad se ha presentado en muchos materiales diferentes, entre ellos piedra, pergamino, bambú, seda y papel. Ahora existe una gran cantidad de información en formatos digitales, incluidos correos electrónicos, blogs, sitios web de redes sociales, sitios web de elecciones nacionales, álbumes de fotos web y sitios cuyo contenido cambia con el tiempo. [51] Con los medios digitales es más fácil crear contenido y mantenerlo actualizado, pero al mismo tiempo existen muchos desafíos en la preservación de este contenido, tanto técnicos como económicos.
A diferencia de los objetos analógicos tradicionales, como los libros o las fotografías, a los que el usuario tiene acceso directo al contenido, un objeto digital siempre necesita un entorno de software para reproducirlo. Estos entornos evolucionan y cambian constantemente a un ritmo rápido, lo que amenaza la continuidad del acceso al contenido. [52] Los medios de almacenamiento físico, los formatos de datos, el hardware y el software se vuelven obsoletos con el tiempo, lo que plantea amenazas importantes para la supervivencia del contenido. [3] Este proceso puede denominarse obsolescencia digital .
En el caso de los contenidos digitales (por ejemplo, archivos institucionales, sitios web, contenidos de audio y vídeo electrónicos, fotografías y obras de arte digitales, conjuntos de datos de investigación y datos de observación), la enorme y creciente cantidad de contenidos plantea importantes problemas de escalabilidad para los esfuerzos de preservación digital. Las tecnologías que cambian rápidamente pueden obstaculizar el trabajo y las técnicas de los conservacionistas digitales debido a máquinas o tecnologías obsoletas y anticuadas. Esto se ha convertido en un problema común y una preocupación constante para los archivistas digitales: cómo prepararse para el futuro.
El contenido digital también puede presentar desafíos para la preservación debido a su naturaleza compleja y dinámica, por ejemplo, páginas web interactivas, [53] entornos de realidad virtual y juegos , [54] objetos de aprendizaje, sitios de redes sociales. [55] En muchos casos de avances tecnológicos emergentes, existen dificultades sustanciales para mantener la autenticidad, fijeza e integridad de los objetos a lo largo del tiempo que se derivan de la cuestión fundamental de la experiencia con ese medio de almacenamiento digital en particular y, si bien ciertas tecnologías pueden resultar más sólidas en términos de capacidad de almacenamiento, existen problemas para asegurar un marco de medidas para garantizar que el objeto permanezca fijo mientras está bajo custodia. [2] [56]
Para la preservación de software como contenido digital, un desafío específico es la típica falta de disponibilidad del código fuente , ya que el software comercial normalmente se distribuye solo en forma binaria compilada . Sin el código fuente, una adaptación ( portación ) en hardware informático o sistemas operativos modernos es casi siempre imposible, por lo que es necesario emular el contexto de hardware y software original . Otro desafío potencial para la preservación de software puede ser el copyright , que a menudo prohíbe eludir los mecanismos de protección de copia ( Digital Millennium Copyright Act ) en caso de que el software se haya convertido en una obra huérfana ( Abandonware ). En 2003 se aprobó una exención de la Digital Millennium Copyright Act de los Estados Unidos para permitir eludir la protección de copia por un período de 3 años para el Internet Archive , que creó un archivo de "software antiguo", como una forma de preservarlos. [57] [58] La exención se renovó en 2006 y, a partir del 27 de octubre de 2009 , se ha extendido indefinidamente en espera de nuevas reglamentaciones [59] "con el propósito de la preservación o reproducción de archivo de obras digitales publicadas por una biblioteca o archivo". [60] El Programa de Archivo de GitHub ha almacenado todo el código fuente abierto de GitHub en una bóveda segura en Svalbard , en la isla noruega congelada de Spitsbergen , como parte del Archivo Mundial del Ártico , con el código almacenado como códigos QR . [61][actualizar]
Otro desafío que rodea la preservación de contenido digital reside en la cuestión de la escala. La cantidad de información digital que se crea junto con la "proliferación de tipos de formato" [2] hace que la creación de repositorios digitales confiables con recursos adecuados y sostenibles sea un desafío. La Web es solo un ejemplo de lo que podría considerarse el "diluvio de datos". [2] Por ejemplo, la Biblioteca del Congreso acumuló actualmente 170 mil millones de tweets entre 2006 y 2010, lo que suma un total de 133,2 terabytes [62] [63] y cada Tweet está compuesto de 50 campos de metadatos. [64]
Los desafíos económicos que plantea la preservación digital también son grandes. Los programas de preservación requieren una importante inversión inicial para su creación, además de costos constantes de ingesta, gestión y almacenamiento de datos, y de personal. Uno de los desafíos estratégicos clave para estos programas es el hecho de que, si bien requieren una importante financiación actual y continua, sus beneficios se acumulan en gran medida para las generaciones futuras. [65]
Los distintos niveles de seguridad pueden representarse como tres capas: la capa "caliente" ( repositorios en línea accesibles ) y la capa "tibia" (por ejemplo, Internet Archive ), ambas tienen la debilidad de estar basadas en la electrónica ; ambas desaparecerían en una repetición de la poderosa tormenta geomagnética del siglo XIX conocida como el " Evento Carrington ". El Archivo Mundial del Ártico, almacenado en una película especialmente desarrollada recubierta de haluro de plata con una vida útil de más de 500 años, representa una instantánea de datos más segura, con un archivado previsto en intervalos de cinco años. [61]
En 2006, el Centro de Biblioteca Informática en Línea desarrolló una estrategia de cuatro puntos para la preservación a largo plazo de objetos digitales que consistía en:
Existen varias estrategias adicionales que las personas y las organizaciones pueden utilizar para combatir activamente la pérdida de información digital.
La actualización es la transferencia de datos entre dos tipos de medios de almacenamiento iguales, de modo que no se produzcan cambios de bitrot ni alteraciones de los datos. [44] Por ejemplo, la transferencia de datos censales de un CD de conservación antiguo a uno nuevo. Esta estrategia puede tener que combinarse con la migración cuando el software o el hardware necesarios para leer los datos ya no están disponibles o no pueden comprender el formato de los datos. La actualización probablemente siempre será necesaria debido al deterioro de los medios físicos.
La migración es la transferencia de datos a entornos de sistemas más nuevos (Garrett et al., 1996). Esto puede incluir la conversión de recursos de un formato de archivo a otro (por ejemplo, conversión de Microsoft Word a PDF u OpenDocument ) o de un sistema operativo a otro (por ejemplo, Windows a Linux ) para que el recurso permanezca completamente accesible y funcional. Dos problemas importantes enfrentan la migración como un método plausible de preservación digital a largo plazo. Debido al hecho de que los objetos digitales están sujetos a un estado de cambio casi continuo, la migración puede causar problemas en relación con la autenticidad y la migración ha demostrado ser una actividad que consume mucho tiempo y es costosa para "grandes colecciones de objetos heterogéneos, que necesitarían una monitorización e intervención constantes". [2] La migración puede ser una estrategia muy útil para preservar datos almacenados en medios de almacenamiento externos (por ejemplo, CD, unidades flash USB y disquetes de 3,5"). Estos tipos de dispositivos generalmente no se recomiendan para uso a largo plazo, y los datos pueden volverse inaccesibles debido a la obsolescencia o degradación de los medios y el hardware. [67]
La creación de copias duplicadas de datos en uno o más sistemas se denomina replicación . Los datos que existen como una única copia en una única ubicación son muy vulnerables a fallos de software o hardware, alteraciones intencionadas o accidentales y catástrofes medioambientales como incendios, inundaciones, etc. Los datos digitales tienen más probabilidades de sobrevivir si se replican en varias ubicaciones. Los datos replicados pueden presentar dificultades en la actualización, la migración, el control de versiones y el control de acceso , ya que los datos se encuentran en varios lugares.
Comprender la preservación digital significa comprender cómo se produce y reproduce la información digital. Debido a que la información digital (por ejemplo, un archivo) se puede replicar exactamente hasta el nivel de bits, es posible crear copias idénticas de los datos. Los duplicados exactos permiten que los archivos y las bibliotecas administren, almacenen y brinden acceso a copias idénticas de datos en múltiples sistemas y/o entornos.
La emulación es la replicación de la funcionalidad de un sistema obsoleto. Según van der Hoeven, "la emulación no se centra en el objeto digital, sino en el entorno de hardware y software en el que se representa el objeto. Su objetivo es (re)crear el entorno en el que se creó originalmente el objeto digital". [68] Algunos ejemplos son la capacidad de replicar o imitar otro sistema operativo. [69] Algunos ejemplos incluyen emular un Atari 2600 en un sistema Windows o emular WordPerfect 1.0 en un Macintosh . Los emuladores pueden crearse para aplicaciones, sistemas operativos o plataformas de hardware. La emulación ha sido una estrategia popular para conservar la funcionalidad de los antiguos sistemas de videojuegos, como el proyecto MAME . La viabilidad de la emulación como solución general ha sido debatida en la comunidad académica. (Granger, 2000)
Raymond A. Lorie ha sugerido que se podría utilizar una computadora virtual universal (UVC) para ejecutar cualquier software en el futuro en una plataforma aún desconocida. [70] La estrategia UVC utiliza una combinación de emulación y migración. La estrategia UVC aún no ha sido ampliamente adoptada por la comunidad de preservación digital.
Jeff Rothenberg, un importante defensor de la emulación para la preservación digital en bibliotecas, trabajando en asociación con Koninklijke Bibliotheek y Nationaal Archief de los Países Bajos , desarrolló un programa de software llamado Dioscuri, un emulador modular que logra ejecutar MS-DOS, WordPerfect 5.1, juegos DOS y más. [71]
Otro ejemplo de emulación como forma de conservación digital se puede ver en el caso de la Universidad Emory y los documentos de Salman Rushdie . Rushdie donó un ordenador obsoleto a la biblioteca de la Universidad Emory , que era tan viejo que la biblioteca no podía extraer los documentos del disco duro. Para obtener los documentos, la biblioteca emuló el antiguo sistema de software y pudo sacar los documentos de su viejo ordenador. [72]
Este método sostiene que los objetos preservados deben ser autodescriptivos, virtualmente "vinculando el contenido con toda la información requerida para ser descifrado y comprendido". [2] Los archivos asociados con el objeto digital tendrían detalles de cómo interpretar ese objeto mediante el uso de "estructuras lógicas llamadas "contenedores" o "envoltorios" para proporcionar una relación entre todos los componentes de información [73] que podrían usarse en el desarrollo futuro de emuladores, visores o convertidores a través de especificaciones legibles por máquina. [74] El método de encapsulamiento se aplica generalmente a colecciones que no se utilizarán durante largos períodos de tiempo. [74]
Desarrollado por el Centro de Supercomputación de San Diego y financiado por la Administración Nacional de Archivos y Registros , este método requiere el desarrollo de una infraestructura integral y extensa que permita "la preservación de la organización de la colección, así como de los objetos que componen esa colección, mantenida en una forma independiente de la plataforma". [2] Un archivo persistente incluye tanto los datos que constituyen el objeto digital como el contexto que define la procedencia, la autenticidad y la estructura de las entidades digitales. [75] Esto permite la sustitución de componentes de hardware o software con un efecto mínimo en el sistema de preservación. Este método puede basarse en cuadrículas de datos virtuales y se asemeja al Modelo de Información OAIS (específicamente el Paquete de Información Archivística).
Los metadatos son datos en un archivo digital que incluyen información sobre la creación, derechos de acceso, restricciones, historial de conservación y gestión de derechos. [76] Los metadatos adjuntos a los archivos digitales pueden verse afectados por la obsolescencia del formato de archivo. Se considera que ASCII es el formato más duradero para los metadatos [77] porque está muy extendido, es compatible con versiones anteriores cuando se utiliza con Unicode y utiliza caracteres legibles por humanos, no códigos numéricos. Conserva la información, pero no la información de estructura en la que se presenta. Para una mayor funcionalidad, se debe utilizar SGML o XML . Ambos lenguajes de marcado se almacenan en formato ASCII, pero contienen etiquetas que denotan la estructura y el formato.
A continuación se describen algunos de los principales marcos de evaluación y certificación de repositorios de preservación digital. El Centro de Bibliotecas de Investigación de los Estados Unidos mantiene una lista más detallada. [78]
En 2007, CRL/OCLC publicó Trustworthy Repositories Audit & Certification: Criteria & Checklist ( TRAC ), un documento que permite a los repositorios digitales evaluar su capacidad para almacenar, migrar y proporcionar acceso de manera confiable a contenido digital. TRAC se basa en estándares existentes y mejores prácticas para repositorios digitales confiables e incorpora un conjunto de 84 criterios de auditoría y certificación organizados en tres secciones: Infraestructura organizacional; Gestión de objetos digitales; y Tecnologías, infraestructura técnica y seguridad. [79]
TRAC “proporciona herramientas para la auditoría, evaluación y posible certificación de repositorios digitales, establece los requisitos de documentación necesarios para la auditoría, delinea un proceso para la certificación y establece metodologías apropiadas para determinar la solidez y sostenibilidad de los repositorios digitales”. [80]
El método de auditoría de repositorios digitales basado en la evaluación de riesgos ( DRAMBORA ), introducido por el Digital Curation Centre (DCC) y DigitalPreservationEurope (DPE) en 2007, ofrece una metodología y un conjunto de herramientas para la evaluación de riesgos de los repositorios digitales. [81] La herramienta permite a los repositorios realizar la evaluación internamente (autoevaluación) o subcontratar el proceso.
El proceso DRAMBORA se organiza en seis etapas y se concentra en la definición del mandato, la caracterización de la base de activos, la identificación de los riesgos y la evaluación de la probabilidad y el impacto potencial de los riesgos en el repositorio. El auditor debe describir y documentar el papel, los objetivos, las políticas, las actividades y los activos del repositorio, a fin de identificar y evaluar los riesgos asociados con estas actividades y activos y definir medidas adecuadas para gestionarlos. [82]
El Marco Europeo para la Auditoría y Certificación de Repositorios Digitales fue definido en un memorando de entendimiento firmado en julio de 2010 entre el Comité Consultivo de Sistemas de Datos Espaciales (CCSDS), la Junta del Sello de Aprobación de Datos (DSA) y el Grupo de Trabajo "Archivos Confiables - Certificación" del Instituto Alemán de Normalización (DIN).
El marco tiene como objetivo ayudar a las organizaciones a obtener la certificación adecuada como repositorio digital confiable y establece tres niveles de evaluación cada vez más exigentes:
Una iniciativa alemana, Nestor (Red de expertos en almacenamiento a largo plazo de recursos digitales) patrocinada por el Ministerio de Educación e Investigación de Alemania , desarrolló un catálogo de criterios para repositorios digitales confiables en 2004. En 2008 se publicó la segunda versión del documento. El catálogo, dirigido principalmente a las instituciones de educación superior y patrimonio cultural alemanas, establece pautas para la planificación, implementación y autoevaluación de repositorios digitales confiables a largo plazo. [84]
El catálogo de criterios de Nestor se ajusta a la terminología del modelo de referencia OAIS y consta de tres secciones que cubren temas relacionados con el marco organizacional, la gestión de objetos y la infraestructura y seguridad. [85]
En 2002, el proyecto Preservation and Long-term Access through Networked Services (PLANETS), parte de los Programas Marco de Investigación y Desarrollo Tecnológico de la UE 6, abordó los principales desafíos de la preservación digital. El objetivo principal de Planets era crear servicios y herramientas prácticas para ayudar a garantizar el acceso a largo plazo a los activos culturales y científicos digitales. El proyecto Open Planets finalizó el 31 de mayo de 2010. [86] Los resultados del proyecto ahora son mantenidos por la organización que lo siguió, la Open Planets Foundation. [86] [87] El 7 de octubre de 2014, la Open Planets Foundation anunció que cambiaría su nombre a Open Preservation Foundation para alinearse con la dirección actual de la organización. [88]
La herramienta de planificación para repositorios electrónicos de confianza (PLATTER) es una herramienta lanzada por DigitalPreservationEurope (DPE) para ayudar a los repositorios digitales a identificar sus objetivos y prioridades autodefinidos con el fin de ganar la confianza de las partes interesadas. [89]
PLATTER está pensado para ser utilizado como una herramienta complementaria a DRAMBORA, NESTOR y TRAC. Se basa en diez principios básicos para repositorios confiables y define nueve Planes de Objetivos Estratégicos, que cubren áreas como adquisición, preservación y difusión de contenido, finanzas, personal, planificación de sucesión, infraestructura técnica, especificaciones de datos y metadatos y planificación ante desastres. La herramienta permite a los repositorios desarrollar y mantener la documentación requerida para una auditoría. [90]
El Comité Consultivo de Sistemas de Datos Espaciales (CCSDS) desarrolló un sistema para la "auditoría y certificación de repositorios digitales confiables" y lo publicó como norma ISO 16363 el 15 de febrero de 2012. [91] La norma, que amplía el modelo de referencia OAIS y se basa en gran medida en la lista de verificación TRAC, fue diseñada para todos los tipos de repositorios digitales. Proporciona una especificación detallada de los criterios con los que se puede evaluar la confiabilidad de un repositorio digital. [92]
El Grupo de Trabajo de Certificación y Auditoría de Repositorios del CCSDS también desarrolló y presentó una segunda norma, que define los requisitos operativos para las organizaciones que pretenden proporcionar auditoría y certificación de repositorios según lo especificado en la norma ISO 16363. [93] Esta norma se publicó como ISO 16919 – "requisitos para organismos que proporcionan auditoría y certificación de repositorios digitales candidatos confiables" – el 1 de noviembre de 2014. [94]
Aunque las estrategias de conservación varían según los distintos tipos de materiales y entre instituciones, la adhesión a las normas y prácticas reconocidas a nivel nacional e internacional es una parte crucial de las actividades de conservación digital. Las mejores prácticas o prácticas recomendadas definen estrategias y procedimientos que pueden ayudar a las organizaciones a implementar las normas existentes o brindar orientación en áreas en las que no se han desarrollado normas formales. [95]
Las mejores prácticas en materia de conservación digital siguen evolucionando y pueden abarcar procesos que se llevan a cabo en el contenido antes o en el momento de la ingesta en un repositorio digital, así como procesos que se llevan a cabo en archivos preservados después de la ingesta a lo largo del tiempo. Las mejores prácticas también pueden aplicarse al proceso de digitalización de material analógico y pueden incluir la creación de metadatos especializados (como metadatos técnicos, administrativos y de derechos) además de metadatos descriptivos estándar. La conservación de contenido digital nativo puede incluir transformaciones de formato para facilitar la conservación a largo plazo o para proporcionar un mejor acceso. [96]
Ninguna institución puede permitirse el lujo de desarrollar todas las herramientas de software necesarias para garantizar la accesibilidad de los materiales digitales a largo plazo. De ahí el problema de mantener un repositorio de herramientas compartidas. La Biblioteca del Congreso ha estado haciendo eso durante años, [97] hasta que esa función fue asumida por el Registro de Herramientas de Preservación Digital de Propiedad Comunitaria. [98]
Se han desarrollado diversas prácticas recomendadas y directrices para la conservación de audio digital, entre ellas:
La Audio Engineering Society (AES) también emite una variedad de estándares y pautas relacionadas con la creación de contenido de audio de archivo y metadatos técnicos. [104]
El término "imágenes en movimiento" incluye películas y vídeos analógicos y sus formatos digitales originales: vídeo digital, material cinematográfico digital y cine digital. A medida que las cintas de vídeo y las películas analógicas se vuelven obsoletas, la digitalización se ha convertido en una estrategia de conservación clave, aunque muchos archivos siguen realizando la conservación fotoquímica de las películas. [105] [106]
La "preservación digital" tiene un doble significado para las colecciones audiovisuales: los originales analógicos se preservan mediante reformateo digital, y los archivos digitales resultantes se conservan; y el contenido nativo digital se recopila, generalmente en formatos propietarios que plantean problemas para la preservación digital futura.
En la actualidad, no existe un formato estándar de preservación digital ampliamente aceptado para imágenes analógicas en movimiento. [107] La complejidad del video digital, así como las distintas necesidades y capacidades de una institución archivística, son razones por las que no existe un formato estándar "universal" para la preservación a largo plazo de videos digitales, como sí lo hay para otros tipos de registros digitales (por ejemplo, procesamiento de textos convertido a PDF/A o TIFF para imágenes)". [108] [109]
Las bibliotecas y las instituciones de archivo, como la Biblioteca del Congreso y la Universidad de Nueva York , han hecho esfuerzos significativos para preservar las imágenes en movimiento; sin embargo, todavía no se ha materializado un movimiento nacional para preservar el video". [110] La preservación de materiales audiovisuales "requiere mucho más que simplemente poner objetos en almacenamiento en frío". [110] Los medios de imágenes en movimiento deben proyectarse y reproducirse, moverse y mostrarse. Los materiales nacidos en formato digital requieren un enfoque similar". [110]
Los siguientes recursos ofrecen información sobre el reformateo de analógico a digital y la conservación de contenido audiovisual nativo digital.
Las imágenes en movimiento requieren un códec para el proceso de decodificación; por lo tanto, determinar un códec es esencial para la preservación digital. [116] [117] En "A Primer on Codecs for Moving Image and Sound Archives: 10 Recommendations for Codec Selection and Management" escrito por Chris Lacinak y publicado por AudioVisual Preservation Solutions, Lacinak enfatiza la importancia de que los archivistas elijan el códec correcto ya que esto puede "afectar la capacidad de preservar el objeto digital". [117] [116] Por lo tanto, el proceso de selección del códec es crítico, "ya sea que se trate de contenido digital nativo , reformateando contenido antiguo o convirtiendo materiales analógicos". [117] [116] Las diez recomendaciones de Lacinak para la selección y gestión de códecs son las siguientes: adopción, divulgación, transparencia, dependencias externas, documentación y metadatos, planificación previa, mantenimiento, monitoreo de obsolescencia, mantenimiento del original y evitar la transcodificación o recodificación innecesaria. [117] [116] Hasta la fecha, no hay consenso entre la comunidad de archivos sobre qué códec estándar se debe utilizar para la digitalización de vídeo analógico y la preservación a largo plazo del vídeo digital, ni existe un único códec "correcto" para un objeto digital; cada institución de archivo debe "tomar la decisión como parte de una estrategia de preservación general". [117] [118] [109] [116]
También se requiere un formato contenedor o envoltorio digital para imágenes en movimiento y debe elegirse con cuidado, al igual que el códec. [118] Según una encuesta internacional realizada en 2010 a más de 50 instituciones involucradas con el reformateo de películas y videos, "las tres opciones principales para productos de conservación fueron AVI , QuickTime (.MOV) o MXF (Material Exchange Format)". [119] Estos son solo algunos ejemplos de contenedores. La Administración Nacional de Archivos y Registros (NARA) ha elegido el envoltorio AVI como su formato contenedor estándar por varias razones, incluido el hecho de que los archivos AVI son compatibles con numerosas herramientas de código abierto como VLC . [119]
La incertidumbre sobre qué formatos se volverán obsoletos o se convertirán en el estándar futuro hace que sea difícil comprometerse con un códec y un contenedor". [109] La elección de un formato debería "ser un compromiso que garantice los mejores requisitos de calidad y la sostenibilidad a largo plazo". [109]
Al considerar los siguientes pasos, los creadores de contenido y archivistas pueden garantizar una mejor accesibilidad y conservación de las imágenes en movimiento a largo plazo:
El correo electrónico plantea desafíos especiales para su conservación: el software de los clientes de correo electrónico varía ampliamente; no existe una estructura común para los mensajes de correo electrónico; el correo electrónico a menudo comunica información confidencial; las cuentas de correo electrónico individuales pueden contener mensajes comerciales y personales entremezclados; y el correo electrónico puede incluir documentos adjuntos en una variedad de formatos de archivo. Los mensajes de correo electrónico también pueden contener virus o tener contenido de spam. Si bien la transmisión de correo electrónico está estandarizada, no existe un estándar formal para la conservación a largo plazo de los mensajes de correo electrónico. [121]
Los enfoques para la conservación del correo electrónico pueden variar según el propósito para el cual se preserva. En el caso de las empresas y las entidades gubernamentales, la conservación del correo electrónico puede estar impulsada por la necesidad de cumplir con los requisitos de retención y supervisión para el cumplimiento normativo y permitir el descubrimiento legal. (Se puede encontrar información adicional sobre los enfoques de archivado de correo electrónico para fines comerciales e institucionales en el artículo separado, Archivado de correo electrónico ). En el caso de las bibliotecas de investigación y los archivos, la conservación del correo electrónico que forma parte de colecciones de archivo híbridas o digitales tiene como objetivo garantizar su disponibilidad a largo plazo como parte del registro histórico y cultural. [122]
Se han llevado a cabo varios proyectos de desarrollo de herramientas y metodologías para la conservación de correo electrónico basados en diversas estrategias de conservación: normalización del correo electrónico al formato XML, migración del correo electrónico a una nueva versión del software y emulación de entornos de correo electrónico: Memories Using Email (MUSE), Collaborative Electronic Records Project (CERP), E-Mail Collection And Preservation (EMCAP), PeDALS Email Extractor Software (PeDALS), XML Electronic Normalizing of Archives tool (XENA).
En los siguientes recursos se pueden encontrar algunas prácticas recomendadas y pautas para la conservación del correo electrónico:
En 2007, el proyecto Keeping Emulation Environments Portable (KEEP), parte de los Programas Marco de Investigación y Desarrollo Tecnológico de la UE 7, desarrolló herramientas y metodologías para mantener los objetos de software digital disponibles en su contexto original. Los objetos de software digital como los videojuegos pueden perderse debido a la obsolescencia digital y la falta de disponibilidad del hardware heredado o el software del sistema operativo requerido; este tipo de software se conoce como abandonware . Debido a que el código fuente a menudo ya no está disponible, [54] la emulación es la única oportunidad de conservación. KEEP proporcionó un marco de emulación para ayudar a la creación de dichos emuladores. KEEP fue desarrollado por Vincent Joguin, lanzado por primera vez en febrero de 2009 y fue coordinado por Elisabeth Freyre de la Biblioteca Nacional Francesa . [125]
Un proyecto comunitario, MAME , tiene como objetivo emular cualquier juego de computadora histórico, incluidos juegos de arcade, juegos de consola y similares, a nivel de hardware, para su archivo futuro.
En enero de 2012, el proyecto POCOS financiado por JISC organizó un taller sobre la preservación de entornos de juego y mundos virtuales. [126]
Hay muchas cosas que los consumidores y artistas pueden hacer ellos mismos para ayudar a cuidar sus colecciones en casa.
La Biblioteca del Congreso también cuenta con una lista para autoconservadores que incluye orientación sobre programas y pautas de otras instituciones que ayudarán al usuario a preservar las redes sociales, el correo electrónico y pautas generales de formato (como el cuidado de los CD). [128] Algunos de los programas enumerados incluyen:
En 2020, los investigadores informaron en una preimpresión que encontraron "176 revistas de acceso abierto que, por falta de archivos completos y abiertos, desaparecieron de la Web entre 2000 y 2019, abarcando todas las principales disciplinas de investigación y regiones geográficas del mundo" y que en 2019 solo alrededor de un tercio de las 14.068 revistas indexadas en DOAJ aseguraron la preservación a largo plazo de su contenido. [130] [131] [132] Parte de la producción de investigación científica no se encuentra en el sitio web de la revista científica, sino en otros sitios como repositorios de código fuente como GitLab . El Archivo de Internet archivó muchas, pero no todas, de las publicaciones académicas perdidas y las pone a disposición en la Web. [133] Según un análisis del Archivo de Internet, "el 18 por ciento de todos los artículos de acceso abierto desde 1945, más de tres millones, no están archivados de forma independiente por nosotros u otra organización de preservación, aparte de los propios editores". [133] Sci-Hub realiza archivos académicos fuera de los límites de la ley de derechos de autor contemporánea y también proporciona acceso a trabajos académicos que no tienen una licencia de acceso abierto. [133]
"La creación de un modelo 3D de un edificio histórico requiere mucho esfuerzo." [134] Los recientes avances en tecnología han llevado al desarrollo de edificios renderizados en 3D en el espacio virtual. Tradicionalmente, los edificios de los videojuegos tenían que ser renderizados mediante código, y muchos estudios de juegos han realizado renderizados muy detallados (véase Assassin's Creed ). Pero debido a que la mayoría de los conservacionistas no son equipos de codificadores profesionales muy capaces, las universidades han comenzado a desarrollar métodos mediante escaneo láser 3D. Tal trabajo fue intentado por la Universidad Nacional de Ciencia y Tecnología de Taiwán en 2009. Su objetivo era "construir modelos informáticos 3D tal como fueron construidos de un edificio histórico, la Casa Don Nan-Kuan, para satisfacer la necesidad de preservación digital". [135] Con un éxito bastante grande, fueron capaces de escanear la Casa Don Nan-Kuan con voluminosas cámaras de 10 kg (22 libras) y con solo pequeños retoques donde los escáneres no eran lo suficientemente detallados. Más recientemente, en 2018, en Calw , Alemania, un equipo realizó un escaneo de la histórica Iglesia de San Pedro y San Pablo recopilando datos mediante escaneo láser y fotogrametría. "La torre de la iglesia actual tiene unos 64 m de altura, y su estilo arquitectónico es neogótico de finales del siglo XIX. Esta iglesia cuenta con una nave principal, un coro y dos naves laterales en cada lado con tribunas en altura. La iglesia muestra una rica historia, que es visible en los diferentes elementos y estilos arquitectónicos utilizados. Dos pequeñas ventanas entre el coro y la torre son las partes más antiguas conservadas, que datan del siglo XIII. La iglesia fue reconstruida y ampliada durante los siglos XVI (ampliación de la nave) y XVII (construcción de tribunas), después de la destrucción causada por la Guerra de los Treinta Años (1618-1648). Sin embargo, la iglesia fue nuevamente incendiada por el ejército francés al mando del general Mélac a finales del siglo XVII. El órgano y el púlpito actuales se conservan de esta época. A finales del siglo XIX, la iglesia fue reconstruida y la antigua cúpula Welsch fue sustituida por la actual torre neogótica. Otras obras de este período son la parte superior del púlpito, el asientos del coro y la caja del órgano. Las vidrieras del coro son de finales del siglo XIX y principios del XX, mientras que algunas de las ventanas de la nave son de mediados del siglo XX. Una vez finalizada la Segunda Guerra Mundial, algunos elementos neogóticos fueron reemplazados por elementos góticos puros, como el altar de la iglesia y algunos dibujos en las paredes y los techos". [136] Con tanta variación arquitectónica, se presentó un desafío y una oportunidad de combinar diferentes tecnologías en un espacio grande con el objetivo de lograr una alta resolución. Los resultados fueron bastante buenos y están disponibles para ver en línea.
El Programa de Educación y Difusión sobre Preservación Digital (DPOE, por sus siglas en inglés), como parte de la Biblioteca del Congreso, sirve para fomentar la preservación de contenido digital a través de una red colaborativa de instructores y profesionales de la gestión de colecciones que trabajan en instituciones de patrimonio cultural. Compuesto por el personal de la Biblioteca del Congreso, la Red Nacional de Instructores, el Comité Directivo del DPOE y una comunidad de Defensores de la Educación sobre Preservación Digital, a partir de 2013 el DPOE tiene 24 instructores en activo en las seis regiones de los Estados Unidos. [137] En 2010 el DPOE realizó una evaluación, contactando a archivistas, bibliotecarios y otros profesionales de la información en todo el país. Un grupo de trabajo de instructores del DPOE desarrolló entonces un plan de estudios [138] basado en los resultados de la evaluación y otros planes de estudios similares sobre preservación digital diseñados por otros programas de capacitación, como LYRASIS , Educopia Institute, MetaArchive Cooperative, University of North Carolina , DigCCurr (Digital Curriculum) y Cornell University -ICPSR Digital Preservation Management Workshops. Los principios básicos resultantes también se basan en los principios esbozados en "Un marco de orientación para la creación de buenas colecciones digitales" de la Organización Nacional de Normas de Información (NISO). [139]
En Europa, la Humboldt-Universität zu Berlin y el King's College de Londres ofrecen un programa conjunto en Curación Digital Archivado el 26 de diciembre de 2015 en Wayback Machine que pone énfasis tanto en las humanidades digitales como en las tecnologías necesarias para la conservación a largo plazo. El Máster en Gestión y Preservación de la Información (Digital) que ofrece el HATII en la Universidad de Glasgow se imparte desde 2005 y es el programa pionero en este campo.
Se han desarrollado varios productos de código abierto para ayudar con la preservación digital, entre ellos Archivematica, DSpace , Fedora Commons , OPUS , SobekCM y EPrints . El sector comercial también ofrece herramientas de software de preservación digital, como Rosetta de Ex Libris Ltd. , Cloud, Standard y Enterprise Editions de Preservica, CONTENTdm, Digital Commons, Equella, intraLibrary, Open Repository y Vital. [140]
Muchas bibliotecas y archivos de investigación han iniciado o están a punto de iniciar iniciativas de preservación digital a gran escala (LSDI, por sus siglas en inglés). Los principales actores de las LSDI son instituciones culturales, empresas comerciales como Google y Microsoft, y grupos sin fines de lucro como la Open Content Alliance (OCA), el Million Book Project (MBP) y HathiTrust . La motivación principal de estos grupos es ampliar el acceso a los recursos académicos.
Aproximadamente 30 entidades culturales, incluido el Comité de Cooperación Institucional (CIC), integrado por 12 miembros , han firmado acuerdos de digitalización con Google o Microsoft. Varias de estas entidades culturales participan en la Open Content Alliance y en el Million Book Project. Algunas bibliotecas participan en una sola iniciativa y otras han diversificado sus estrategias de digitalización mediante la participación en múltiples iniciativas. Las tres razones principales para la participación de las bibliotecas en las LSDI son: acceso, preservación e investigación y desarrollo. Se espera que la preservación digital garantice que los materiales de las bibliotecas sigan siendo accesibles para las generaciones futuras. Las bibliotecas tienen la responsabilidad de garantizar el acceso perpetuo a sus materiales y el compromiso de archivar sus materiales digitales. Las bibliotecas planean utilizar copias digitalizadas como respaldo de las obras en caso de que se agoten, se deterioren o se pierdan y dañen.
El Archivo Mundial del Ártico es una instalación para la preservación de datos históricos y culturales de varios países, incluido el código fuente abierto . [61]
La preservación digital se refiere a la serie de actividades gestionadas necesarias para garantizar el acceso continuo a la información digital durante el tiempo que sea necesario.
La existencia de tecnología en decadencia, desorganización y almacenamiento deficiente podría, en teoría, hacer que un videojuego se duerma de forma permanente, para no volver a jugarse nunca más. A lo largo de los años han surgido confesiones preocupantes sobre la preservación de videojuegos. Cuando se plantean preguntas sobre relanzamientos de ciertos títulos de juegos durante las entrevistas con los desarrolladores, por ejemplo, estos revelan problemas de pérdida o destrucción del material de producción del juego. Ciertos títulos de juegos no pudieron volver a publicarse debido a varios problemas. Comenzó a circular una historia sobre la pérdida total del código fuente de un conocido juego de rol, lo que impidió su relanzamiento en una nueva consola.
Programas informáticos y videojuegos distribuidos en formatos que se han vuelto obsoletos y que requieren el medio o hardware original como condición de acceso, cuando la elusión se lleva a cabo con el propósito de conservación o reproducción de archivo de obras digitales publicadas por una biblioteca o archivo. Un formato se considerará obsoleto si la máquina o el sistema necesario para hacer perceptible una obra almacenada en ese formato ya no se fabrica o ya no está razonablemente disponible en el mercado comercial.
{{cite book}}
: Mantenimiento de CS1: falta la ubicación del editor ( enlace )