El proyecto LOCKSS ("Lots of Copies Keep Stuff Safe"), auspiciado por la Universidad de Stanford , es una red peer-to-peer que desarrolla y respalda un sistema de código abierto que permite a las bibliotecas recopilar, preservar y proporcionar a sus lectores acceso a material publicado en la Web. Su principal objetivo es la preservación digital .
El sistema intenta replicar la forma en que las bibliotecas hacen esto con el material publicado en papel. Originalmente fue diseñado para revistas académicas, [2] pero ahora también se utiliza para una variedad de otros materiales. Algunos ejemplos incluyen el proyecto SOLINET para preservar tesis y disertaciones en ocho universidades, [3] documentos del gobierno de los EE. UU., [4] y el programa MetaArchive Cooperative para preservar colecciones de archivos digitales en riesgo, incluidas tesis y disertaciones electrónicas (ETD), periódicos, colecciones de fotografías y colecciones audiovisuales. [5] [6]
Un proyecto similar llamado CLOCKSS (Controlled LOCKSS) "es una organización sin fines de lucro, exenta de impuestos, 501(c)(3) , gobernada por una Junta Directiva compuesta por bibliotecarios y editores". [7] CLOCKSS funciona con tecnología LOCKSS. [8]
Tradicionalmente, las bibliotecas académicas han conservado los números de las revistas académicas, ya sea de forma individual o en colaboración, proporcionando a sus lectores acceso al contenido recibido incluso después de que el editor haya dejado de publicar o se haya cancelado la suscripción. [9] En la era digital, las bibliotecas a menudo se suscriben a revistas que solo están disponibles digitalmente a través de Internet . Aunque es conveniente para el acceso de los usuarios, el modelo de suscripciones digitales no permite a las bibliotecas conservar una copia de la revista. Si el editor deja de publicar, o la biblioteca cancela la suscripción, o si el sitio web del editor está fuera de servicio durante el día, el contenido que se ha pagado ya no está disponible.
El sistema LOCKSS permite a una biblioteca, con permiso del editor, recopilar, preservar y difundir entre sus usuarios una copia de los materiales a los que se ha suscrito, así como material de acceso abierto (quizás publicado bajo una licencia Creative Commons ). El sistema de cada biblioteca recopila una copia utilizando un rastreador web especializado que verifica que el editor haya otorgado el permiso adecuado. El sistema es independiente del formato y recopila cualquier formato que el editor entregue a través de HTTP . Las bibliotecas que han recopilado el mismo material cooperan en una red de igual a igual para garantizar su preservación. Los pares de la red votan sobre funciones hash criptográficas del contenido preservado y un nonce ; un par que pierde votos considera que su copia está dañada y la repara desde el editor u otros pares. [10] [11]
La licencia LOCKSS utilizada por la mayoría de las editoriales permite a los lectores de una biblioteca acceder a su propia copia, pero no permite un acceso similar a otras bibliotecas o lectores no afiliados; el sistema no admite el uso compartido de archivos . A petición, una biblioteca puede proporcionar a otra biblioteca contenido para efectuar una reparación, pero sólo si la biblioteca solicitante demostró que en el pasado tenía una buena copia votando con la mayoría. Si el navegador del lector ya no admite el formato en el que se recopiló la copia, un proceso de migración de formato puede convertirla a un formato actual. [12] Estos límites al uso que se puede hacer de las copias conservadas de material protegido por derechos de autor han sido eficaces para persuadir a los propietarios de derechos de autor a conceder el permiso necesario. [13]
El enfoque LOCKSS de recolección selectiva con permiso del editor, almacenamiento distribuido y difusión restringida contrasta, por ejemplo, con el enfoque de Internet Archive de recolección omnívora sin permiso del editor, almacenamiento centralizado y difusión sin restricciones. El sistema LOCKSS es mucho más pequeño, pero puede preservar materiales de suscripción a los que Internet Archive no tiene acceso.
Dado que cada biblioteca administra su propio par LOCKSS y mantiene su propia copia del material preservado, y dado que hay bibliotecas que lo hacen en todo el mundo (consulte la lista de bibliotecas participantes a continuación), el sistema proporciona un grado de replicación mucho mayor que el habitual en un sistema tolerante a fallas . El proceso de votación hace uso de este alto grado de replicación para eliminar la necesidad de realizar copias de seguridad en medios fuera de línea y para proporcionar defensas sólidas contra ataques destinados a corromper el contenido preservado. [14]
Además de preservar el acceso, las bibliotecas tradicionalmente han dificultado la reescritura o la supresión de material impreso. La existencia de un número indeterminado pero grande de copias idénticas en un medio algo resistente a la manipulación bajo muchas administraciones independientes significaba que los intentos de alterar o eliminar todas las copias de una obra publicada probablemente fracasarían y serían detectados. La publicación web, basada en una sola copia bajo una sola administración, no ofrece ninguna de estas salvaguardas contra la subversión. La publicación web es, por lo tanto, una herramienta adecuada para reescribir la historia. Al preservar muchas copias bajo diversas administraciones, al auditar automáticamente las copias a intervalos comparándolas entre sí (y, en el futuro, comparándolas con la copia del editor) y al alertar a las bibliotecas cuando se detectan cambios, el sistema LOCKSS intenta restablecer muchas de estas salvaguardas en el mundo digital de la publicación.
Antes de implementar un sistema LOCKSS, es necesario considerar cuidadosamente algunas cuestiones para asegurarse de que el contenido sea verificado, evaluado y auditable por los usuarios. El usuario debe hacer preguntas como "¿Cuáles son sus procedimientos?", "¿Cuáles son sus métodos?", "¿Cómo se evalúa este sistema?" y "¿Cuál es su programa de preparación para desastres?". Estas preguntas le permitirán al usuario evaluar el sistema, crear un plan de mantenimiento exitoso para sus materiales y permitir que el sistema sea reforzado por una estructura de soporte cuidadosamente evaluada.
El código fuente de todo el sistema LOCKSS tiene licencias de código abierto estilo BSD y está disponible en GitHub . [15] LOCKSS es una marca registrada de la Universidad de Stanford.
El proyecto se inspiró en gran medida en el proyecto Millennium Clock de Danny Hillis y Stewart Brand[clock].