Una biblioteca digital (también llamada biblioteca en línea , biblioteca de Internet , repositorio digital , biblioteca sin paredes o colección digital ) es una base de datos en línea de objetos digitales que puede incluir texto, imágenes fijas, audio, video, documentos digitales u otros formatos de medios digitales o una biblioteca accesible a través de Internet . Los objetos pueden consistir en contenido digitalizado como impresiones o fotografías , así como contenido digital producido originalmente como archivos de procesador de textos o publicaciones en redes sociales . Además de almacenar contenido, las bibliotecas digitales proporcionan medios para organizar, buscar y recuperar el contenido incluido en la colección. Las bibliotecas digitales pueden variar enormemente en tamaño y alcance, y pueden ser mantenidas por individuos u organizaciones. [1] El contenido digital puede almacenarse localmente o accederse de forma remota a través de redes informáticas. Estos sistemas de recuperación de información pueden intercambiar información entre sí a través de la interoperabilidad y la sostenibilidad . [2]
La historia temprana de las bibliotecas digitales no está bien documentada, pero varios pensadores clave están conectados con el surgimiento del concepto. [3] Los predecesores incluyen a Paul Otlet y Mundaneum de Henri La Fontaine , un intento iniciado en 1895 para recopilar y catalogar sistemáticamente el conocimiento del mundo, con la esperanza de lograr la paz mundial. [4] Las visiones de la biblioteca digital se hicieron realidad en gran medida un siglo después durante la gran expansión de Internet. [5]
Vannevar Bush y JCR Licklider son dos colaboradores que hicieron avanzar esta idea hasta convertirla en la tecnología actual. Bush había apoyado la investigación que condujo a la bomba que se lanzó sobre Hiroshima . Después de ver el desastre, quiso crear una máquina que mostrara cómo la tecnología puede conducir a la comprensión en lugar de la destrucción. Esta máquina incluiría un escritorio con dos pantallas, interruptores y botones, y un teclado. [6] Lo llamó " Memex ". De esta manera, las personas podrían acceder a libros y archivos almacenados a gran velocidad. En 1956, la Fundación Ford financió a Licklider para analizar cómo se podían mejorar las bibliotecas con la tecnología. Casi una década después, su libro titulado " Bibliotecas del futuro " incluyó su visión. Quería crear un sistema que utilizaría computadoras y redes para que el conocimiento humano fuera accesible para las necesidades humanas y la retroalimentación fuera automática para los propósitos de las máquinas. Este sistema contenía tres componentes, el corpus de conocimiento, la pregunta y la respuesta. Licklider lo llamó un sistema procognitivo.
En 1980, el papel de la biblioteca en una sociedad electrónica fue el tema central de una clínica sobre aplicaciones bibliotecarias del procesamiento de datos . Entre los participantes se encontraban Frederick Wilfrid Lancaster , Derek De Solla Price , Gerard Salton y Michael Gorman . [7]
Los primeros proyectos se centraron en la creación de un catálogo electrónico de tarjetas conocido como Catálogo de Acceso Público en Línea (OPAC). En la década de 1980, el éxito de estos esfuerzos hizo que el OPAC sustituyera al catálogo de tarjetas tradicional en muchas bibliotecas académicas, públicas y especiales. Esto permitió a las bibliotecas emprender esfuerzos cooperativos adicionales y gratificantes para apoyar el intercambio de recursos y ampliar el acceso a los materiales de la biblioteca más allá de una biblioteca individual.
Un ejemplo temprano de una biblioteca digital es el Centro de Información de Recursos Educativos (ERIC), una base de datos de citas, resúmenes y textos educativos que se creó en 1964 y se puso a disposición en línea a través de DIALOG en 1969. [8]
En 1994, las bibliotecas digitales se hicieron ampliamente visibles en la comunidad de investigación debido a un programa administrado por la NSF de $ 24,4 millones apoyado conjuntamente por el programa de Integración Inteligente de Información (I3) de DARPA , la NASA y la propia NSF. [9] Las propuestas de investigación exitosas vinieron de seis universidades estadounidenses. [10] Las universidades incluyeron la Universidad Carnegie Mellon , la Universidad de California-Berkeley , la Universidad de Michigan , la Universidad de Illinois , la Universidad de California-Santa Bárbara y la Universidad de Stanford . Los artículos de los proyectos resumieron su progreso en su punto medio en mayo de 1996. [11] La investigación de Stanford, por Sergey Brin y Larry Page , condujo a la fundación de Google .
Los primeros intentos de crear un modelo para bibliotecas digitales incluyeron el Modelo de Referencia de Biblioteca Digital DELOS [12] [13] y el Marco 5S. [14] [15]
El término biblioteca digital fue popularizado por primera vez por la Iniciativa de Bibliotecas Digitales NSF / DARPA / NASA en 1994. [16] Con la disponibilidad de las redes informáticas, se espera que los recursos de información permanezcan distribuidos y se pueda acceder a ellos según sea necesario, mientras que en el ensayo de Vannevar Bush As We May Think (1945) debían recopilarse y mantenerse dentro del Memex del investigador .
El término biblioteca virtual se utilizó inicialmente de forma intercambiable con biblioteca digital, pero ahora se utiliza principalmente para bibliotecas que son virtuales en otros sentidos (como bibliotecas que agregan contenido distribuido). En los primeros días de las bibliotecas digitales, se discutió sobre las similitudes y diferencias entre los términos digital , virtual y electrónico . [17]
A menudo se hace una distinción entre el contenido creado en formato digital, conocido como " originalmente digital" , y la información que se ha convertido a partir de un medio físico, por ejemplo, el papel, mediante la digitalización . No todo el contenido electrónico está en formato de datos digitales . El término biblioteca híbrida se utiliza a veces para las bibliotecas que tienen tanto colecciones físicas como colecciones electrónicas. Por ejemplo, American Memory es una biblioteca digital dentro de la Biblioteca del Congreso .
Algunas bibliotecas digitales importantes también sirven como archivos a largo plazo, como arXiv e Internet Archive . Otras, como la Biblioteca Pública Digital de Estados Unidos , buscan hacer que la información digital de varias instituciones sea ampliamente accesible en línea. [18]
Muchas bibliotecas académicas participan activamente en la creación de repositorios de libros, artículos, tesis y otras obras de su institución que se pueden digitalizar o que "nacieron digitales". Muchos de estos repositorios están disponibles para el público en general con pocas restricciones, de acuerdo con los objetivos del acceso abierto , en contraste con la publicación de investigaciones en revistas comerciales, donde los editores generalmente limitan los derechos de acceso. Independientemente de los derechos de acceso, los repositorios institucionales, verdaderamente libres y corporativos pueden denominarse bibliotecas digitales. El software de repositorio institucional está diseñado para archivar, organizar y buscar el contenido de una biblioteca. Las soluciones de código abierto populares incluyen DSpace , Greenstone Digital Library (GSDL) , EPrints , Digital Commons y los sistemas basados en Fedora Commons Islandora y Samvera . [19]
El depósito legal suele estar regulado por la legislación sobre derechos de autor y, en ocasiones, por leyes específicas sobre depósito legal, y exige que una o más copias de todo el material publicado en un país se envíen para su conservación a una institución, normalmente la biblioteca nacional . Desde la aparición de los documentos electrónicos , ha habido que modificar la legislación para abarcar los nuevos formatos, como la modificación de 2016 de la Ley de Derechos de Autor de 1968 en Australia. [20] [21] [22]
Desde entonces se han creado varios tipos de depósitos electrónicos. El portal de envío de material por parte de los editores de la Biblioteca Británica y el modelo alemán de la Deutsche Nationalbibliothek tienen un punto de depósito para una red de bibliotecas, pero el acceso público sólo está disponible en las salas de lectura de las bibliotecas. El sistema de depósito electrónico nacional australiano tiene las mismas características, pero también permite el acceso remoto por parte del público en general a la mayor parte del contenido. [23]
Los archivos físicos se diferencian de las bibliotecas físicas en varios aspectos. Tradicionalmente, los archivos se definen como:
La tecnología utilizada para crear bibliotecas digitales es aún más revolucionaria para los archivos, ya que rompe con la segunda y la tercera de estas reglas generales. En otras palabras, los "archivos digitales" o "archivos en línea" seguirán conteniendo por lo general fuentes primarias, pero es probable que se describan de forma individual en lugar de (o además de) grupos o colecciones. Además, debido a que son digitales, sus contenidos son fácilmente reproducibles y, de hecho, pueden haber sido reproducidos desde otro lugar. El Oxford Text Archive se considera generalmente el archivo digital más antiguo de materiales académicos físicos de fuentes primarias.
Los archivos difieren de las bibliotecas en la naturaleza de los materiales que conservan. Las bibliotecas coleccionan libros y publicaciones periódicas individuales, o conjuntos encuadernados de ejemplares individuales. Los libros y revistas que conservan las bibliotecas no son únicos, ya que existen múltiples copias y cualquier copia dada generalmente resultará tan satisfactoria como cualquier otra copia. El material de los archivos y bibliotecas de manuscritos son "los registros únicos de entidades corporativas y los documentos de individuos y familias". [24]
Una característica fundamental de los archivos es que deben conservar el contexto en el que se han creado sus documentos y la red de relaciones entre ellos para preservar su contenido informativo y proporcionar información comprensible y útil a lo largo del tiempo. La característica fundamental de los archivos reside en su organización jerárquica expresando el contexto mediante el vínculo archivístico .
Las descripciones archivísticas son el medio fundamental para describir, comprender, recuperar y acceder a material archivístico. A nivel digital, las descripciones archivísticas suelen estar codificadas mediante el formato XML Encoded Archival Description . El EAD es una representación electrónica estandarizada de la descripción archivística que permite proporcionar acceso colectivo a descripciones y recursos archivísticos detallados en repositorios distribuidos por todo el mundo.
Dada la importancia de los archivos, se ha definido un modelo formal dedicado, llamado NEsted SeTs for Object Hierarchies (NESTOR), [25] construido alrededor de sus constituyentes peculiares. NESTOR se basa en la idea de expresar las relaciones jerárquicas entre objetos a través de la propiedad de inclusión entre conjuntos, en contraste con la relación binaria entre nodos explotada por el árbol. NESTOR se ha utilizado para extender formalmente el modelo 5S para definir un archivo digital como un caso específico de biblioteca digital capaz de tomar en consideración las características peculiares de los archivos.
Una biblioteca de diseño asistido por computadora o biblioteca CAD es un repositorio basado en la nube de modelos 3D o piezas para diseño asistido por computadora (CAD), ingeniería asistida por computadora (CAE), fabricación asistida por computadora (CAM) o modelado de información de construcción (BIM). Ejemplos de bibliotecas CAD son GrabCAD , Sketchup 3D Warehouse , Sketchfab , McMaster-Carr , TurboSquid , Chaos Cosmos , [26] y Thingiverse . [27] [ ¿enlace spam? ] Los modelos pueden ser gratuitos y de código abierto o propietarios y hay que pagar una suscripción para tener acceso a los modelos 3D de la biblioteca CAD. Las bibliotecas CAD generativas de Ai se están desarrollando utilizando datos abiertos vinculados de esquemas y diagramas . [28]
Las bibliotecas CAD pueden tener recursos como modelos 3D , materiales/ texturas , mapas de relieve , árboles/plantas, HDRI y diferentes fuentes de iluminación de gráficos de computadora para renderizar . [29] [ ¿ enlace spam? ]
Un repositorio/biblioteca de gráficos 2D son imágenes/ iconos de gráficos vectoriales o gráficos rasterizados que pueden ser de uso libre o propietario . [30] [ enlace spam ]
Las ventajas de las bibliotecas digitales como medio para acceder fácil y rápidamente a libros, archivos e imágenes de diversos tipos son ampliamente reconocidas hoy en día tanto por los intereses comerciales como por los organismos públicos. [31]
Las bibliotecas tradicionales están limitadas por el espacio de almacenamiento; las bibliotecas digitales tienen el potencial de almacenar mucha más información, simplemente porque la información digital requiere muy poco espacio físico para contenerla. [32] Como tal, el costo de mantener una biblioteca digital puede ser mucho menor que el de una biblioteca tradicional. Una biblioteca física debe gastar grandes sumas de dinero pagando al personal, el mantenimiento de los libros, el alquiler y los libros adicionales. Las bibliotecas digitales pueden reducir o, en algunos casos, eliminar estos cargos. Ambos tipos de biblioteca requieren entrada de catalogación para permitir que los usuarios localicen y recuperen material. Las bibliotecas digitales pueden estar más dispuestas a adoptar innovaciones en tecnología que brinden a los usuarios mejoras en la tecnología de libros electrónicos y de audio, así como presentar nuevas formas de comunicación como wikis y blogs; las bibliotecas convencionales pueden considerar que brindar acceso en línea a su catálogo OP AC es suficiente. Una ventaja importante de la conversión digital es una mayor accesibilidad para los usuarios. También aumentan la disponibilidad para personas que pueden no ser usuarios tradicionales de una biblioteca, debido a la ubicación geográfica o la afiliación organizacional.
Las bibliotecas digitales ofrecen una variedad de paquetes de software, incluidos aquellos diseñados para juegos educativos para niños [34] . El software de repositorio institucional, que se centra principalmente en la ingesta, la preservación y el acceso a documentos producidos localmente, en particular los productos académicos producidos localmente, se puede encontrar en Software de repositorio institucional . Este software puede ser propietario, como es el caso de la Biblioteca del Congreso que utiliza Digiboard y CTS para gestionar el contenido digital. [35]
El diseño y la implementación de las bibliotecas digitales se construyen de modo que los sistemas informáticos y el software puedan hacer uso de la información cuando se intercambia. Estas se conocen como bibliotecas digitales semánticas. Las bibliotecas semánticas también se utilizan para socializar con diferentes comunidades de una masa de redes sociales. [36] DjDL es un tipo de biblioteca digital semántica. La búsqueda basada en palabras clave y la búsqueda semántica son los dos tipos principales de búsquedas. Se proporciona una herramienta en la búsqueda semántica que crea un grupo para la ampliación y el refinamiento de la búsqueda basada en palabras clave. El conocimiento conceptual utilizado en DjDL se centra en dos formas: la ontología temática y el conjunto de patrones de búsqueda de conceptos basados en la ontología. Los tres tipos de ontologías que se asocian a esta búsqueda son las ontologías bibliográficas , las ontologías conscientes de la comunidad y las ontologías temáticas.
En las bibliotecas tradicionales, la capacidad de encontrar obras de interés está directamente relacionada con lo bien que se hayan catalogado. Si bien catalogar obras electrónicas digitalizadas de los fondos existentes de una biblioteca puede ser tan simple como copiar o mover un registro del formato impreso al formato electrónico, las obras complejas y nativas digitales requieren un esfuerzo sustancialmente mayor. Para manejar el creciente volumen de publicaciones electrónicas, se deben diseñar nuevas herramientas y tecnologías que permitan una clasificación y búsqueda semántica automatizada eficaz. Si bien se puede utilizar la búsqueda de texto completo para algunos artículos, hay muchas búsquedas de catálogo comunes que no se pueden realizar utilizando el texto completo, entre ellas:
La mayoría de las bibliotecas digitales ofrecen una interfaz de búsqueda que permite encontrar recursos. Estos recursos suelen ser recursos de la deep web (o web invisible) ya que con frecuencia no pueden ser localizados por los rastreadores de los motores de búsqueda . Algunas bibliotecas digitales crean páginas especiales o mapas de sitios para permitir que los motores de búsqueda encuentren todos sus recursos. Las bibliotecas digitales utilizan con frecuencia el Protocolo de la Iniciativa de Archivos Abiertos para la Recolección de Metadatos (OAI-PMH) para exponer sus metadatos a otras bibliotecas digitales, y los motores de búsqueda como Google Scholar , Yahoo! y Scirus también pueden utilizar OAI-PMH para encontrar estos recursos de la deep web. [37] Al igual que con las bibliotecas físicas, se sabe relativamente poco sobre cómo los usuarios realmente seleccionan los libros. [38]
Hay dos estrategias generales para buscar en una federación de bibliotecas digitales: búsqueda distribuida y búsqueda de metadatos previamente recopilados .
La búsqueda distribuida generalmente implica que un cliente envíe múltiples solicitudes de búsqueda en paralelo a varios servidores de la federación. Se recopilan los resultados, se eliminan o agrupan los duplicados y los elementos restantes se ordenan y se presentan nuevamente al cliente. Los protocolos como Z39.50 se utilizan con frecuencia en la búsqueda distribuida. Una ventaja de este enfoque es que las tareas de indexación y almacenamiento que requieren muchos recursos se dejan en manos de los respectivos servidores de la federación. Una desventaja de este enfoque es que el mecanismo de búsqueda está limitado por las diferentes capacidades de indexación y clasificación de cada base de datos; por lo tanto, es difícil ensamblar un resultado combinado que conste de los elementos encontrados más relevantes.
La búsqueda en metadatos recopilados previamente implica buscar en un índice almacenado localmente de información que se ha recopilado previamente de las bibliotecas de la federación. Cuando se realiza una búsqueda, el mecanismo de búsqueda no necesita establecer conexiones con las bibliotecas digitales en las que está buscando, ya que tiene una representación local de la información. Este enfoque requiere la creación de un mecanismo de indexación y recopilación que funcione regularmente, que se conecte a todas las bibliotecas digitales y consulte toda la colección para descubrir recursos nuevos y actualizados. Las bibliotecas digitales utilizan con frecuencia OAI-PMH para permitir la recopilación de metadatos. Una ventaja de este enfoque es que el mecanismo de búsqueda tiene control total sobre los algoritmos de indexación y clasificación, lo que posiblemente permita obtener resultados más consistentes. Una desventaja es que los sistemas de recopilación e indexación consumen más recursos y, por lo tanto, son más caros.
La preservación digital tiene como objetivo asegurar que los medios digitales y los sistemas de información sigan siendo interpretables en el futuro indefinido. [39] Cada componente necesario de esto debe ser migrado, preservado o emulado . [40] Normalmente se emulan los niveles inferiores de los sistemas ( disquetes, por ejemplo), se preservan los flujos de bits (los archivos reales almacenados en los discos) y se emulan los sistemas operativos como una máquina virtual . Solo cuando se entiende bien el significado y el contenido de los medios digitales y los sistemas de información es posible la migración, como es el caso de los documentos de oficina. [40] [41] [42] Sin embargo, al menos una organización, el Wider Net Project, ha creado una biblioteca digital fuera de línea, el eGranary , reproduciendo materiales en un disco duro de 6 TB . En lugar de un entorno de flujo de bits, la biblioteca digital contiene un servidor proxy incorporado y un motor de búsqueda para que se pueda acceder a los materiales digitales mediante un navegador de Internet . [43] Además, los materiales no se preservan para el futuro. eGranary está diseñado para su uso en lugares o situaciones donde la conectividad a Internet es muy lenta, inexistente, poco confiable, inadecuada o demasiado cara.
En los últimos años, los procedimientos para digitalizar libros a alta velocidad y a un coste comparativamente bajo han mejorado considerablemente, con el resultado de que ahora es posible digitalizar millones de libros al año. [44] El proyecto de escaneo de libros de Google también está trabajando con bibliotecas para ofrecer libros digitalizados, avanzando en el ámbito de la digitalización de libros.
Las bibliotecas digitales se ven obstaculizadas por la legislación sobre derechos de autor porque, a diferencia de lo que ocurre con las obras impresas tradicionales, las leyes de derechos de autor digitales todavía se están formando. La republicación de material en la web por parte de las bibliotecas puede requerir el permiso de los titulares de los derechos, y existe un conflicto de intereses entre las bibliotecas y los editores, que pueden desear crear versiones en línea de su contenido adquirido con fines comerciales. En 2010, se estimó que el veintitrés por ciento de los libros existentes se crearon antes de 1923 y, por lo tanto, no estaban sujetos a derechos de autor. De los impresos después de esta fecha, solo el cinco por ciento seguían en circulación en 2010. [actualizar]Por lo tanto, aproximadamente el setenta y dos por ciento de los libros no estaban disponibles para el público. [45]
La naturaleza distribuida de los recursos digitales produce una dilución de la responsabilidad. Pueden surgir cuestiones complejas de propiedad intelectual, ya que el material digital no siempre es propiedad de una biblioteca. [46] El contenido es, en muchos casos, de dominio público o contenido autogenerado únicamente. Algunas bibliotecas digitales, como el Proyecto Gutenberg , trabajan para digitalizar obras que no están sujetas a derechos de autor y ponerlas a disposición del público de forma gratuita. Se ha realizado una estimación del número de libros distintos que todavía existen en los catálogos de bibliotecas desde el año 2000 a. C. hasta 1960. [47] [48]
Las Disposiciones sobre Uso Justo (17 USC § 107) de la Ley de Derechos de Autor de 1976 establecen pautas específicas en las circunstancias en las que las bibliotecas pueden copiar recursos digitales. Cuatro factores que constituyen un uso justo son "Propósito del uso, Naturaleza de la obra, Cantidad o sustancialidad del uso e Impacto en el mercado". [49]
Algunas bibliotecas digitales adquieren una licencia para prestar sus recursos. Esto puede implicar la restricción de prestar sólo una copia a la vez por cada licencia y aplicar un sistema de gestión de derechos digitales para este fin.
La Ley de Derechos de Autor para el Milenio Digital de 1998 fue una ley creada en los Estados Unidos para intentar abordar la introducción de obras digitales. Esta ley incorpora dos tratados del año 1996. Penaliza el intento de eludir las medidas que limitan el acceso a materiales protegidos por derechos de autor. También penaliza el acto de intentar eludir el control de acceso. [50] Esta ley proporciona una exención para bibliotecas y archivos sin fines de lucro que permite que se realicen hasta tres copias, una de las cuales puede ser digital. Sin embargo, no se puede hacer pública ni distribuir en la web. Además, permite a las bibliotecas y archivos copiar una obra si su formato se vuelve obsoleto. [50]
Los problemas de derechos de autor persisten, por lo que se han presentado propuestas que sugieren que las bibliotecas digitales queden exentas de la legislación sobre derechos de autor. Aunque esto sería muy beneficioso para el público, puede tener un efecto económico negativo y los autores pueden estar menos inclinados a crear nuevas obras. [51]
Otro problema que complica las cosas es el deseo de algunas editoriales de restringir el uso de materiales digitales, como los libros electrónicos, adquiridos por las bibliotecas. Mientras que en el caso de los libros impresos, la biblioteca es propietaria del libro hasta que ya no pueda circular, los editores quieren limitar el número de veces que se puede sacar prestado un libro electrónico antes de que la biblioteca tenga que volver a comprarlo. "[HarperCollins] empezó a conceder licencias para el uso de cada copia de libro electrónico por un máximo de 26 préstamos. Esto afecta sólo a los títulos más populares y no tiene ningún efecto práctico sobre los demás. Una vez alcanzado el límite, la biblioteca puede volver a comprar los derechos de acceso a un coste inferior al precio original". [52] Aunque desde una perspectiva editorial esto parece un buen equilibrio entre el préstamo de la biblioteca y la protección de la temida disminución de las ventas de libros, las bibliotecas no están preparadas para controlar sus colecciones como tales. Reconocen la creciente demanda de materiales digitales disponibles para los usuarios y el deseo de una biblioteca digital de ampliarse para incluir los best sellers, pero las licencias de las editoriales pueden obstaculizar el proceso.
Muchas bibliotecas digitales ofrecen sistemas de recomendación para reducir la sobrecarga de información y ayudar a sus usuarios a descubrir literatura relevante. Algunos ejemplos de bibliotecas digitales que ofrecen sistemas de recomendación son IEEE Xplore , Europeana y GESIS Sowiport . Los sistemas de recomendación funcionan principalmente en función del filtrado basado en contenido, pero también se utilizan otros enfoques, como el filtrado colaborativo y las recomendaciones basadas en citas. [53] Beel et al. informan que existen más de 90 enfoques de recomendación diferentes para bibliotecas digitales, presentados en más de 200 artículos de investigación . [53]
Normalmente, las bibliotecas digitales desarrollan y mantienen sus propios sistemas de recomendación basados en marcos de búsqueda y recomendación existentes, como Apache Lucene o Apache Mahout .
Las bibliotecas digitales, o al menos sus colecciones digitales, también han traído sus propios problemas y desafíos en áreas como:
Hay muchos proyectos de digitalización a gran escala que perpetúan estos problemas.
En Google , el Million Book Project e Internet Archive están en marcha proyectos de digitalización a gran escala . Con las mejoras continuas en las tecnologías de manejo y presentación de libros, como el reconocimiento óptico de caracteres y el desarrollo de depósitos alternativos y modelos comerciales, las bibliotecas digitales están creciendo rápidamente en popularidad. Así como las bibliotecas se han aventurado en las colecciones de audio y video, también lo han hecho las bibliotecas digitales como Internet Archive. En 2016, el proyecto Google Books recibió una victoria judicial al continuar con su proyecto de escaneo de libros que fue detenido por el Gremio de Autores. [55] Esto ayudó a abrir el camino para que las bibliotecas trabajaran con Google para llegar mejor a los usuarios que están acostumbrados a la información computarizada.
Según Larry Lannom, director de tecnología de gestión de la información en la organización sin ánimo de lucro Corporation for National Research Initiatives (CNRI), «todos los problemas asociados a las bibliotecas digitales están relacionados con el archivo». Continúa afirmando: «Si en 100 años la gente todavía puede leer tu artículo, habremos resuelto el problema». Daniel Akst, autor de The Webster Chronicle , propone que «el futuro de las bibliotecas (y de la información) es digital». Peter Lyman y Hal Variant, científicos de la información de la Universidad de California en Berkeley , estiman que «la producción anual total mundial de contenido impreso, cinematográfico, óptico y magnético requeriría aproximadamente 1.500 millones de gigabytes de almacenamiento». Por lo tanto, creen que «pronto será tecnológicamente posible que una persona promedio acceda a prácticamente toda la información registrada». [56]
Los archivos digitales son un medio en evolución y se desarrollan en diversas circunstancias. Junto con los repositorios a gran escala, también han evolucionado otros proyectos de archivo digital en respuesta a las necesidades de investigación y comunicación de la investigación en varios niveles institucionales. Por ejemplo, durante la pandemia de COVID-19 , las bibliotecas y las instituciones de educación superior han lanzado proyectos de archivo digital para documentar la vida durante la pandemia, creando así un registro cultural digital de las memorias colectivas de ese período. [57] Los investigadores también han utilizado el archivo digital para crear bases de datos de investigación especializadas . Estas bases de datos compilan registros digitales para su uso a nivel internacional e interdisciplinario. COVID CORPUS, lanzado en octubre de 2020, es un ejemplo de este tipo de base de datos, construida en respuesta a las necesidades de comunicación científica a la luz de la pandemia. [58] Más allá del ámbito académico, también se han desarrollado recientemente colecciones digitales para atraer a un público más general, como es el caso del Contenido de Audiencia General Seleccionado de Internet-First University Press desarrollado por la Universidad de Cornell. Esta base de datos para público general contiene información de investigación especializada, pero está organizada digitalmente para su accesibilidad. [59] La creación de estos archivos ha facilitado formas especializadas de mantenimiento de registros digitales para satisfacer diversos nichos en la comunicación en línea basada en la investigación.
Se trata de un campo con una prehistoria y una historia temprana increíblemente ricas y, hasta ahora, poco documentadas. Existe una corriente de trabajo e ideas que se remonta al menos a principios del siglo XX e incluye a pensadores como HG Wells y Paul Otlet; entre los contribuyentes posteriores a la prehistoria de las visiones de nuevos medios de organización, acceso y distribución del conocimiento basados en la tecnología también se incluyen Vannevar Bush y JCR Licklider.
En realidad, fue en 1895 cuando Paul Otlet, junto con Henry La Fontaine, quien más tarde recibió el Premio Nobel de la Paz, comenzaron un proyecto, Mundaneum , que fue iniciado e impulsado por su idea de que, si lograban recopilar todo el conocimiento humano y hacerlo accesible a todos en todo el mundo, entonces esto traería paz a la Tierra.
Hito 1696: DIALOG, con la base de datos ERIC, proporcionó la primera instancia de amplia disponibilidad de resúmenes en línea para resultados de búsqueda.
Número especial 14.ª Conferencia internacional sobre repositorios abiertos 2019: todas las necesidades del usuario
Cuando Google anunció en diciembre de 2004 que escanearía digitalmente los libros de cinco importantes bibliotecas de investigación para que sus contenidos pudieran buscarse, resucitó la promesa de una
biblioteca universal
. ... Desde los días de las tablillas de arcilla sumerias hasta ahora, los humanos han "publicado" al menos 32 millones de libros, 750 millones de artículos y ensayos, 25 millones de canciones, 500 millones de imágenes, 500.000 películas, 3 millones de vídeos, programas de televisión y cortometrajes y 100 mil millones de páginas web públicas.