Internet Archive es una biblioteca digital estadounidense sin fines de lucro fundada en 1996 por Brewster Kahle . [1] [2] [4] Proporciona acceso gratuito a colecciones de materiales digitalizados, incluidos sitios web , aplicaciones de software , música , materiales audiovisuales e impresos. El Archivo también aboga por una Internet libre y abierta . Al 4 de febrero de 2024 , Internet Archive tenía más de 44 millones de materiales impresos, 10,6 millones de vídeos, 1 millón de programas de software, 15 millones de archivos de audio, 4,8 millones de imágenes, 255.000 conciertos y más de 835.000 millones de páginas web en su Wayback Machine . [5] Su misión es comprometerse a proporcionar "acceso universal a todo el conocimiento". [5][actualizar]
Internet Archive permite al público cargar y descargar material digital en su grupo de datos, pero la mayor parte de sus datos los recopilan automáticamente sus rastreadores web , que trabajan para preservar la mayor cantidad posible de la web pública. Su archivo web , Wayback Machine , contiene cientos de miles de millones de capturas web. [6] [7] El Archivo también supervisa numerosos proyectos de digitalización de libros, en conjunto uno de los esfuerzos de digitalización de libros más grandes del mundo.
Brewster Kahle fundó el Archivo en mayo de 1996, casi al mismo tiempo que fundó la empresa de rastreo web con fines de lucro Alexa Internet . [8] [9] La página archivada más antigua conocida en el sitio se guardó el 10 de mayo de 1996, a las 2:42 pm UTC (7:42 am PDT ). En octubre de ese año, Internet Archive había comenzado a archivar y preservar la World Wide Web en grandes cantidades. [10] [11] [12] [13] [14] El contenido archivado estuvo más fácilmente disponible para el público en general en 2001, a través de Wayback Machine .
A finales de 1999, el Archivo amplió sus colecciones más allá del archivo web, comenzando con los Archivos Prelinger . Ahora, Internet Archive incluye textos, audio, imágenes en movimiento y software . Alberga una serie de otros proyectos: el Archivo de Imágenes de la NASA , el servicio de rastreo por contrato Archive-It y el catálogo de biblioteca editable en wiki y el sitio de información de libros Open Library . Poco después, el Archivo comenzó a trabajar para brindar servicios especializados relacionados con las necesidades de acceso a la información de las personas con discapacidad impresa; Los libros de acceso público se pusieron a disposición del público en un formato protegido del Sistema de información digital accesible (DAISY). [15]
Según su sitio web : [16]
La mayoría de las sociedades dan importancia a la preservación de los artefactos de su cultura y patrimonio. Sin tales artefactos, la civilización no tiene memoria ni mecanismo para aprender de sus éxitos y fracasos. Nuestra cultura ahora produce cada vez más artefactos en forma digital. La misión del Archivo es ayudar a preservar esos artefactos y crear una biblioteca en Internet para investigadores, historiadores y académicos.
En agosto de 2012, el Archivo anunció [17] que había agregado BitTorrent a sus opciones de descarga de archivos para más de 1,3 millones de archivos existentes y todos los archivos recién cargados. [18] [19] Este método es el medio más rápido para descargar medios del Archivo, ya que los archivos se entregan desde dos centros de datos del Archivo, además de otros clientes de torrent que han descargado y continúan entregando los archivos. [18] [20] El 6 de noviembre de 2013, la sede de Internet Archive en el distrito Richmond de San Francisco se incendió, [21] destruyendo equipos y dañando algunos apartamentos cercanos. [22] Según el Archivo, perdió un edificio lateral que albergaba uno de los 30 de sus centros de escaneo; cámaras, luces y equipos de escaneo por valor de cientos de miles de dólares; y "tal vez 20 cajas de libros y películas, algunas irreemplazables, la mayoría ya digitalizadas y otras reemplazables". [23] La organización sin fines de lucro Archive solicitó donaciones para cubrir los daños estimados en 600.000 dólares. [24]
En noviembre de 2014 se lanzó una revisión del sitio en versión beta y el diseño heredado se eliminó en marzo de 2016. [25] [26]
En noviembre de 2016, Kahle anunció que Internet Archive estaba construyendo el Internet Archive of Canada, una copia del Archivo que se ubicaría en algún lugar de Canadá . El anuncio recibió una amplia cobertura debido a la implicación de que la decisión de construir un archivo de respaldo en un país extranjero se debía a la próxima presidencia de Donald Trump . [27] [28] [29] Kahle fue citada diciendo:
El 9 de noviembre en Estados Unidos nos despertamos con una nueva administración que prometía un cambio radical. Fue un firme recordatorio de que instituciones como la nuestra, construidas para el largo plazo, deben diseñarse para el cambio. Para nosotros, significa mantener nuestros materiales culturales seguros, privados y siempre accesibles. Significa prepararse para una Web que puede enfrentar mayores restricciones. Significa servir a los patrones en un mundo en el que la vigilancia gubernamental no va a desaparecer; de hecho, parece que aumentará. A lo largo de la historia, las bibliotecas han luchado contra terribles violaciones de la privacidad, en las que se detenía a personas simplemente por lo que leían. En Internet Archive, luchamos para proteger la privacidad de nuestros lectores en el mundo digital. [27]
A partir de 2017, OCLC e Internet Archive han colaborado para que los registros de libros digitalizados del Archivo estén disponibles en WorldCat . [30]
Desde 2018, la residencia de artes visuales de Internet Archive, organizada por Amir Sabre Esfahani y Andrew McClintock, ayuda a conectar a los artistas con los más de 48 petabytes [31] de materiales digitalizados del Archivo. Durante el transcurso de la residencia de un año, los artistas visuales crean un cuerpo de trabajo que culmina en una exposición. La esperanza es conectar la historia digital con las artes y crear algo que las generaciones futuras puedan apreciar en línea o fuera de ella. [32] Los artistas residentes anteriores incluyen a Taravat Talepasand , Whitney Lynn y Jenny Odell . [33]
Internet Archive adquiere la mayoría de los materiales a través de donaciones, [34] como cientos de miles de discos de 78 rpm de la Biblioteca Pública de Boston en 2017, [35] una donación de 250.000 libros de la Universidad de Trent en 2018, [36] y la colección completa de Biblioteca de Marygrove College en 2020 después de su cierre. [37] Luego, todo el material se digitaliza y se conserva en un almacenamiento digital, mientras que una copia digital se devuelve al titular original y la copia de Internet Archive, si no es de dominio público, se presta a los usuarios de todo el mundo, uno a la vez, bajo el control digital. Teoría de los préstamos (CDL) de la doctrina de la primera venta . [38]
Durante la semana del 27 de mayo de 2024, The Internet Archive sufrió una serie de ataques distribuidos de denegación de servicio (DDoS) que hicieron que sus servicios no estuvieran disponibles de forma intermitente, a veces durante horas seguidas, durante un período de varios días. [39] [40] [41]
The Archive es una organización sin fines de lucro 501(c)(3) que opera en los Estados Unidos. En 2019, tenía un presupuesto anual de 36 millones de dólares, derivado de los ingresos de sus servicios de rastreo web, diversas asociaciones, subvenciones, donaciones y la Fundación Kahle-Austin . [42] Internet Archive también gestiona campañas periódicas de financiación. Por ejemplo, una campaña de diciembre de 2019 tenía como objetivo alcanzar los 6 millones de dólares en donaciones. [43]
El Archivo tiene su sede en San Francisco, California . De 1996 a 2009, su sede estuvo en el Presidio de San Francisco , antigua base militar estadounidense. Desde 2009, su sede está en 300 Funston Avenue en San Francisco , una antigua Iglesia de la Ciencia Cristiana . Hubo un tiempo en que la mayor parte de su personal trabajaba en sus centros de escaneo de libros ; A partir de 2019, el escaneo lo realizan 100 operadores pagos en todo el mundo. [44] El Archivo también tiene centros de datos en tres ciudades de California: San Francisco, Redwood City y Richmond . Para reducir el riesgo de pérdida de datos, el Archivo crea copias de partes de su colección en lugares más distantes, incluida la Bibliotheca Alexandrina [45] [46] en Egipto y una instalación en Amsterdam . [47]
El Archivo es miembro del Consorcio Internacional para la Preservación de Internet [48] y fue designado oficialmente como biblioteca por el estado de California en 2007. [49] [50]
Internet Archive aprovechó el uso popular del término " WABAC Machine " de un segmento de la caricatura Las aventuras de Rocky y Bullwinkle (específicamente, Peabody's Improbable History ), y utiliza el nombre "Wayback Machine" para su servicio que permite archivos de la World Wide Web para ser buscado y accedido. [51] Este servicio permite a los usuarios ver algunas de las páginas web archivadas. Wayback Machine se creó como un esfuerzo conjunto entre Alexa Internet (propiedad de Amazon.com ) e Internet Archive cuando se creó un índice tridimensional para permitir la navegación por contenido web archivado. [52] Cientos de miles de millones de sitios web y sus datos asociados (imágenes, código fuente, documentos, etc.) se guardan en una base de datos. El servicio se puede utilizar para ver cómo eran las versiones anteriores de los sitios web, para obtener el código fuente original de sitios web que quizás ya no estén disponibles directamente o para visitar sitios web que ya no existen. No todos los sitios web están disponibles porque muchos propietarios de sitios web optan por excluirlos. Como ocurre con todos los sitios basados en datos de rastreadores web, Internet Archive pasa por alto grandes áreas de la web por una variedad de otras razones. Un artículo de 2004 encontró sesgos internacionales en la cobertura, pero los consideró "no intencionales". [53] En 2017, el director de Wayback Machine anunció que sus rastreadores ignorarían las instrucciones de robots.txt y archivarían páginas incluso si los propietarios de sitios web pidieran a los bots que no accedieran a ellos. [54]
En octubre de 2013 estuvo disponible una función de archivo "Guardar página ahora", [55] accesible en la parte inferior derecha de la página principal de Wayback Machine. [56] Una vez que se ingresa y guarda una URL de destino, la página web pasará a formar parte de Wayback Machine. [55] A través de la dirección de Internet web.archive.org, [57] los usuarios pueden cargar en Wayback Machine una gran variedad de contenidos, incluidos PDF y formatos de archivos de compresión de datos . Wayback Machine crea una URL local permanente del contenido cargado, a la que se puede acceder en la web, incluso si no aparece durante la búsqueda en el sitio web oficial https://archive.org.
En octubre de 2016, se anunció que se cambiaría la forma en que se cuentan las páginas web, lo que daría como resultado una disminución en el recuento de páginas archivadas mostradas. Los objetos incrustados como imágenes, vídeos, hojas de estilo y JavaScript ya no se cuentan como una "página web", mientras que los documentos HTML, PDF y de texto sin formato siguen contabilizándose. [58]
En septiembre de 2020, Internet Archive anunció una asociación con Cloudflare , un proveedor de servicios de red de entrega de contenido estadounidense, para indexar automáticamente los sitios web atendidos a través de sus servicios "Always Online". [81]
Creado a principios de 2006, Archive-It [82] es un servicio de suscripción de archivo web que permite a instituciones e individuos crear y preservar colecciones de contenido digital y crear archivos digitales. Archive-It permite al usuario personalizar la captura o exclusión del contenido web que desea preservar por motivos de patrimonio cultural. A través de una aplicación web, los socios de Archive-It pueden recopilar, catalogar, administrar, explorar, buscar y ver sus colecciones archivadas. [83]
En términos de accesibilidad, los sitios web archivados se pueden buscar en texto completo dentro de los siete días posteriores a su captura. [84] Contenido recopilado a través de Archive: se captura y almacena como un archivo WARC . Una copia primaria y una copia de seguridad se almacenan en los centros de datos de Internet Archive. Se puede entregar una copia del archivo WARC a las instituciones asociadas suscritas para fines de preservación y almacenamiento con redundancia geográfica según sus estándares de mejores prácticas. [85] Periódicamente, los datos capturados a través de Archive-It se indexan en el archivo general de Internet Archive.
En marzo de 2014 [actualizar], Archive-It tenía más de 275 instituciones asociadas en 46 estados de EE. UU. y 16 países que habían capturado más de 7,4 mil millones de URL para más de 2,444 colecciones públicas. Los socios de Archive-It son universidades y bibliotecas universitarias, archivos estatales, instituciones federales, museos, bibliotecas jurídicas y organizaciones culturales, incluida la Organización de Literatura Electrónica , los Archivos y Bibliotecas del Estado de Carolina del Norte, la Universidad de Stanford , la Universidad de Columbia , la Universidad Americana de El Cairo y Georgetown. Biblioteca de Derecho y muchos otros.
En septiembre de 2020, Internet Archive anunció una nueva iniciativa para archivar y preservar revistas académicas de acceso abierto , llamada Internet Archive Scholar . [86] [87] [88] Su índice de búsqueda de texto completo incluye más de 25 millones de artículos de investigación y otros documentos académicos conservados en Internet Archive. La colección abarca desde copias digitalizadas de revistas del siglo XVIII hasta las últimas actas de conferencias de acceso abierto y preimpresiones rastreadas desde la World Wide Web.
En 2021, Internet Archive anunció la versión inicial del Índice general , un índice disponible públicamente de una colección de 107 millones de artículos de revistas académicas . [89] [90]
El escaneo realizado por Internet Archive cuenta con el apoyo financiero de bibliotecas y fundaciones. [91] En noviembre de 2008 [actualizar], cuando había aproximadamente 1 millón de textos, la colección completa ocupaba más de 0,5 petabytes, e incluía imágenes de cámara sin procesar, imágenes recortadas y sesgadas, archivos PDF y datos OCR sin procesar . [92]
En julio de 2013 [actualizar], Internet Archive operaba 33 centros de escaneo en cinco países, digitalizando alrededor de 1.000 libros por día para un total de más de 2 millones de libros, en una colección total de 4,4 millones de libros, incluido el material digitalizado por otros e introducido en el Archivo de Internet; en ese momento, los usuarios realizaban más de 15 millones de descargas por mes. [93]
El material digitalizado por otros incluye más de 300.000 libros que Microsoft contribuyó a la colección, aproximadamente entre 2006 y 2008, a través de su proyecto Live Search Books , que también incluyó apoyo financiero y equipos de escaneo donados directamente al Internet Archive. [94] El 23 de mayo de 2008, Microsoft anunció que pondría fin a su proyecto Live Book Search y que ya no escanearía libros, donando el equipo de escaneo restante a sus antiguos socios. [94]
Alrededor de octubre de 2007, los usuarios de Archive comenzaron a cargar libros de dominio público desde la Búsqueda de libros de Google . [95] En noviembre de 2013 [actualizar], había más de 900.000 libros digitalizados en Google en la colección del Archivo; [96] los libros son idénticos a las copias que se encuentran en Google, excepto sin las marcas de agua de Google, y están disponibles para uso y descarga sin restricciones. [a] Brewster Kahle reveló en 2013 que este esfuerzo de archivo fue coordinado por Aaron Swartz , quien, con un "grupo de amigos", descargó los libros de dominio público de Google con la suficiente lentitud y desde suficientes computadoras para mantenerse dentro de las restricciones de Google. Hicieron esto para garantizar el acceso público al dominio público . El Archivo se aseguró de que los artículos fueran atribuidos y vinculados a Google, que nunca se quejó, mientras que las bibliotecas "se quejaron". Según Kahle, este es un ejemplo del "genio" de Swartz para trabajar en lo que podría aportar el máximo beneficio público a millones de personas. [97]
Además de los libros, el Archivo ofrece acceso público gratuito y anónimo a más de cuatro millones de opiniones judiciales, escritos legales o pruebas cargadas desde el sistema de documentos electrónicos PACER de los Tribunales Federales de los Estados Unidos a través del complemento del navegador web RECAP . Estos documentos se habían mantenido detrás de un muro de pago de un tribunal federal. En el Archivo, más de seis millones de personas habían accedido a ellos hasta 2013. [97]
La aplicación web BookReader de Archive , [98] integrada en su sitio web, tiene características tales como modos de una sola página, de dos páginas y de miniaturas ; modo de pantalla completa; zoom de página de imágenes de alta resolución ; y animación para pasar página . [98] [99]
La Biblioteca Abierta es otro proyecto de Internet Archive. El proyecto busca incluir una página web para cada libro jamás publicado: contiene 25 millones de registros de ediciones en el catálogo. También busca ser una biblioteca pública accesible a través de la web: contiene los textos completos de aproximadamente 1.600.000 libros de dominio público (de los más de cinco millones de la colección de textos principal), así como libros impresos y con derechos de autor. [100] muchos de los cuales son completamente legibles, descargables [101] [102] y con capacidad de búsqueda en texto completo ; [103] ofrece un préstamo de libros electrónicos durante dos semanas en su programa de préstamo digital controlado para más de 647.784 libros que no son de dominio público, en asociación con más de 1.000 bibliotecas asociadas de seis países [93] [104] después de un registro gratuito en el sitio web. Open Library es un proyecto de software gratuito y de código abierto , cuyo código fuente está disponible gratuitamente en GitHub .
La Biblioteca Abierta enfrenta objeciones de algunos autores y de la Sociedad de Autores , quienes sostienen que el proyecto distribuye libros sin autorización y, por lo tanto, viola las leyes de derechos de autor, [105] y cuatro editoriales importantes iniciaron una demanda por infracción de derechos de autor contra Internet Archive en Junio de 2020 para detener el proyecto Biblioteca Abierta. [106]
Muchos patrocinadores institucionales importantes han ayudado a Internet Archive a proporcionar millones de publicaciones escaneadas (elementos de texto). [107] Algunos patrocinadores que han digitalizado grandes cantidades de textos incluyen la Biblioteca Robarts de la Universidad de Toronto , las Bibliotecas de la Universidad de Alberta , la Universidad de Ottawa , la Biblioteca del Congreso , las bibliotecas miembros del Consorcio de Bibliotecas de Boston , la Biblioteca Pública de Boston , la Biblioteca del Seminario Teológico de Princeton y muchos otros. [108]
En 2017, MIT Press autorizó a Internet Archive a digitalizar y prestar libros del fondo de la prensa , [109] con el apoyo financiero del Fondo Arcadia . [110] [111] Un año después, Internet Archive recibió más fondos del Fondo Arcadia para invitar a otras editoriales universitarias a asociarse con Internet Archive para digitalizar libros, un proyecto llamado "Desbloqueo de libros de prensa universitaria". [112] [113]
La Biblioteca del Congreso creó numerosos identificadores del Sistema Handle que apuntaban a libros digitalizados gratuitos en Internet Archive. [114] Internet Archive y Open Library figuran en el sitio web de la Biblioteca del Congreso como fuente de libros electrónicos. [115]
Además de los archivos web, Internet Archive mantiene extensas colecciones de medios digitales que, según quien los carga, son de dominio público en los Estados Unidos o tienen licencia que permite la redistribución, como las licencias Creative Commons . Los medios se organizan en colecciones por tipo de medio (imágenes en movimiento, audio, texto, etc.) y en subcolecciones según varios criterios. Cada una de las colecciones principales incluye una subcolección "Comunitaria" (anteriormente denominada "Código Abierto") donde se almacenan las contribuciones generales del público.
El Archivo de audio es un archivo de audio que incluye música, audiolibros , transmisiones de noticias, programas de radio antiguos , podcasts y una amplia variedad de otros archivos de audio. En enero de 2023 [actualizar], hay más de 15.000.000 de grabaciones digitales gratuitas en la colección. Las subcolecciones incluyen audiolibros y poesía, podcasts, audio que no está en inglés y muchos otros. [116] Las colecciones sonoras están comisariadas por B. George , director del ARChive of Contemporary Music . [117]
Junto al reproductor de audio HTML5 estándar, está disponible Winamp, que se parece a Webamp .
Un proyecto para preservar grabaciones de transmisiones de radioaficionados, con financiación de la fundación Amateur Radio Digital Communications. [118] [119]
La subcolección Live Music Archive incluye más de 170.000 grabaciones de conciertos de músicos independientes, así como de artistas y conjuntos musicales más establecidos con reglas permisivas sobre la grabación de sus conciertos, como Grateful Dead y, más recientemente, The Smashing Pumpkins . Además, Jordan Zevon ha permitido que Internet Archive albergue una colección definitiva de las grabaciones de conciertos de su padre Warren Zevon . La colección Zevon abarca desde 1976 hasta 2001 y contiene 126 conciertos que incluyen 1.137 canciones. [120]
El Proyecto Great 78 pretende digitalizar 250.000 singles de 78 rpm (500.000 canciones) del periodo comprendido entre 1880 y 1960, donados por diversos coleccionistas e instituciones. Ha sido desarrollado en colaboración con el Archive of Contemporary Music y George Blood Audio, responsable de la digitalización del audio. [117]
The Archive tiene una colección de música de distribución gratuita que se transmite y está disponible para descargar a través de su servicio Netlabels . La música de esta colección generalmente tiene catálogos con licencia Creative Commons de sellos discográficos virtuales. [121] [122]
Esta colección contiene más de 3,5 millones de artículos. [123] Cover Art Archive , Museo Metropolitano de Arte – Galería de imágenes, Imágenes de la NASA, Archivo de Flickr de Occupy Wall Street y Mapas del USGS son algunas subcolecciones de la colección de imágenes.
Cover Art Archive es un proyecto conjunto entre Internet Archive y MusicBrainz , cuyo objetivo es crear imágenes de portadas en Internet. En abril de 2021, [actualizar]esta colección contiene más de 1.400.000 artículos. [124]
Las imágenes de esta colección son del Museo Metropolitano de Arte . Esta colección contiene más de 140.000 artículos. [125]
El archivo de Imágenes de la NASA se creó a través de un Acuerdo de Ley Espacial entre Internet Archive y la NASA para brindar acceso público a las colecciones de imágenes, videos y audio de la NASA en un único recurso con capacidad de búsqueda. El equipo de IA NASA Images trabajó en estrecha colaboración con todos los centros de la NASA para seguir ampliando la colección en constante crecimiento. [126] El sitio nasaimages.org se lanzó en julio de 2008 y tenía más de 100.000 artículos en línea al final de su alojamiento en 2012.
Esta colección contiene fotografías con licencia Creative Commons de Flickr relacionadas con el movimiento Occupy Wall Street . Esta colección contiene más de 15.000 artículos. [127]
Esta colección contiene más de 59.000 elementos de Libre Map Project . [128]
Una de las subcolecciones del Archivo de vídeos de Internet Archive es el Archivo Machinima. Esta pequeña sección alberga muchos vídeos de Machinima. Machinima es una forma de arte digital en la que juegos de computadora , motores de juegos o motores de software se utilizan en un modo similar a una caja de arena para crear películas, recrear obras de teatro o incluso publicar presentaciones o conferencias magistrales. El archivo recopila una variedad de películas de Machinima de editores de Internet como Rooster Teeth y Machinima.com , así como de productores independientes. La subcolección es un esfuerzo de colaboración entre Internet Archive, el proyecto de investigación How They Got Game de la Universidad de Stanford, la Academia de Artes y Ciencias Machinima y Machinima.com. [129]
Esta colección contiene aproximadamente 160.000 artículos microfilmados de una variedad de bibliotecas, incluidas las Bibliotecas de la Universidad de Chicago , la Universidad de Illinois en Urbana-Champaign , la Universidad de Alberta , la Biblioteca Pública del Condado de Allen y el Servicio Nacional de Información Técnica . [130] [131]
Internet Archive tiene una colección de aproximadamente 3.863 largometrajes. [132] Además, la colección de imágenes en movimiento de Internet Archive incluye: noticieros , dibujos animados clásicos , propaganda a favor y en contra de la guerra , The Video Cellar Collection, la colección "AV Geeks" de Skip Elsheimer, televisión temprana y material efímero de Prelinger Archives , como como películas publicitarias , educativas e industriales, así como colecciones de películas caseras y de aficionados.
Las subcategorías de esta colección incluyen:
Open Educational Resources es una colección digital en archive.org. Esta colección contiene cientos de cursos gratuitos, videoconferencias y materiales complementarios de universidades de Estados Unidos y China . Los contribuyentes de esta colección son la Universidad ArsDigita , la Fundación Hewlett , el MIT , el Instituto Monterey y la Universidad Naropa . [135]
En septiembre de 2012, Internet Archive lanzó el servicio TV News Search & Borrow para buscar programas de noticias nacionales de EE. UU. [136] El servicio se basa en transcripciones de subtítulos y permite a los usuarios buscar y transmitir clips de vídeo de 30 segundos. Tras su lanzamiento, el servicio contenía "350.000 programas de noticias recopilados durante 3 años de redes y estaciones nacionales estadounidenses en San Francisco y Washington DC" [137] Según Kahle, el servicio se inspiró en el Vanderbilt Television News Archive , una biblioteca similar de programas televisados. programas de noticias de la red. [138] A diferencia de Vanderbilt, que limita el acceso a la transmisión de video a personas asociadas con colegios y universidades suscritos, TV News Search & Borrow permite el acceso abierto a sus videoclips en tiempo real. En 2013, el Archivo recibió una donación adicional de "aproximadamente 40.000 cintas bien organizadas" del patrimonio de una mujer de Filadelfia , Marion Stokes . Stokes "había grabado más de 35 años de noticias televisivas en Filadelfia y Boston con sus máquinas VHS y Betamax ". [139]
La colección del Museo de Brooklyn contiene aproximadamente 3.000 artículos del Museo de Brooklyn . [140] En diciembre de 2020, la biblioteca de investigación cinematográfica de Lillian Michelson fue donada al archivo. [141]
Expresando una fuerte reacción a la idea de que los libros simplemente se desechen, e inspirada por la Bóveda Global de Semillas de Svalbard , Kahle ahora imagina recolectar una copia de cada libro jamás publicado. "No vamos a llegar allí, pero ese es nuestro objetivo", afirmó. Además de los libros, Kahle planea almacenar los antiguos servidores de Internet Archive, que fueron reemplazados en 2010. [142]
Internet Archive tiene "la mayor colección de software histórico en línea del mundo", que abarca 50 años de historia de la informática en terabytes de revistas y diarios de informática, libros, discos shareware , sitios FTP, videojuegos , etc. archivo de lo que describe como "software antiguo", como una forma de preservarlos. [143] El proyecto abogaba por una exención de la Ley de Derechos de Autor del Milenio Digital de los Estados Unidos para permitirles eludir la protección de copia , que la Oficina de Derechos de Autor de los Estados Unidos aprobó en 2003 por un período de tres años. [144] El Archivo no ofrece el software para su descarga, ya que la exención es únicamente "para fines de preservación o reproducción de archivos de obras digitales publicadas por una biblioteca o archivo". [145] La Biblioteca del Congreso renovó la exención en 2006 y en 2009 la extendió indefinidamente en espera de nuevas reglamentaciones. [146] La Biblioteca reiteró la exención como una "Regla final" sin fecha de vencimiento en 2010. [147] En 2013, Internet Archive comenzó a ofrecer un navegador de videojuegos selecto, reproducible a través de MESS , por ejemplo, el juego Atari 2600 ET el Extraterrestre . [148] Desde el 23 de diciembre de 2014, Internet Archive presenta, a través de una emulación de DOSBox basada en navegador, miles de juegos de DOS /PC [149] [150] [151] [152] para "fines de becas e investigación únicamente". [153] [154] [155] En noviembre de 2020, Archive presentó un nuevo emulador para Adobe Flash llamado Ruffle y comenzó a archivar animaciones y juegos Flash antes del final de vida útil del complemento Flash el 31 de diciembre de 2020. todos los sistemas informáticos. [156]
Se ha desarrollado un sistema combinado de hardware y software que realiza un método seguro de digitalización de contenidos. [157] [158]
Desde 2012 hasta noviembre de 2015, Internet Archive operó Internet Archive Federal Credit Union, una cooperativa de crédito federal con sede en New Brunswick, Nueva Jersey , con el objetivo de brindar acceso a personas de ingresos bajos y medios. A lo largo de su corta existencia, la IAFCU experimentó importantes conflictos con la Administración Nacional de Cooperativas de Crédito , que limitaron gravemente la cartera de préstamos de la IAFCU y preocupaciones sobre el servicio a las empresas de Bitcoin . En el momento de su disolución, estaba formada por 395 miembros y valía 2,5 millones de dólares. [159] [160]
Desde 2019, [161] Internet Archive organiza un evento llamado Campamento Web Descentralizado (DWeb Camp). Es un campamento anual que reúne a una comunidad global diversa de contribuyentes en un entorno natural. El campamento tiene como objetivo abordar los desafíos del mundo real que enfrenta la web y cocrear tecnologías descentralizadas para una mejor Internet. Su objetivo es fomentar la colaboración, el aprendizaje y la diversión al tiempo que promueve principios de confianza, agencia humana, respeto mutuo y conciencia ecológica. [162]
El 30 de septiembre de 2021, como parte de la celebración de su 25 aniversario, Internet Archive lanzó "Wayforward Machine", un sitio web satírico y ficticio cubierto de ventanas emergentes que solicitan información personal. El sitio tenía como objetivo representar una línea de tiempo distópica ficticia de eventos del mundo real que conducen a ese futuro, como la derogación de la Sección 230 del Código de los Estados Unidos en 2022 y la introducción de implantes publicitarios en 2041. [163] [164]
La Gran Sala del Internet Archive presenta una colección de más de 100 figuras de cerámica que representan a los empleados del Internet Archive, y la estatua número 100 inmortaliza a Aaron Swartz . Esta colección, inspirada en las estatuas de los guerreros Xian en China , fue encargada por Brewster Kahle, esculpida por Nuala Creed y, a partir de 2014, está en curso. [165]
La residencia de artes visuales de Internet Archive, [166] organizada por Amir Sabre Esfahani, está diseñada para conectar a artistas emergentes y de mitad de carrera con los millones de colecciones del Archivo y para mostrar lo que es posible cuando el acceso abierto a la información se cruza con las artes. Durante esta residencia de un año, los artistas seleccionados desarrollan un cuerpo de trabajo que responde y utiliza las colecciones del Archivo en su propia práctica. [167]
El 8 de mayo de 2008, se reveló que Internet Archive había desafiado con éxito una carta de seguridad nacional del FBI solicitando registros de un usuario no revelado. [171] [172]
El 28 de noviembre de 2016, se reveló que se había impugnado con éxito una segunda carta de seguridad nacional del FBI que solicitaba registros de otro usuario no revelado. [173]
Internet Archive bloqueó su sitio web durante 12 horas el 18 de enero de 2012, en protesta por los proyectos de ley Stop Online Piracy Act y PROTECT IP Act , dos leyes en el Congreso de los Estados Unidos que, según ellos, "afectarían negativamente al ecosistema". de publicación web que condujo al surgimiento de Internet Archive". Esto ocurrió junto con el apagón de Wikipedia en inglés , así como con muchas otras protestas en Internet. [174]
Internet Archive es miembro de Open Book Alliance , que ha estado entre los críticos más abiertos del Acuerdo sobre Libros de Google . El Archivo aboga por un proyecto de biblioteca digital alternativo. [175]
El 9 de octubre de 2016, Internet Archive fue bloqueado temporalmente en Turquía después de que piratas informáticos lo utilizaran (entre otros servicios de alojamiento de archivos) para alojar 17 GB de correos electrónicos gubernamentales filtrados. [176] [177]
Debido a que Internet Archive solo modera ligeramente las cargas, incluye recursos que pueden ser valorados por los extremistas y el sitio puede ser utilizado por ellos para evadir la lista de bloqueo . En febrero de 2018, el Proyecto Contra el Extremismo dijo que el Archivo albergaba vídeos terroristas, incluida la decapitación de Alan Henning , y se había negado a responder a solicitudes sobre los vídeos. [178] En mayo de 2018, un informe publicado por la empresa de seguridad cibernética Flashpoint afirmó que el Estado Islámico estaba utilizando Internet Archive para compartir su propaganda. [179] Chris Butler, de Internet Archive, respondió que hablaban periódicamente con los gobiernos de EE. UU. y la UE sobre el intercambio de información sobre terrorismo. [179] En abril de 2019, Europol , a partir de una remisión de la policía francesa, pidió a Internet Archive que eliminara 550 sitios de "propaganda terrorista". [180] El Archivo rechazó la solicitud, diciendo que los informes eran incorrectos en cuanto al contenido que señalaban o que eran demasiado amplios para que la organización pudiera cumplirlos. [180] El 14 de julio de 2021, Internet Archive celebró un "Día de Acción de Referencia" conjunto con Europol para atacar vídeos terroristas. [181]
Un artículo de 2021 decía que los yihadistas utilizaban regularmente Internet Archive en busca de " gotas muertas " de vídeos terroristas. [182] En enero de 2022, se subió a Internet Archive un manifiesto de 800 páginas de un ex profesor de UCLA , que contenía ideas racistas y amenazas contra el personal de UCLA. [183] El manifiesto fue eliminado por Internet Archive después de una semana, en medio de una discusión sobre si dichos documentos deberían ser conservados por los archiveros o no. [183] Otro artículo de 2022 encontró "un volumen alarmante de material terrorista, extremista y racista en Internet Archive". [184] Un artículo de 2023 informó que los neonazis recopilan enlaces a recursos en línea disponibles públicamente para compartirlos con nuevos reclutas. Como Internet Archive aloja textos cargados que no están permitidos en otros sitios web, los libros nazis y neonazis del Archivo (por ejemplo, The Turner Diaries ) aparecen con frecuencia en estas listas. Estas listas también incluyen material de dominio público más antiguo creado cuando las opiniones de los supremacistas blancos eran más comunes. [185]
En medio de la pandemia de COVID-19 que cerró muchas escuelas, universidades y bibliotecas, el Archivo anunció el 24 de marzo de 2020 que creaba la Biblioteca Nacional de Emergencia eliminando las restricciones de préstamo que tenía para 1,4 millones de libros digitalizados. en su Biblioteca Abierta, pero limitando a los usuarios a la cantidad de libros que pueden sacar en préstamo y exigiendo su devolución; normalmente, el sitio solo permitiría un préstamo digital por cada copia física del libro que tuvieran, mediante el uso de un archivo cifrado que quedaría inutilizable una vez completado el período de préstamo. [4] Esta Biblioteca permanecería como tal hasta al menos el 30 de junio de 2020, o hasta que terminara la emergencia nacional de EE. UU., lo que ocurriera más tarde. [186] En su lanzamiento, Internet Archive permitió a los autores y titulares de derechos presentar solicitudes de exclusión voluntaria para que sus obras se omitieran de la Biblioteca Nacional de Emergencia. [187] [188] [189]
Internet Archive dijo que la Biblioteca Nacional de Emergencia abordó una "necesidad global e inmediata sin precedentes de acceso a material de lectura e investigación" debido al cierre de bibliotecas físicas en todo el mundo. [190] Justificaron la medida de varias maneras. Legalmente, dijeron que estaban promoviendo el acceso a esos recursos inaccesibles, lo que, según afirmaron, era un ejercicio de principios de uso justo . El Archivo continuó implementando su política de préstamo digital controlado que fue anterior a la Biblioteca Nacional de Emergencia, lo que significa que todavía cifraban las copias prestadas y no era más fácil para los usuarios crear nuevas copias de los libros que antes. Sólo un tribunal podría tomar una decisión final sobre si la Biblioteca Nacional de Emergencia constituía o no un uso legítimo. Moralmente, también señalaron que Internet Archive era una biblioteca registrada como cualquier otra, que pagaban los libros ellos mismos o los recibían como donaciones, y que los préstamos a través de bibliotecas eran anteriores a las restricciones de derechos de autor. [187] [191]
El Archivo ya había sido criticado por autores y editores por su enfoque de préstamo anterior, y tras el anuncio de la Biblioteca Nacional de Emergencia, los autores, editores y grupos que representan a ambos se opusieron aún más, equiparando la medida con la infracción de derechos de autor y la piratería digital, y utilizando el La pandemia de COVID-19 como motivo para traspasar los límites de los derechos de autor (ver también: Biblioteca Abierta § Acusaciones de violación de derechos de autor ). [189] [192] [193] [194] Después de que los trabajos de algunos de estos autores fueran ridiculizados en las respuestas, Jason Scott , de Internet Archive, solicitó que los partidarios de la Biblioteca Nacional de Emergencia no denigraran los libros de nadie: "Me doy cuenta de que hay un fuerte debate y No hay desacuerdo aquí, pero los libros dan vida y cambian la vida y estos escritores los hicieron". [195]
En noviembre de 2005, las descargas gratuitas de los conciertos de Grateful Dead fueron eliminadas del sitio, tras lo que parecían ser desacuerdos entre algunos de los antiguos miembros de la banda. John Perry Barlow identificó a Bob Weir , Mickey Hart y Bill Kreutzmann como los instigadores del cambio, según un artículo del New York Times . [196] Phil Lesh , miembro fundador de la banda, comentó sobre el cambio el 30 de noviembre de 2005, publicando en su sitio web personal:
Me llamó la atención que todos los programas de Grateful Dead fueron eliminados de Archive.org justo antes del Día de Acción de Gracias . No fui parte de este proceso de toma de decisiones y no me notificaron que los programas iban a ser retirados. Siento que la música es el legado de Grateful Dead y espero que de una forma u otra esté disponible para quienes la deseen. [197]
Una publicación en el foro del 30 de noviembre de Brewster Kahle resumió lo que parecía ser el compromiso alcanzado entre los miembros de la banda. Las grabaciones de la audiencia se podían descargar o transmitir, pero las grabaciones de la caja de resonancia solo estaban disponibles para transmisión. Desde entonces se han vuelto a agregar conciertos. [198]
En febrero de 2016, los usuarios de Internet Archive habían comenzado a archivar copias digitales de Nintendo Power , la revista oficial de Nintendo para sus juegos y productos, que se publicó desde 1988 hasta 2012. Se habían recopilado los primeros 140 números, antes de que Nintendo eliminara el archivo en agosto. 8 de diciembre de 2016. En respuesta a la eliminación, Nintendo le dijo al sitio web de juegos Polygon : "[Nintendo] debe proteger nuestros propios personajes, marcas comerciales y otros contenidos. El uso no aprobado de la propiedad intelectual de Nintendo puede debilitar nuestra capacidad para protegerla y preservarla. o posiblemente utilizarlo para nuevos proyectos". [199]
En agosto de 2017, el Departamento de Telecomunicaciones del Gobierno de la India bloqueó Internet Archive junto con otros sitios web para compartir archivos, de conformidad con dos órdenes judiciales emitidas por el Tribunal Superior de Madrás , [200] citando preocupaciones sobre la piratería después de copias de dos películas de Bollywood. supuestamente fueron compartidos a través del servicio. [201] La versión HTTP del Archivo fue bloqueada pero permaneció accesible mediante el protocolo HTTPS . [200]
En 2023, Internet Archive se convirtió en un sitio popular para que los indios vieran el primer episodio de India: The Modi Question , un documental de la BBC. [202] Se informó que el Archivo había eliminado el video el 23 de enero. [202] El Archivo de Internet declaró luego, el 27 de enero, que habían eliminado el video en respuesta a una solicitud de la BBC en virtud de la Ley de Derechos de Autor del Milenio Digital . [203]
El Proyecto Great 78 se inició en Internet Archive para almacenar versiones digitalizadas de canciones y álbumes anteriores a 1972 de discos fonográficos de 78 rpm , con el propósito declarado de "la preservación, investigación y descubrimiento de discos de 78 rpm". El proyecto había comenzado en 2016, momento en el que los derechos de autor de las grabaciones anteriores a 1972 solo tenían una duración limitada; En 2019, el Congreso de EE. UU. aprobó la Ley de Modernización de la Música que extendió los derechos de autor de grabaciones anteriores a 1972 hasta 2067. En agosto de 2023, Sony Music Entertainment y otros cinco importantes editores de música demandaron a Internet Archive por el Gran Proyecto 78, afirmando que el proyecto estaba involucrado en infracción de derechos de autor, negando el reclamo sobre fines de investigación ya que toda la música estaba disponible a través de sus respectivos servicios de música digital y streaming. Las empresas buscaban indemnización por daños y perjuicios por casi 2.500 canciones nombradas en la demanda, por un total de 347 millones de dólares. [204] Internet Archive ha argumentado que los crujidos y estallidos en las grabaciones significan que está dentro de la doctrina de "uso legítimo" digitalizarlas para su preservación. Los demandantes dijeron en respuesta: "si alguna vez se inventó una teoría del uso legítimo para litigios, es esta". [205]
El funcionamiento de la Biblioteca Nacional de Emergencia fue parte de una demanda presentada contra Internet Archive por cuatro importantes editoriales de libros (Hachette, HarperCollins, John Wiley & Sons y Penguin Random House) en junio de 2020, desafiando la validez de los derechos de autor de los préstamos digitales controlados. programa. [4] [106] [206] En respuesta, Internet Archive cerró la Biblioteca Nacional de Emergencia el 16 de junio de 2020, en lugar del 30 de junio de 2020 previsto, debido a la demanda. [207] [208] Los demandantes, apoyados por Copyright Alliance , [209] afirmaron en su demanda que las acciones de Internet Archive constituían una "infracción masiva deliberada de derechos de autor". [210] En agosto de 2020, el juicio de la demanda estaba programado tentativamente para comenzar en noviembre de 2021. [211] Para junio de 2022, ambas partes del caso solicitaron un juicio sumario para el caso, cada uno favoreciendo a sus respectivas partes, lo cual el juez John G. Koeltl aprobó. de una audiencia de sentencia sumaria que tendrá lugar más adelante en 2022. [212] No se emitió ninguna sentencia sumaria y, en cambio, se llevó a cabo una primera audiencia el 20 de marzo de 2023. [213] Durante el transcurso de la audiencia, el juez John G. Koeltl compareció indiferente a las afirmaciones de uso legítimo de la AI y no convencido de que el mercado editorial de libros electrónicos de bibliotecas no se haya visto afectado por su práctica. [214]
El senador Thom Tillis de Carolina del Norte, presidente del subcomité de propiedad intelectual del Comité Judicial del Senado, dijo en una carta a Internet Archive que estaba "preocupado porque Internet Archive piensa que es él, y no el Congreso, el que determina el alcance de los derechos de autor". ley". [210]
Como parte de su respuesta a la demanda de los editores, a finales de 2020 el Archivo lanzó una campaña llamada Empowering Libraries (hashtag #EmpoweringLibraries) que presentaba la demanda como una amenaza para todas las bibliotecas. [215]
En un artículo preimpreso de 2021 , Argyri Panezi argumentó que el caso "presenta dos cuestiones importantes, pero separadas, relacionadas con el acceso electrónico a las obras de la biblioteca; en primer lugar, plantea cuestiones sobre la práctica legal del préstamo digital y, en segundo lugar, pregunta si el uso de emergencia de material protegido por derechos de autor podría ser un uso legítimo" y argumentó que las bibliotecas tienen una función de servicio público para permitir que "las generaciones futuras sigan teniendo igual acceso (u oportunidades de acceder) a una pluralidad de fuentes originales". [216]
En diciembre de 2020, Publishers Weekly incluyó la demanda entre sus "10 historias bibliotecarias principales de 2020". [217]
El juez Koeltl falló el 24 de marzo de 2023 en contra de Internet Archive en el caso, diciendo que el concepto de Biblioteca Nacional de Emergencia no era un uso legítimo, por lo que el Archivo infringió sus derechos de autor al prestar los libros sin la restricción de la lista de espera. Luego se llegó a un acuerdo para que Internet Archive pagara una cantidad no revelada a los editores. [218] Internet Archive dijo posteriormente que apelaría esta sentencia, pero que por lo demás continuaría con otros servicios de libros digitales que han sido previamente autorizados según la jurisprudencia, como los libros para usuarios con problemas de lectura. [219] [220] TorrentFreak News publicó un informe actualizado del proceso de apelación que involucra a Internet Archive el 18 de diciembre de 2023 . [221]
Durante la emergencia pandémica, Internet Archive de Brewster Kahle prestó gratuitamente escaneos digitales de su biblioteca. Los editores demandaron. Tener un libro significa algo diferente ahora.
Durante más de ochenta años, MIT Press ha publicado títulos aclamados en ciencia, tecnología, arte y arquitectura. Ahora, gracias a una nueva asociación entre Internet Archive y MIT Press, los lectores podrán tomar prestados estos clásicos en línea por primera vez.
Desde que se convirtió en directora [de MIT Press] en 2015, hay poco que Brand no haya reimaginado en la prensa. En 2017, la prensa se asoció con Internet Archive para hacer que su amplio catálogo esté disponible de forma gratuita en las bibliotecas, resucitando libros que no habían visto la luz en generaciones.
Internet Archive ha recibido una subvención de un millón de dólares de Arcadia (un fondo benéfico de Lisbet Rausing y Peter Baldwin) para digitalizar títulos de colecciones de prensa universitaria y ponerlos a disposición mediante préstamos digitales controlados.
Internet Archive incluye el texto completo de más de 2,5 millones de libros electrónicos, incluidos libros electrónicos proporcionados por la Biblioteca del Congreso. Los libros se pueden leer en línea o descargar y leer en una variedad de formatos. Los libros electrónicos de Internet Archive también se pueden encontrar a través de Open Library, una iniciativa de Internet Archive dedicada a los textos.Y: Hohman, J. Cheyenne; Mughal, Yasmeen (2017) [abril de 2011]. "Dispositivos y formatos - Búsqueda de libros electrónicos: una guía - Bibliografías, guías de investigación y ayudas para la búsqueda de la Biblioteca del Congreso (programas y servicios virtuales)". Biblioteca del Congreso . Archivado desde el original el 12 de febrero de 2021 . Consultado el 25 de noviembre de 2020 .
Las publicaciones de la Biblioteca del Congreso están disponibles para su descarga gratuita en Kindle desde Internet Archive. ... El iPad se puede utilizar como lector electrónico a través de aplicaciones como iBooks, que admiten formatos ePub (.epub) y PDF (.pdf). Ambos formatos están disponibles en Internet Archive.
Internet Archive tiene una enorme colección de música descargable gratuita en su categoría NetLabels...
Brewster Kahle, el hombre detrás de un proyecto para archivar cada página web, ahora quiere reunir una copia de cada libro publicado.
Programas de computadora y videojuegos distribuidos en formatos que se han vuelto obsoletos y que requieren el soporte o hardware original como condición de acceso, cuando la elusión se logra con el propósito de preservación o reproducción de archivo de obras digitales publicadas por una biblioteca o archivo. Un formato se considerará obsoleto si la máquina o el sistema necesario para hacer perceptible una obra almacenada en ese formato ya no se fabrica o ya no está razonablemente disponible en el mercado comercial.
El acceso a las colecciones del Archivo se proporciona sin costo alguno para usted y se otorga únicamente con fines de becas e investigación.