stringtranslate.com

Archivo web del Reino Unido

El UK Web Archive es un consorcio de seis bibliotecas de depósito legal del Reino Unido cuyo objetivo es recopilar todos los sitios web del Reino Unido al menos una vez al año. [1]

Historia

En 2005, la Biblioteca Británica , los Archivos Nacionales , Wellcome Trust , la Biblioteca Nacional de Escocia , la Biblioteca Nacional de Gales y JISC formaron el UK Web Archiving Consortium, un proyecto para archivar sitios web. [3]

UKWAC archivó sitios web seleccionados mediante licencia o permiso, utilizando el software PANDAS desarrollado por la Biblioteca Nacional de Australia . Durante el proyecto, sus miembros recopilaron sitios relevantes para sus intereses; La Biblioteca Wellcome recopiló sitios médicos , los sitios de las bibliotecas nacionales que reflejan la vida en Gales o Escocia contemporáneas. La Biblioteca Británica trabajó con una política amplia de recopilación de sitios de importancia cultural, histórica y política para el Reino Unido. [4]

El Consorcio disolvió en 2010. El Grupo de Trabajo de Archivo y Preservación asumió la función de coordinación del archivo web de UKWAC en el Reino Unido. La Coalición para la Preservación Digital alberga el grupo de trabajo. [5]

Archivo web

El archivo realiza un rastreo anual de .uk y otros dominios de nivel superior geográficos del Reino Unido , como .scot , .cymru o .london .

Un gráfico que muestra una pequeña parte del rastreo de un sitio web de UK Web Archive. Cada círculo es un sitio web diferente y cada línea representa un enlace que se siguió entre sitios web. El tamaño del círculo representa cuántas páginas se visitaron desde ese sitio y el ancho de la línea representa la cantidad de enlaces seguidos.
Un gráfico que muestra una pequeña parte de un rastreo . Cada círculo es un sitio web diferente y cada línea representa un enlace que se siguió entre sitios web. El tamaño del círculo representa cuántas páginas se visitaron desde ese sitio y el ancho de la línea representa la cantidad de enlaces seguidos. UKWA Crawls: una hora en un minuto

El rastreo se archiva en una infraestructura compartida llamada Sistema de Biblioteca Digital . El público puede nominar sitios para su conservación a través del sitio web de UKWA. Todo el archivo web está disponible para los lectores registrados en las instalaciones de la biblioteca; y cuando se ha otorgado permiso o se pueden cumplir las condiciones de la licencia, también se puede acceder a copias a través del sitio web. [6]

El archivo reúne sitios en respuesta a eventos y crea colecciones que han conservado escritos e imágenes que registran desastres naturales, campañas electorales desde 2005 y la blogósfera del Reino Unido para investigaciones, entre más de cien más. [7]

BRILLAR

Un gráfico que muestra el porcentaje del conjunto de datos en el que aparecen las frases "error del milenio" o "problema del año 2013", entre los años 1996 y 2013. Ambas tendencias alcanzan un máximo en 1999, seguido de una disminución, siguiendo prácticamente la misma forma. .
Gráfico de SHINE que muestra la frecuencia con la que aparecen diferentes frases para el " problema del año 2000 " entre los años 1996 y 2013 en páginas web archivadas en formato .uk.

El UK Web Archive contiene una colección de todos los sitios web .uk que fueron archivados por Internet Archive hasta finales de marzo de 2013. [8] SHINE es una interfaz web que se puede utilizar para crear listas repetibles de resultados de .uk históricos. páginas. Las tendencias , o la aparición de palabras clave en el conjunto de datos de las páginas .uk durante ese tiempo, utilizan la concordancia para mostrar las palabras clave en contexto. [9]

Recuerdos

Memento es un nombre para versiones anteriores de páginas web acuñado por Memento Project . La interfaz UK Web Archive Memento permite encontrar Mementos en archivos web . [10] La interfaz se puede utilizar para buscar un Memento por su fecha en una tabla de instantáneas , o ver con qué frecuencia aparece un sitio en archivos web públicos.

investigando el archivo

La investigación sobre la red como reflejo de la sociedad ha contribuido a desarrollar el acceso al archivo. [11] Las bibliotecas han desarrollado guías sobre las habilidades de investigación necesarias para utilizar archivos web. Estos incluyen el uso de big data para ver patrones o tendencias, [12] o escribir citas para copias archivadas de sitios web. [13]

Banco de trabajo GLAM

GLAM Workbench es un proyecto que analiza cómo los investigadores pueden utilizar los datos conservados en galerías, bibliotecas, archivos y museos. [14] Incluye una colección de cuadernos Jupyter que se basan en Mementos y datos de índice. [15] Los cuadernos combinan descripción y código editable para ayudar a los investigadores a encontrar evidencia en archivos web.

Ver también

Referencias

  1. ^ "Inicio de UKWA". www.webarchive.org.uk . Consultado el 13 de octubre de 2020 .
  2. ^ "Reglamento de 2013 sobre bibliotecas de depósito legal (obras no impresas)". legislación.gov.uk . Consultado el 21 de febrero de 2022 .
  3. ^ "15 años del archivo web del Reino Unido - Los primeros años - Blog del archivo web del Reino Unido". blogs.bl.uk . Archivado desde el original el 8 de marzo de 2020 . Consultado el 13 de octubre de 2020 .
  4. ^ "Consorcio de archivo web del Reino Unido: informe de evaluación". Coalición para la Preservación Digital . Abril de 2006. Archivado desde el original el 9 de enero de 2017 . Consultado el 17 de marzo de 2014 .
  5. ^ "Grupo de trabajo de preservación y archivo web - Coalición de preservación digital". www.dpconline.org . Archivado desde el original el 31 de julio de 2020 . Consultado el 13 de octubre de 2020 .
  6. ^ "¿Qué es el Archivo Web del Reino Unido?". Archivo web del Reino Unido. Archivado desde el original el 5 de diciembre de 2019 . Consultado el 17 de marzo de 2014 .
  7. ^ "15 años de UKWA - Una mirada retrospectiva a nuestras primeras colecciones - Blog del UK Web Archive". blogs.bl.uk . Archivado desde el original el 29 de julio de 2020 . Consultado el 19 de octubre de 2020 .
  8. ^ www.webarchive.org.uk. "Conjunto de datos de dominio web JISC del Reino Unido (1996-2013)". data.webarchive.org.uk . Consultado el 16 de octubre de 2020 .
  9. ^ "Resultados de tendencias 1996-2013 para" big data " :: SHINE". www.webarchive.org.uk . Consultado el 13 de octubre de 2020 .
  10. ^ "Mementos - Historia archivada de www.webarchive.org.uk". Mementos: búsqueda de archivos históricos en la red mundial . Consultado el 9 de octubre de 2020 .
  11. ^ Blaney, Jonathan (19 de abril de 2016). "Más estudios de casos de proyectos disponibles". Grandes datos de dominio del Reino Unido para las artes y las humanidades . Archivado desde el original el 16 de febrero de 2017 . Consultado el 9 de octubre de 2020 .
  12. ^ McNally, Anna. "LibGuides: búsqueda y uso de archivos digitales durante COVID-19: archivos web". libguides.westminster.ac.uk . Consultado el 14 de octubre de 2020 .
  13. ^ Thomas, Susan. "Oxford LibGuides: Archivos web: Inicio". ox.libguides.com . Consultado el 14 de octubre de 2020 .
  14. ^ "Bienvenido a GLAM Workbench - GLAM Workbench". glam-workbench.github.io . Consultado el 13 de octubre de 2020 .
  15. ^ Sherratt, Tim; Jackson, Andrés (15 de junio de 2020). "GLAM-Workbench/archivos web". Zenodo . Código Bib : 2020zndo...3894079S. doi :10.5281/zenodo.3894079.
  16. ^ Equipo, Web de Récords Nacionales de Escocia (31 de mayo de 2013). "Servicio de continuidad web NRS". Registros nacionales de Escocia . Archivado desde el original el 18 de enero de 2020 . Consultado el 13 de octubre de 2020 .
  17. ^ "Buscar en el archivo web de PRONI". nidirecto . 2015-12-09. Archivado desde el original el 27 de agosto de 2020 . Consultado el 13 de octubre de 2020 .
  18. ^ "MirrorWeb - Archivo web del Parlamento del Reino Unido". webarchive.parliament.uk . Consultado el 13 de octubre de 2020 .

enlaces externos