Organización de archivo web
La Internet Memory Foundation (anteriormente European Archive Foundation ) era una fundación sin fines de lucro cuyo propósito era archivar el contenido de la World Wide Web . Albergaba proyectos e investigaciones que incluían la preservación y protección de contenido de medios digitales en diversas formas para formar una biblioteca digital de contenido cultural. A partir de agosto de 2018, dejó de existir.
Historia
La institución sin fines de lucro European Archive Foundation se constituyó en 2004 en Ámsterdam . [1]
Un anuncio en la apertura de la Cross Media Week en Ámsterdam durante septiembre de 2006 incluyó una cita de Brewster Kahle , quien fundó el Internet Archive . [2]
Julien Masanès fue su primer director. [3]
Operando desde Ámsterdam y París , dijo que haría accesibles libremente colecciones de dominio público y archivos web. Masanès, anteriormente en la Bibliothèque nationale de France , editó un libro sobre archivo web en 2007. [4]
La organización de París se llama Internet Memory Research, que opera un servicio conocido como ArchiveTheNet. [5]
En diciembre de 2010, la Fundación cambió su nombre a Internet Memory Foundation para expresar su objetivo de preservar el contenido de Internet para las generaciones actuales y futuras. [6]
La fundación contaba con numerosos socios, entre ellos instituciones culturales e instituciones de investigación que colaboraban en sus proyectos de archivo web. Entre estos socios se encontraban los Archivos Nacionales del Reino Unido , [7] el Instituto Max Planck , la Universidad Técnica de Berlín , la Universidad de Southampton y el Institut Mines-Télécom . La fundación también era miembro del Consorcio Internacional para la Preservación de Internet . [8]
Investigación
La fundación participó en proyectos de investigación para mejorar las tecnologías de rastreo web , extracción de datos , minería de texto y conservación para apoyar el crecimiento y el uso de los archivos web. Sus proyectos fueron financiados por la Comisión Europea a través del Séptimo Programa Marco de Investigación .
- Los entornos de preservación escalables (SCAPE, proyecto n.º 270137) se desarrollaron entre febrero de 2011 y julio de 2014. [9] Estaba desarrollando una plataforma de preservación escalable y de código abierto.
- El proyecto TrendMiner, Proyecto N.° 287863, se desarrolló entre noviembre de 2011 y octubre de 2014, y supuso un gran avance en la minería de tendencias y el resumen de flujos de medios en tiempo real a gran escala y en varios idiomas. [10] Su objetivo era desarrollar herramientas para la minería de redes sociales, especialmente en varios idiomas.
- El proyecto Collect-All ARchives to COmmunity MEMories (ARCOMEM, número de proyecto 270239) se desarrolló entre enero de 2011 y diciembre de 2013. [11] Estudió la preservación de información web efímera, como la que se utiliza en sitios de redes sociales .
- Encuesta sobre archivado web en Europa realizada en diciembre de 2010. En ella se evaluó el estado de los proyectos de archivado web en distintas instituciones europeas. [12]
- El análisis longitudinal de datos de Web Archive (LAWA, proyecto n.º 258105) se llevó a cabo entre septiembre de 2010 y agosto de 2013. [13] El proyecto experimentó con análisis de datos a gran escala para su uso en el proyecto Future Internet Research and Experimentation .
- LivingKnowledge (Proyecto Nº 231126) se desarrolló entre febrero de 2009 y enero de 2012. [14] El objetivo era mejorar la navegación y la búsqueda en grandes conjuntos de datos multimodales.
- Living Web Archives (LiWA, Proyecto N.º 216267) funcionó desde febrero de 2008 hasta enero de 2011. [15] LiWA desarrolló métodos y herramientas de archivo web que apuntaban a capturar un archivo "vivo" más preciso de la web. [16] [17]
Colecciones
Audio y vídeo
Antes de centrarse en el archivo web, la European Archive Foundation había recopilado una de las mayores colecciones gratuitas en línea de música clásica (más de 800 piezas, desde Mozart a Dvorak) y películas de información pública del Gobierno británico, realizadas en colaboración con el Instituto Holandés de Sonido y Visión y los Archivos Nacionales del Reino Unido.
Recopilación web selectiva
La fundación ha archivado una instantánea de los sitios web de las instituciones de la UE, realizada en colaboración con el Archivo Histórico de la Unión Europea ubicado en Italia, un archivo de sitios web políticos de los 25 estados miembros de la UE, [18] capturados durante el debate constitucional europeo, y archivos (entre otros):
El rastreador web utilizado por el proyecto fue Heritrix versión 3. Heritrix genera recursos almacenados en un formato de archivo "contenedor" estandarizado, el archivo ARC (.arc). El archivo ARC se amplió al formato de archivo Web ARChive (.warc), que fue aprobado como estándar internacional en junio de 2009 (edición actual ISO 28500:2017). [20]
Véase también
Referencias
- ^ Mia Consalvo; Charles Ess, eds. (2011). El manual de estudios de Internet . John Wiley & Sons. pág. 31. ISBN 9781444342383.
- ^ Masanès, Julian (28 de septiembre de 2006). «Lanzamiento oficial de la Fundación Europea de Archivos» (Nota de prensa) .
- ^ "Lanzamiento oficial de la Fundación Europea de Archivos". Nota de prensa . 28 de septiembre de 2006 . Consultado el 7 de octubre de 2013 .
- ^ Julien Masanès, ed. (2007). Archivado web . Springer. ISBN 9783540463320.
- ^ "A propósito de: Internet Memory". Sitio web de ArchiveThe.net . Consultado el 7 de octubre de 2013 .(en francés)
- ^ "Internet Memory Foundation". Consorcio Internacional para la Preservación de Internet. Archivado desde el original el 9 de abril de 2014. Consultado el 8 de abril de 2014 .
- ^ Diana Maynard ; Mark A. Greenwood (16 de mayo de 2012). "Anotación semántica a gran escala, indexación y búsqueda en los Archivos Nacionales" (PDF) . Conferencia internacional sobre recursos lingüísticos y evaluación .
- ^ Miembros (Consorcio Internacional para la Preservación de Internet)
- ^ "Entornos de conservación escalables". Sitio web del Servicio de información sobre investigación y desarrollo comunitario . Unión Europea . Consultado el 7 de octubre de 2013 .
- ^ "Exploración de tendencias a gran escala y multilingüe y resumen de transmisiones de medios en tiempo real". Servicio de información sobre investigación y desarrollo comunitario . Unión Europea . Consultado el 25 de abril de 2016 .
- ^ "ARchive COmmunities MEMories". Sitio web del Servicio de Información sobre Investigación y Desarrollo Comunitario . Unión Europea . Consultado el 7 de octubre de 2013 .
- ^ "Archivado web en Europa: una encuesta proporcionada por la Internet Memory Foundation, 2010" (PDF) . 22 de marzo de 2011. Consultado el 8 de abril de 2014 .
- ^ "Análisis longitudinal de datos de Web Archive". Sitio web del Servicio de información sobre investigación y desarrollo comunitario . Unión Europea . Consultado el 7 de octubre de 2013 .
- ^ "LivingKnowledge Facts, Opinions and Bias in Time". Sitio web del Servicio de Información sobre Investigación y Desarrollo Comunitario . Unión Europea . Consultado el 7 de octubre de 2013 .
- ^ "Living Web Archives". Sitio web del Servicio de Información sobre Investigación y Desarrollo Comunitario . Unión Europea . Consultado el 7 de octubre de 2013 .
- ^ "Informe sobre "Tecnologías para los archivos de la Web viviente"" (PDF) . Informe final . 10 de febrero de 2011 . Consultado el 7 de octubre de 2013 .
- ^ Dimitar Denev; Arturas Mazeika; Marc Spaniol; Gerhard Weikum (abril de 2011). "El marco SHARC para la calidad de datos en el archivado web". Revista internacional sobre bases de datos muy grandes . 20 (2). Springer-Verlag: 183–207. doi :10.1007/s00778-011-0219-9. S2CID 18258396.
- ^ "El Archivo Histórico pone a prueba el archivado de los sitios web de las instituciones de la UE". IUE Archivos históricos de la Unión Europea . Consultado el 18 de agosto de 2021 .
- ^ Adrian Brown (2006). Archivado de sitios web: una guía práctica para profesionales de la gestión de la información . Facet Publishing. págs. 17-18. ISBN. 9781856045537.
- ^ "ISO 28500:2017".
Enlaces externos
- Conocimiento vivo
- LAWA, Análisis longitudinal de datos de archivos web
- ARCOMEM, Archivos, museos y bibliotecas europeas en la era de la web social
- SCAPE, Entornos de conservación escalables
- LiWA, Archivos Web Vivientes