stringtranslate.com

Sitio de archivo

En el archivado web , un sitio de archivo es un sitio web que almacena información sobre páginas web del pasado para que cualquiera pueda verla.

Técnicas comunes

Dos técnicas comunes para archivar sitios web son utilizar un rastreador web o solicitar envíos de datos a los usuarios:

  1. Uso de un rastreador web : al utilizar un rastreador web (por ejemplo, Internet Archive ), el servicio no dependerá de una comunidad activa para obtener su contenido y, por lo tanto, podrá crear una base de datos más grande con mayor rapidez. Sin embargo, los rastreadores web solo pueden indexar y archivar información que el público haya elegido publicar en Internet o que esté disponible para ser rastreada, ya que los desarrolladores de sitios web y los administradores de sistemas tienen la capacidad de bloquear el acceso de los rastreadores web a [determinadas] páginas web (utilizando un archivo robots.txt ).
  2. Envíos de usuarios : si bien puede resultar difícil poner en marcha servicios de envío de usuarios debido a las tasas potencialmente bajas de envíos de usuarios, este sistema puede producir algunos de los mejores resultados. Al rastrear páginas web, solo se puede obtener la información que el público ha elegido publicar en línea; sin embargo, los posibles proveedores de contenido pueden no molestarse en publicar cierta información, suponiendo que nadie estaría interesado en ella, porque carecen de un lugar adecuado en el que publicarla o por cuestiones de derechos de autor. [1] Sin embargo, los usuarios que ven que alguien quiere su información pueden estar más dispuestos a enviarla.

Ejemplos

Grupos de Google

El 12 de febrero de 2001, Google adquirió los archivos de los grupos de discusión de Usenet de Deja.com y los convirtió en su servicio Google Groups . [2] Permiten a los usuarios buscar discusiones antiguas con la tecnología de búsqueda de Google, al mismo tiempo que permiten a los usuarios publicar en las listas de correo .

Archivo de Internet

Internet Archive está creando un compendio de sitios web y medios digitales . Desde 1996, el Archivo ha estado utilizando un rastreador web para crear su base de datos. Es uno de los sitios de archivo más conocidos.

Archivos de NBCUniversal

Los Archivos de NBCUniversal ofrecen acceso a contenido exclusivo de NBCUniversal y sus subsidiarias. Su sitio web, NBCUniversal Archives, permite ver fácilmente clips de noticias pasadas y recientes, y es un excelente ejemplo de archivo de noticias. [3]

Próximo punto

Nextpoint ofrece un SaaS automatizado basado en la nube para necesidades relacionadas con marketing, cumplimiento y litigios, incluido el descubrimiento electrónico.

Archivo PANDORA

PANDORA ( Pandora Archive ), fundada en 1996 por la Biblioteca Nacional de Australia , significa Preservación y acceso a recursos documentales en red de Australia, lo que resume su misión. Proporcionan un catálogo a largo plazo de publicaciones en línea y sitios web seleccionados creados por australianos o que tratan sobre un tema australiano. Utilizan su sistema de archivo digital PANDAS (PANDORA Digital Archiving System) para crear su catálogo.

archivosdetexto.com

textfiles.com es una gran biblioteca de archivos de texto antiguos mantenida por Jason Scott Sadofsky . Su misión es archivar los documentos antiguos que circulaban por los sistemas de tablones de anuncios (BBS) de su juventud y documentar las experiencias de otras personas en dichos sistemas.

Véase también

Referencias

  1. ^ Jinfang Niu (marzo-abril de 2012). "Una visión general del archivado web". Revista D-Lib . Vol. 18, núm. 3/4. doi : 10.1045/march2012-niu1 .
  2. ^ "Google adquiere el servicio de discusión Usenet y activos importantes de Deja.com". 12 de febrero de 2001.
  3. ^ Archivos de NBCUniversal