stringtranslate.com

Máquina Wayback

Wayback Machine es un archivo digital de la World Wide Web fundado por Internet Archive , una organización estadounidense sin fines de lucro con sede en San Francisco, California . Creado en 1996 y lanzado al público en 2001, permite a los usuarios volver "al pasado" para ver cómo lucían los sitios web en el pasado. Sus fundadores, Brewster Kahle y Bruce Gilliat , desarrollaron Wayback Machine para proporcionar "acceso universal a todo el conocimiento" mediante la preservación de copias archivadas de páginas web desaparecidas. [2]

Lanzada el 10 de mayo de 1996, Wayback Machine había guardado más de 38,2 mil millones de páginas web a fines de 2009. Al 3 de enero de 2024, Wayback Machine ha archivado más de 860 mil millones de páginas web y más de 99 petabytes de datos. [3] [4]

Historia

Wayback Machine comenzó a archivar páginas web almacenadas en caché en 1996. Una de las primeras páginas conocidas se archivó el 10 de mayo de 1996 en( UTC ). [5]

Los fundadores de Internet Archive, Brewster Kahle y Bruce Gilliat, lanzaron la Wayback Machine en San Francisco , California , [6] en octubre de 2001, [7] [8] principalmente para abordar el problema de la desaparición del contenido web cada vez que se modifica o cuando se cierra un sitio web. [9] El servicio permite a los usuarios ver versiones archivadas de páginas web a lo largo del tiempo, lo que el archivo llama un "índice tridimensional". [10] Kahle y Gilliat crearon la máquina con la esperanza de archivar todo Internet y proporcionar "acceso universal a todo el conocimiento". [11] El nombre "Wayback Machine" es una referencia a un dispositivo ficticio de viaje en el tiempo en la caricatura animada Las aventuras de Rocky y Bullwinkle y sus amigos de la década de 1960. [12] [13] [14] En un segmento de la caricatura titulado "La improbable historia de Peabody", los personajes Mister Peabody y Sherman usan la " Wayback Machine " para presenciar y participar en eventos históricos famosos. [ cita requerida ]

Desde 1996 hasta 2001, la información se mantuvo en cinta digital, y Kahle permitió ocasionalmente a los investigadores y científicos acceder a la "torpe" base de datos . [15] Cuando el archivo llegó a su quinto aniversario en 2001, se dio a conocer y abrió al público en una ceremonia en la Universidad de California, Berkeley . [16] Cuando se lanzó Wayback Machine, ya contenía más de 10 mil millones de páginas archivadas. [17] Los datos se almacenan en el gran clúster de nodos Linux de Internet Archive. [11] Revisa y archiva nuevas versiones de sitios web en ocasiones (ver detalles técnicos a continuación). [18] Los sitios también se pueden capturar manualmente ingresando la URL de un sitio web en el cuadro de búsqueda, siempre que el sitio web permita a Wayback Machine " rastrearlo " y guardar los datos. [19]

Historial de eventos recientes

Información técnica

El software de Wayback Machine ha sido desarrollado para " rastrear " la Web y descargar toda la información y los archivos de datos de acceso público en las páginas web, la jerarquía Gopher , el sistema de tablón de anuncios Netnews (Usenet) y el software descargable. [27] La ​​información recopilada por estos "rastreadores" no incluye toda la información disponible en Internet, ya que gran parte de los datos están restringidos por el editor o almacenados en bases de datos a las que no se puede acceder. Para superar las inconsistencias en los sitios web parcialmente almacenados en caché, Archive-It.org fue desarrollado en 2005 por Internet Archive como un medio para permitir a las instituciones y a los creadores de contenido recolectar y preservar voluntariamente colecciones de contenido digital y crear archivos digitales. [28]

Los rastreos provienen de varias fuentes, algunos importados de terceros y otros generados internamente por el Archivo. [18] Por ejemplo, los rastreos son aportados por la Fundación Sloan y Alexa , los rastreos son ejecutados por Internet Archive en nombre de NARA y la Fundación para la Memoria de Internet , espejos de Common Crawl . [18] Los "Rastreos de la Worldwide Web" se llevan a cabo desde 2010 y capturan la Web global. [18] [29]

Los documentos y recursos se almacenan con URL con sello de tiempo, como 20241015212330. Los recursos individuales de las páginas, como imágenes, hojas de estilo y scripts, así como los hipervínculos salientes , se vinculan con el sello de tiempo de la página que se está viendo actualmente, por lo que se redirigen automáticamente a sus capturas individuales más cercanas en el tiempo. [30]

La frecuencia de las capturas de instantáneas varía según el sitio web. [18] Los sitios web en los "Rastreos de la Worldwide Web" se incluyen en una "lista de rastreo", y el sitio se archiva una vez por rastreo. [18] Un rastreo puede tardar meses o incluso años en completarse, según el tamaño. [18] Por ejemplo, el "Rastreo amplio número 13" comenzó el 9 de enero de 2015 y se completó el 11 de julio de 2016. [31] Sin embargo, puede haber múltiples rastreos en curso en un momento dado, y un sitio puede estar incluido en más de una lista de rastreo, por lo que la frecuencia con la que se rastrea un sitio varía ampliamente. [18]

A partir de octubre de 2019, los usuarios están limitados a 15 solicitudes y recuperaciones de archivos por minuto. [32] [ ¿Por qué? ]

Capacidad de almacenamiento y crecimiento

A medida que la tecnología se ha ido desarrollando a lo largo de los años, la capacidad de almacenamiento de Wayback Machine ha ido creciendo. En 2003, tras sólo dos años de acceso público, Wayback Machine crecía a un ritmo de 12 terabytes al mes. Los datos se almacenan en sistemas de bastidores PetaBox diseñados a medida por el personal de Internet Archive. El primer bastidor de 100 TB entró en pleno funcionamiento en junio de 2004, aunque pronto quedó claro que necesitarían mucho más almacenamiento. [33] [34]

Internet Archive migró su arquitectura de almacenamiento personalizada a Sun Open Storage en 2009 y alberga un nuevo centro de datos en un Sun Modular Datacenter en el campus de Sun Microsystems en California. [35] En 2009 , Wayback Machine contenía aproximadamente tres petabytes de datos y crecía a un ritmo de 100 terabytes cada mes. [36]

En 2011 se puso a disposición del público una nueva versión mejorada de Wayback Machine, con una interfaz actualizada y un índice más actualizado de contenido archivado, en la que las capturas aparecen en un diseño de calendario con círculos cuyo ancho visualiza el número de rastreos cada día, pero sin marcado de duplicados con asteriscos o una página de búsqueda avanzada. [37] [38] Se agregó una barra de herramientas superior para facilitar la navegación entre capturas. Un gráfico de barras visualiza la frecuencia de capturas por mes a lo largo de los años. [39] Posteriormente se agregaron características como "Cambios", "Resumen" y un mapa gráfico del sitio.

En marzo de ese año, se dijo en el foro de Wayback Machine que "la versión Beta de la nueva Wayback Machine tiene un índice más completo y actualizado de todos los materiales rastreados hasta 2010, y seguirá actualizándose regularmente. El índice que impulsa la Wayback Machine clásica sólo tiene un poco de material posterior a 2008, y no se planean más actualizaciones del índice, ya que se eliminará gradualmente este año". [40] También en 2011, Internet Archive instaló su sexto par de bastidores PetaBox que aumentaron la capacidad de almacenamiento de Wayback Machine en 700 terabytes. [41]

En enero de 2013, la empresa anunció un hito revolucionario de 240 mil millones de URL. [42]

En octubre de 2013, la empresa introdujo la función "Guardar una página" [43] [44] que permite a cualquier usuario de Internet archivar el contenido de una URL y generar rápidamente un enlace permanente , a diferencia de la función liveweb anterior .

En diciembre de 2014, la Wayback Machine contenía 435 mil millones de páginas web (casi nueve petabytes de datos) y crecía a un ritmo de unos 20 terabytes por semana. [17] [45] [46]

En julio de 2016, se informó que Wayback Machine contenía alrededor de 15 petabytes de datos. [47]

En septiembre de 2018, la Wayback Machine contenía más de 25 petabytes de datos. [48] [49]

En diciembre de 2020, la Wayback Machine contenía más de 70 petabytes de datos. [50]

Internet Archive, a fecha de enero de 2024, certifica haber almacenado más de 99 petabytes de datos hasta el momento. [3] [4]

API de Wayback Machine

El servicio Wayback Machine ofrece tres API públicas: SavePageNow, Availability y CDX. [53] SavePageNow se puede utilizar para archivar páginas web. La API Availability sirve para comprobar el estado de disponibilidad del archivo de una página web, [54] para comprobar si existe o no un archivo para la página web. La API CDX sirve para realizar consultas, filtrado y análisis complejos de los datos capturados. [55] [56]

Política de exclusión de sitios web

Históricamente, Wayback Machine ha respetado el estándar de exclusión de robots (robots.txt) para determinar si un sitio web sería rastreado o, si ya lo estaba, si sus archivos serían visibles públicamente. Los propietarios de sitios web tenían la opción de optar por no participar en Wayback Machine mediante el uso de robots.txt. Se aplicaban las reglas de robots.txt de forma retroactiva; si un sitio bloqueaba Internet Archive, cualquier página archivada previamente del dominio también dejaba de estar disponible de inmediato. Además, Internet Archive afirmó que "a veces, el propietario de un sitio web se pone en contacto con nosotros directamente y nos pide que dejemos de rastrear o archivar un sitio. Nosotros cumplimos con estas solicitudes". [57] Además, el sitio web dice: "Internet Archive no está interesado en preservar u ofrecer acceso a sitios web u otros documentos de Internet de personas que no quieren que sus materiales estén en la colección". [58] [59]

El 17 de abril de 2017, aparecieron informes de sitios que habían dejado de funcionar y se habían convertido en dominios estacionados que usaban robots.txt para excluirse de los motores de búsqueda, lo que resultó en que se los excluyera inadvertidamente de Wayback Machine. [60] Después de esto, Internet Archive cambió la política para requerir una solicitud de exclusión explícita para eliminarlo de Wayback Machine. [30]

Política de archivo de Oakland

La política de exclusión retroactiva de Wayback se basa en parte en las Recomendaciones para gestionar solicitudes de eliminación y preservar la integridad de los archivos publicadas por la Escuela de Gestión de la Información y Sistemas de la Universidad de California, Berkeley en 2002, que otorgan al propietario de un sitio web el derecho a bloquear el acceso a los archivos del sitio. [61] Wayback ha cumplido con esta política para ayudar a evitar litigios costosos. [62]

La política de exclusión retroactiva de Wayback comenzó a relajarse en 2017, cuando dejó de respetar a los robots en los sitios web del gobierno y del ejército de los EE. UU. tanto por rastrear como por mostrar páginas web. A partir de abril de 2017, Wayback ignora el archivo robots.txt de manera más amplia, no solo en los sitios web del gobierno de los EE. UU. [63] [64] [65] [66]

Usos

Desde su lanzamiento público en 2001, Wayback Machine ha sido estudiada por académicos tanto por las formas en que almacena y recopila datos como por las páginas reales contenidas en su archivo. Hasta 2013, los académicos habían escrito alrededor de 350 artículos en Wayback Machine, principalmente de los campos de la tecnología de la información , la bibliotecología y las ciencias sociales . Los académicos de las ciencias sociales han utilizado Wayback Machine para analizar cómo el desarrollo de sitios web desde mediados de la década de 1990 hasta la actualidad ha afectado al crecimiento de la empresa. [17]

Cuando Wayback Machine archiva una página, normalmente incluye la mayoría de los hipervínculos, con lo que mantiene activos esos enlaces cuando la inestabilidad de Internet podría haberlos roto con la misma facilidad. Investigadores de la India estudiaron la eficacia de la capacidad de Wayback Machine para guardar hipervínculos en publicaciones académicas en línea y descubrieron que guardaba algo más de la mitad de ellos. [67]

"Los periodistas utilizan Wayback Machine para ver sitios web muertos, informes de noticias anticuados y cambios en los contenidos de los sitios web. Su contenido se ha utilizado para responsabilizar a los políticos y exponer mentiras en el campo de batalla". [68] En 2014, una página de redes sociales archivada de Igor Girkin , un líder rebelde separatista en Ucrania, lo mostró alardeando de que sus tropas habían derribado un supuesto avión militar ucraniano antes de que se supiera que el avión en realidad era un avión civil de Malaysian Airlines ( Vuelo 17 de Malaysia Airlines ), después de lo cual eliminó la publicación y culpó al ejército de Ucrania por derribar el avión. [68] [69] En 2017, la Marcha por la Ciencia se originó a partir de una discusión en Reddit que indicaba que alguien había visitado Archive.org y descubrió que todas las referencias al cambio climático habían sido eliminadas del sitio web de la Casa Blanca. En respuesta, un usuario comentó: "Es necesario que haya una Marcha de los científicos en Washington". [70] [71] [72]

Además, el sitio se utiliza mucho para verificación, proporcionando acceso a referencias y creación de contenido por parte de los editores de Wikipedia . [73] Cuando se agregan nuevas URL a Wikipedia, Internet Archive las ha estado archivando. [73]

En septiembre de 2020, se anunció una asociación con Cloudflare para archivar automáticamente los sitios web atendidos a través de su servicio "Always Online", lo que también le permitirá dirigir a los usuarios a su copia del sitio si no puede comunicarse con el host original. [74]

Limitaciones

En 2014, había un retraso de seis meses entre el momento en que se rastreaba un sitio web y el momento en que estaba disponible para su visualización en Wayback Machine. [75] A partir de 2024, el retraso es de entre 3 y 10 horas. [30] Wayback Machine ofrece solo funciones de búsqueda limitadas. Su función "Búsqueda de sitios" permite a los usuarios encontrar un sitio basándose en palabras que lo describen, en lugar de palabras que se encuentran en las propias páginas web. [76]

Wayback Machine no incluye todas las páginas web creadas debido a las limitaciones de su rastreador web. Wayback Machine no puede archivar por completo las páginas web que contienen funciones interactivas como plataformas Flash y formularios escritos en JavaScript y aplicaciones web progresivas , porque esas funciones requieren interacción con el sitio web anfitrión. Esto significa que, desde aproximadamente el 9 de julio de 2013, Wayback Machine no ha podido mostrar los comentarios de YouTube al guardar las páginas de reproducción de los videos, ya que, según el Equipo de Archivo, los comentarios ya no se "cargan dentro de la página misma". [77] El rastreador web de Wayback Machine tiene dificultades para extraer cualquier cosa que no esté codificada en HTML o una de sus variantes, lo que a menudo puede resultar en hipervínculos rotos e imágenes faltantes. Debido a esto, el rastreador web no puede archivar "páginas huérfanas" que no estén vinculadas a otras páginas. [76] [78] El rastreador de Wayback Machine solo sigue una cantidad predeterminada de hipervínculos en función de un límite de profundidad preestablecido, por lo que no puede archivar todos los hipervínculos en cada página. [29]

En prueba legal

Litigios civiles

Netbula LLC contra Chordiant Software Inc.

En un caso de 2009, Netbula, LLC v. Chordiant Software Inc. , el demandado Chordiant presentó una moción para obligar a Netbula a deshabilitar el archivo robots.txt en su sitio web que estaba causando que Wayback Machine eliminara retroactivamente el acceso a versiones anteriores de páginas que había archivado del sitio de Netbula, páginas que Chordiant creía que respaldarían su caso. [79]

Netbula se opuso a la moción con el argumento de que los demandados estaban pidiendo modificar el sitio web de Netbula y que deberían haber citado directamente a Internet Archive para que publicara las páginas. [80] Sin embargo, un empleado de Internet Archive presentó una declaración jurada en apoyo de la moción de Chordiant, afirmando que no podía producir las páginas web por ningún otro medio "sin una carga, un gasto y una interrupción considerables de sus operaciones". [79]

El magistrado Howard Lloyd del Distrito Norte de California, División de San José, rechazó los argumentos de Netbula y les ordenó desactivar temporalmente el bloqueo de robots.txt para permitir que Chordiant recuperara las páginas archivadas que buscaban. [79]

Telewizja Polska USA, Inc. contra Echostar Satellite

En un caso de octubre de 2004, Telewizja Polska USA, Inc. v. Echostar Satellite , No. 02 C 3293, 65 Fed. R. Evid. Serv. 673 (ND Ill. 15 de octubre de 2004), un litigante intentó utilizar los archivos de Wayback Machine como fuente de evidencia admisible, quizás por primera vez. Telewizja Polska es el proveedor de TVP Polonia y EchoStar opera la red Dish Network . Antes de los procedimientos del juicio, EchoStar indicó que tenía la intención de ofrecer instantáneas de Wayback Machine como prueba del contenido pasado del sitio web de Telewizja Polska. Telewizja Polska presentó una moción in limine para suprimir las instantáneas sobre la base de rumores y fuente no autenticada, pero el juez magistrado Arlander Keys rechazó la afirmación de Telewizja Polska de rumores y denegó la moción in limine de TVP para excluir la evidencia en el juicio. [81] [82] Sin embargo, en el juicio, el juez de primera instancia Ronald Guzmán, juez del Tribunal de Distrito, revocó las conclusiones del magistrado Keys y sostuvo que ni la declaración jurada del empleado de Internet Archive ni las páginas subyacentes (es decir, el sitio web de Telewizja Polska) eran admisibles como prueba. El juez Guzmán razonó que la declaración jurada del empleado contenía tanto testimonios de oídas como declaraciones de apoyo no concluyentes, y que la supuesta página web y las impresiones no eran auto-autenticables. [83] [84]

Ley de patentes

La Oficina de Patentes y Marcas de los Estados Unidos y la Oficina Europea de Patentes aceptan las fechas de publicación del Archivo de Internet como prueba de cuándo una determinada página web estuvo accesible al público. Estas fechas se utilizan para determinar si una página web está disponible como técnica anterior , por ejemplo, al examinar una solicitud de patente. [85]

Limitaciones de utilidad

Existen limitaciones técnicas para archivar un sitio web y, como consecuencia, las partes contrarias en un litigio pueden hacer un uso indebido de los resultados proporcionados por los archivos de sitios web. Este problema puede verse exacerbado por la práctica de presentar capturas de pantalla de páginas web en quejas, respuestas o informes de testigos expertos cuando los enlaces subyacentes no están expuestos y, por lo tanto, pueden contener errores. Por ejemplo, los archivos como Wayback Machine no completan formularios y, por lo tanto, no incluyen el contenido de bases de datos de comercio electrónico que no sean RESTful en sus archivos. [86]

Estatus legal

En Europa, Wayback Machine podría interpretarse como una violación de las leyes de derechos de autor . Sólo el creador de contenidos puede decidir dónde se publica o se duplica su contenido, por lo que el Archivo tendría que eliminar páginas de su sistema a petición del creador. [87] Las políticas de exclusión de Wayback Machine se pueden encontrar en la sección de preguntas frecuentes del sitio. [88]

Se han presentado algunos casos contra Internet Archive específicamente por sus esfuerzos de archivado de Wayback Machine.

Cuestiones jurídicas sobre contenido archivado

Cienciología

A finales de 2002, el Archivo de Internet eliminó de la Wayback Machine varios sitios que criticaban a la Cienciología . [89] Un mensaje de error indicaba que esto se debía a una "solicitud del propietario del sitio". [90] Más tarde, se aclaró que los abogados de la Iglesia de la Cienciología habían exigido la eliminación y que los propietarios del sitio no querían que se eliminara su material. [91]

Defensores de la salud, Inc.

En 2003, Harding Earley Follmer & Frailey defendió a un cliente de una disputa de marca registrada utilizando la Wayback Machine del Archive. Los abogados pudieron demostrar que las reclamaciones realizadas por el demandante no eran válidas, basándose en el contenido de su sitio web de varios años antes. El demandante, Healthcare Advocates, modificó su demanda para incluir al Internet Archive, acusando a la organización de infracción de derechos de autor, así como de violaciones de la DMCA y la Ley de Abuso y Fraude Informático . Healthcare Advocates afirmó que, dado que habían instalado un archivo robots.txt en su sitio web, incluso si después de que se presentó la demanda inicial, el Archive debería haber eliminado todas las copias anteriores del sitio web del demandante de la Wayback Machine, sin embargo, algunos materiales continuaron siendo visibles públicamente en Wayback. [92] La demanda se resolvió fuera de los tribunales después de que Wayback solucionara el problema. [93]

Suzanne Shell

La activista Suzanne Shell presentó una demanda en diciembre de 2005, exigiendo a Internet Archive que le pagara 100.000 dólares estadounidenses por archivar su sitio web profane-justice.org entre 1999 y 2004. [94] [95] Internet Archive presentó una acción de juicio declaratorio en el Tribunal de Distrito de los Estados Unidos para el Distrito Norte de California el 20 de enero de 2006, buscando una determinación judicial de que Internet Archive no violó los derechos de autor de Shell . Shell respondió y presentó una contrademanda contra Internet Archive por archivar su sitio, lo que, según ella, viola sus términos de servicio . [96] El 13 de febrero de 2007, un juez del Tribunal de Distrito de los Estados Unidos para el Distrito de Colorado desestimó todas las contrademandas excepto el incumplimiento del contrato . [95] Internet Archive no solicitó desestimar las reclamaciones por infracción de derechos de autor que Shell afirmó que surgieron de sus actividades de copia, que también seguirían adelante. [97]

El 25 de abril de 2007, Internet Archive y Suzanne Shell anunciaron conjuntamente el acuerdo de su demanda. [94] Internet Archive afirmó que "...no tiene interés en incluir en Wayback Machine materiales de personas que no desean que su contenido web sea archivado. Reconocemos que la Sra. Shell tiene un derecho de autor válido y exigible sobre su sitio web y lamentamos que la inclusión de su sitio web en Wayback Machine haya dado lugar a este litigio". Shell afirmó: "Respeto el valor histórico del objetivo de Internet Archive. Nunca tuve la intención de interferir con ese objetivo ni causarle ningún daño". [98]

Daniel Davydiuk

Entre 2013 y 2016, un actor porno llamado Daniel Davydiuk intentó eliminar imágenes archivadas de sí mismo del archivo de Wayback Machine, primero enviando múltiples solicitudes DMCA al archivo y luego apelando al Tribunal Federal de Canadá . [99] [100] [101] Las imágenes fueron eliminadas del sitio web en 2017.

FlexiSpy

En 2018, los archivos del sitio web de la aplicación de stalkerware FlexiSpy fueron eliminados de Wayback Machine. La empresa afirmó haberse puesto en contacto con Internet Archive, presumiblemente para eliminar los archivos de su sitio web. [102]

Censura y otras amenazas

Archive.org está bloqueado en China . [103] [104] [105] Internet Archive fue bloqueado en su totalidad en Rusia en 2015-16, aparentemente por albergar un video de divulgación de la Jihad. [68] [106] [107] Desde 2016, el sitio web ha vuelto a estar disponible en su totalidad, aunque en 2016 los lobbystas comerciales rusos demandaron a Internet Archive para prohibirlo por motivos de derechos de autor. [108]

En marzo de 2015, se publicó que los investigadores de seguridad se dieron cuenta de la amenaza que representaba el alojamiento involuntario por parte del servicio de archivos binarios maliciosos desde sitios archivados. [109] [110]

Alison Macrina , directora del Library Freedom Project , señala que "si bien los bibliotecarios valoramos profundamente la privacidad individual, también nos oponemos firmemente a la censura". [68]

Hay al menos un caso en el que un artículo fue eliminado del archivo poco después de haber sido eliminado de su sitio web original. Un reportero del Daily Beast había escrito un artículo que revelaba que varios atletas olímpicos eran homosexuales en 2016 después de haber creado un perfil falso haciéndose pasar por un hombre gay en una aplicación de citas. El Daily Beast eliminó el artículo después de que fuera recibido con furor generalizado; poco después, el Internet Archive pronto hizo lo mismo, pero declaró enfáticamente que lo hicieron sin ninguna otra razón que proteger la seguridad de los atletas revelados. [68]

Otras amenazas incluyen desastres naturales, [111] destrucción (tanto remota como física), [112] manipulación del contenido del archivo, leyes de derechos de autor problemáticas, [113] y vigilancia de los usuarios del sitio. [114]

Alexander Rose, director ejecutivo de la Long Now Foundation , sospecha que en el largo plazo de varias generaciones "casi nada" sobrevivirá de manera útil, y afirma: "Si tenemos continuidad en nuestra civilización tecnológica, sospecho que muchos de los datos desnudos seguirán siendo localizables y buscables. Pero sospecho que casi nada del formato en el que se entregaron será reconocible" porque los sitios "con sistemas de gestión de contenido profundos como Drupal, Ruby y Django" son más difíciles de archivar. [115]

En 2016, en un artículo que reflexiona sobre la preservación del conocimiento humano, The Atlantic comentó que Internet Archive, que se describe a sí mismo como construido para el largo plazo, [116] "está trabajando frenéticamente para capturar datos antes de que desaparezcan sin ninguna infraestructura a largo plazo de la que hablar". [117]

En septiembre de 2024, Internet Archive sufrió una filtración de datos que expuso 31 millones de registros que contenían información personal, incluidas direcciones de correo electrónico y contraseñas cifradas . El 9 de octubre de 2024, el sitio dejó de funcionar debido a un ataque de denegación de servicio distribuido . [118] [119]

Véase también

Referencias

  1. ^ Ong, Thuy (9 de agosto de 2017). "Wayback Machine ha sido bloqueada en India". The Verge .
  2. ^ Kahle, Brewster (23 de noviembre de 2005). «Acceso universal a todo el conocimiento». Archivo de Internet . Archivado desde el original el 14 de agosto de 2022. Consultado el 5 de junio de 2022 .
  3. ^ ab "Internet Archive: Wayback Machine". web.archive.org . Archivado desde el original el 13 de marzo de 2023.El número actual de páginas archivadas se puede ver en la página de inicio del archivo.
  4. ^ ab Kahle, Brewster. "Un mensaje del fundador de Internet Archive, Brewster Kahle". Internet Archive . Consultado el 10 de enero de 2024 .
  5. ^ PepsiCo , Inc. (10 de mayo de 1996). «Página de inicio de PepsiCo». Internet Archive /Wayback Machine . Archivado desde el original el 10 de mayo de 1996. Consultado el 8 de octubre de 2022 .
  6. ^ "Información general de Wayback Machine". Archivo de Internet . Archivado desde el original el 5 de diciembre de 2019. Consultado el 2 de marzo de 2021 .
  7. ^ "WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools". WHOIS . Archivado desde el original el 14 de mayo de 2020 . Consultado el 13 de marzo de 2016 .
  8. ^ "InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools". WHOIS . Archivado desde el original el 12 de mayo de 2020 . Consultado el 13 de marzo de 2016 .
  9. ^ Notess, Greg R. (marzo-abril de 2002). "The Wayback Machine: el archivo de la Web". En línea . 26 : 59–61. INIST 13517724. 
  10. ^ "The Wayback Machine", Preguntas frecuentes , archivado del original el 18 de septiembre de 2018 , consultado el 18 de septiembre de 2018
  11. ^ ab "20,000 Hard Drives on a Mission". Blogs de Internet Archive . 25 de octubre de 2016. Archivado desde el original el 20 de octubre de 2018. Consultado el 15 de octubre de 2018 .
  12. ^ Green, Heather (28 de febrero de 2002). "Una biblioteca tan grande como el mundo". BusinessWeek . Archivado desde el original el 20 de diciembre de 2011.
  13. ^ Tong, Judy (8 de septiembre de 2002). «Parte responsable: Brewster Kahle; Una biblioteca de la Web, en la Web». The New York Times . Archivado desde el original el 20 de febrero de 2011. Consultado el 15 de agosto de 2011 .
  14. ^ Keith Scott (2000). El alce que rugió: la historia de Jay Ward, Bill Scott, una ardilla voladora y un alce parlante . St. Martin's Press . ISBN 0-312-19922-8 
  15. ^ Cook, John (1 de noviembre de 2001). «Web site takes you way back in Internet history» (Un sitio web te lleva al pasado en la historia de Internet). Seattle Post-Intelligencer . Archivado desde el original el 12 de agosto de 2014. Consultado el 15 de agosto de 2011 .
  16. ^ Mayfield, Kendra (28 de octubre de 2001). «Wayback Goes Way Back on Web». Wired . Archivado desde el original el 16 de octubre de 2017. Consultado el 16 de octubre de 2017 .
  17. ^ abc Arora, Sanjay K.; Li, Yin; Youtie, Jan; Shapira, Philip (5 de mayo de 2015). "Uso de la Wayback Machine para extraer información de sitios web en las ciencias sociales: un recurso metodológico". Revista de la Asociación para la Ciencia y la Tecnología de la Información . 67 (8): 1904–1915. doi : 10.1002/asi.23503 . ISSN  2330-1635.
  18. ^ abcdefgh Leetaru, Kalev (28 de enero de 2016). «The Internet Archive Turns 20: A Behind the Scenes at Archiving the Web» (El Archivo de Internet cumple 20 años: una mirada tras bastidores al archivado de la Web) . Forbes . Archivado desde el original el 16 de octubre de 2017. Consultado el 16 de octubre de 2017 .
  19. ^ "Internet Archive: Wayback Machine". Internet Archive . Archivado desde el original el 3 de enero de 2014. Consultado el 15 de octubre de 2018 .
  20. ^ Graham, Mark (30 de octubre de 2020). "Verificaciones de hechos y contexto de las páginas de Wayback Machine". Blogs de Internet Archive . Consultado el 10 de octubre de 2024 .
  21. ^ Los intentos de "guardar página ahora" en dominios como tpc.googlesyndication.com o s0.2mdn.net o atdmt.com o adbrite.com dan como resultado "Esta URL está en nuestra lista de bloqueo y no se puede capturar".
  22. ^ "25.º aniversario de Internet Archive: acceso universal a todo el conocimiento" . Consultado el 10 de octubre de 2024. Con motivo del 25.º aniversario de Internet Archive , te invitamos a realizar un viaje que va desde el pasado hasta el presente, a través de los momentos cruciales en los que el conocimiento se volvió más accesible para todos.
  23. ^ "Wayforward Machine • Visita el futuro de Internet". Wayforward Machine . Consultado el 11 de octubre de 2024 .
  24. ^ Brewster, Kahle (10 de octubre de 2024). "Los servicios están fuera de línea mientras los examinamos y reforzamos". Twitter . Consultado el 11 de octubre de 2024 .
  25. ^ Winder, Davey (10 de octubre de 2024). "Historial de Internet pirateado, Wayback Machine inactivo: 31 millones de contraseñas robadas". Forbes . Consultado el 15 de octubre de 2024 .
  26. ^ Warren, Tom (14 de octubre de 2024). «Internet Archive vuelve a ser un servicio de solo lectura tras los ciberataques». The Verge . Consultado el 15 de octubre de 2024 .
  27. ^ Kahle, Brewster. «Archiving the Internet». Scientific American – Número de marzo de 1997. Archivado desde el original el 3 de abril de 2012. Consultado el 19 de agosto de 2011 .
  28. ^ Kaplan, Jeff (27 de octubre de 2014). «Archive-It: Crawling the Web Together» (Archivo-It: Recorriendo la Web juntos). Blogs de Internet Archive . Archivado desde el original el 12 de octubre de 2017. Consultado el 16 de octubre de 2017 .
  29. ^ ab "Rastreos en la Worldwide Web". Archivo de Internet. Archivado desde el original el 19 de octubre de 2017. Consultado el 16 de octubre de 2017 .
  30. ^ abc "Usando The Wayback Machine". Archivo de Internet . Consultado el 25 de septiembre de 2024 .
  31. ^ "Wide Crawl Number 13". Archivo de Internet. Archivado desde el original el 19 de octubre de 2017. Consultado el 16 de octubre de 2017 .
  32. ^ "Demasiadas solicitudes". Internet Archive. 10 de noviembre de 2019. Consultado el 27 de noviembre de 2021 .
  33. ^ "Petabox". Internet Archive . Consultado el 25 de octubre de 2018 .
  34. ^ Kanellos, Michael (29 de julio de 2005). "Gran capacidad de almacenamiento a bajo precio". CNET News. Archivado desde el original el 3 de abril de 2007. Consultado el 29 de julio de 2007 .
  35. ^ "Internet Archive y Sun Microsystems crean una historia viva de Internet". Sun Microsystems . 25 de marzo de 2009. Archivado desde el original el 26 de marzo de 2009 . Consultado el 27 de marzo de 2009 .
  36. ^ Mearian, Lucas (19 de marzo de 2009). «Internet Archive to unveil massive Wayback Machine data center». Computerworld. Archivado desde el original el 23 de marzo de 2009. Consultado el 22 de marzo de 2009 .
  37. ^ gojomo (24 de enero de 2011). «Wayback Machine actualizado en fase de pruebas beta». Archivado desde el original el 23 de agosto de 2011. Consultado el 19 de agosto de 2011 .
  38. ^ "Búsqueda avanzada". Wayback Machine . Archivado desde el original el 31 de enero de 2010. Consultado el 3 de abril de 2022 .
  39. ^ "¿Cuál es la diferencia entre la Wayback Machine clásica y la nueva versión Beta?". Archivado desde el original el 25 de diciembre de 2010. Consultado el 17 de noviembre de 2021 .
  40. ^ "Beta Wayback Machine, en el foro". Archivado desde el original el 17 de abril de 2014 . Consultado el 16 de abril de 2014 .
  41. ^ "Foros de Internet Archive: el sexto par de bastidores entra en servicio: se utilizan más de 2 PB de espacio de datos". Internet Archive . Archivado desde el original el 24 de octubre de 2016 . Consultado el 25 de octubre de 2018 .
  42. ^ "Wayback Machine: ahora con 240.000.000.000 de URLs | Blogs de Internet Archive". 9 de enero de 2013. Archivado desde el original el 14 de abril de 2014. Consultado el 16 de abril de 2014 .
  43. ^ Rossi, Alexis (25 de octubre de 2013). "Reparación de enlaces rotos en Internet". Internet Archive . San Francisco, CA, EE. UU.: Equipo de colecciones, Internet Archive. Archivado desde el original el 7 de noviembre de 2014 . Consultado el 25 de marzo de 2015 . Hemos agregado la capacidad de archivar una página instantáneamente y recuperar una URL permanente para esa página en Wayback Machine. Este servicio permite que cualquier persona (editores de Wikipedia, académicos, profesionales legales, estudiantes o cocineros caseros como yo) cree una URL estable para citar, compartir o marcar como favorita cualquier información a la que desee seguir teniendo acceso en el futuro.
  44. ^ Baron, Alexander (23 de octubre de 2013). «La nueva Wayback Machine de Internet Archive ya está en línea». Revista Digital . Archivado desde el original el 19 de noviembre de 2020. Consultado el 19 de noviembre de 2020 .
  45. ^ "Preguntas frecuentes sobre Internet Archive". Archivado desde el original el 21 de octubre de 2009. Consultado el 17 de enero de 2015 .
  46. ^ "Preguntas frecuentes sobre Internet Archive". 18 de diciembre de 2014. Archivado desde el original el 18 de diciembre de 2014. Consultado el 13 de diciembre de 2018 .
  47. ^ "¿Puede la manipulación de los grandes datos cambiar la forma de pensar del mundo?". The National . Archivado desde el original el 12 de enero de 2017. Consultado el 14 de mayo de 2017 .
  48. ^ Crockett, Zachary (28 de septiembre de 2018). «Dentro de Wayback Machine, la cápsula del tiempo de Internet». The Hustle . Archivado desde el original el 2 de octubre de 2018. Consultado el 26 de octubre de 2018 .
  49. ^ Heffernan, Virginia (18 de septiembre de 2018). "Las cosas se rompen y se deterioran en Internet: eso es algo bueno" . WIRED . Archivado desde el original el 25 de septiembre de 2018. Consultado el 26 de octubre de 2018 .
  50. ^ "Dona al Internet Archive: Biblioteca digital de libros, películas, música y Wayback Machine gratuitos y disponibles en préstamo @internetarchive". adafruit. 1 de diciembre de 2020. Archivado desde el original el 2 de diciembre de 2020. Consultado el 2 de diciembre de 2020 .
  51. ^ michelle (9 de mayo de 2014). "Wayback Machine alcanza los 400.000.000.000". Internet Archive. Archivado desde el original el 26 de agosto de 2014. Consultado el 25 de marzo de 2015 .
  52. ^ "Internet Archive". Internet Archive. Archivado desde el original el 31 de diciembre de 2020. Consultado el 8 de marzo de 2021 .
  53. ^ "API de Wayback Machine". Archivo de Internet .
  54. ^ waybackpy en GitHub
  55. ^ "Desarrolladores". Blogs de Internet Archive . 22 de agosto de 2014. Archivado desde el original el 12 de febrero de 2024.
  56. ^ Gonzalez, John (13 de diciembre de 2018). "Documentación para API públicas en Internet Archive". Blogs de Internet Archive . Archivado desde el original el 13 de enero de 2024.
  57. ^ "Preguntas frecuentes: algunos sitios no están disponibles debido a Robots.txt u otras exclusiones. ¿Qué significa eso?". Internet Archive Wayback Machine . Archivado desde el original el 15 de abril de 2011.
  58. ^ "Preguntas frecuentes". Internet Archive . Archivado desde el original el 17 de abril de 2014.
  59. ^ Cox, Joseph (22 de mayo de 2018). «La Wayback Machine está eliminando pruebas de malware vendido a acosadores». Vice . Archivado desde el original el 22 de mayo de 2018. Consultado el 23 de mayo de 2018 .
  60. ^ "Los robots.txt destinados a los motores de búsqueda no funcionan bien en los archivos web". Internet Archive . 17 de abril de 2017 . Consultado el 29 de junio de 2019 .
  61. ^ "Recomendaciones para gestionar solicitudes de eliminación y preservar la integridad de los archivos". Universidad de California . 14 de diciembre de 2002. Archivado desde el original el 18 de septiembre de 2017. Consultado el 14 de septiembre de 2017 .
  62. ^ "Eliminación retroactiva de robots.txt de rastreos pasados, también conocida como política de Oakland Archive". Internet Archive. 7 de julio de 2014. Archivado desde el original el 10 de octubre de 2017. Consultado el 14 de septiembre de 2017 .
  63. ^ Graham, Mark (17 de abril de 2017). "Los robots.txt destinados a los motores de búsqueda no funcionan bien en los archivos web". Blogs de Internet Archive . Archivado desde el original el 17 de abril de 2017. Consultado el 16 de abril de 2017 .
  64. ^ "Archivierung des Internets: Internet Archive ignorart künftig robots.txt" (en alemán). Heise en línea. 25 de abril de 2017. Archivado desde el original el 27 de abril de 2017 . Consultado el 14 de mayo de 2017 .
  65. ^ "Suchmaschinen: Internet Archive künftig Robots.txt-Einträge ignorieren - Golem.de" (en alemán). Archivado desde el original el 19 de junio de 2017 . Consultado el 14 de mayo de 2017 .
  66. ^ "Internet Archive ignorará los archivos robots.txt para mantener la precisión de los registros históricos". Digital Trends . 24 de abril de 2017. Archivado desde el original el 16 de mayo de 2017 . Consultado el 14 de mayo de 2017 .
  67. ^ Sampath Kumar, BT; Prithviraj, KR (21 de octubre de 2014). "Dando vida a los muertos: el papel de Wayback Machine en la recuperación de URL desaparecidas". Journal of Information Science . 41 (1): 71–81. doi :10.1177/0165551514552752. ISSN  0165-5515. S2CID  28320982.
  68. ^ abcde Nelson, Steven (17 de agosto de 2016). "Wayback Machine no censurará Archive for Taste, Director Says After Olympics Article Scrubbed" (El director dice que Wayback Machine no censurará Archive for Taste, después de que se eliminara el artículo sobre los Juegos Olímpicos). US News & World Report . Archivado desde el original el 6 de enero de 2017. Consultado el 14 de mayo de 2017 .
  69. ^ Lepore, Jill (26 de enero de 2015). «What the Web Said Yesterday» (Lo que dijo la Web ayer) . The New Yorker . Archivado desde el original el 25 de enero de 2015. Consultado el 14 de mayo de 2017 .
  70. ^ Guarino, Ben (21 de abril de 2017). «La Marcha por la Ciencia comenzó con la 'frase descartable' de esta persona en Reddit». Washington Post . Archivado desde el original el 23 de abril de 2017. Consultado el 23 de abril de 2017 .
  71. ^ Kaplan, Sarah (25 de enero de 2017). «¿Van a marchar los científicos sobre Washington?» . The Washington Post . Archivado desde el original el 31 de enero de 2017. Consultado el 31 de enero de 2017 .
  72. ^ Foley, Katherine Ellen (22 de abril de 2017). «La Marcha mundial por la Ciencia comenzó con un único hilo de Reddit». Quartz . Archivado desde el original el 24 de abril de 2017. Consultado el 23 de abril de 2017 .
  73. ^ ab Graham, Mark (1 de octubre de 2018). «Más de 9 millones de enlaces rotos en Wikipedia han sido rescatados». Blogs de Internet Archive . Archivado desde el original el 8 de abril de 2023.
  74. ^ Graham, Mark (17 de septiembre de 2020). «Cloudflare y Wayback Machine unen fuerzas para una Web más confiable». Blogs de Internet Archive . Consultado el 17 de septiembre de 2020 .
  75. ^ "Preguntas frecuentes sobre Internet Archive". Internet Archive . 2 de abril de 2014. Archivado desde el original el 2 de abril de 2014 . Consultado el 23 de noviembre de 2018 .
  76. ^ de Bates, Mary Ellen (2002). "La Wayback Machine". En línea . 26 : 80.
  77. ^ "YouTube – Archiveteam". archiveteam.org . Archivado desde el original el 5 de agosto de 2020 . Consultado el 6 de agosto de 2020 .
  78. ^ "Preguntas frecuentes sobre Internet Archive". Internet Archive . Archivado desde el original el 20 de abril de 2013. Consultado el 18 de octubre de 2018 .
  79. ^ abc Lloyd, Howard (octubre de 2009). «Orden de desactivación de robots.txt» (PDF) . Archivado desde el original (PDF) el 8 de agosto de 2019. Consultado el 15 de octubre de 2009 .
  80. ^ Cortes, Antonio (octubre de 2009). «Moción de oposición a la eliminación de Robots.txt». Archivado desde el original el 27 de octubre de 2010. Consultado el 15 de octubre de 2009 .
  81. ^ Gelman, Lauren (17 de noviembre de 2004). «Las instantáneas de páginas web de Internet Archive se consideran admisibles como prueba». Paquetes . 2 (3). Archivado desde el original el 30 de abril de 2011 . Consultado el 4 de enero de 2007 .
  82. ^ Howell, Beryl A. (febrero de 2006). "Proving Web History: How to use the Internet Archive" (PDF) . Journal of Internet Law : 3–9. Archivado desde el original (PDF) el 5 de julio de 2010. Consultado el 6 de agosto de 2008 .
  83. ^ "Búsqueda de pruebas en lugares virtuales. Admisibilidad de pruebas en Internet". Archivado desde el original el 1 de julio de 2019. Consultado el 14 de junio de 2020 .
  84. ^ Levitt, Carole A.; Rosch, Mark E. (2010). Encuentre información como un profesional: Cómo extraer información de los recursos públicos de Internet para realizar investigaciones, tomo 1. Asociación Estadounidense de Abogados. págs. 194-196. ISBN 978-1-60442-890-2Archivado del original el 18 de diciembre de 2020 . Consultado el 14 de junio de 2020 .
  85. ^ Coggins, Wynn W. (otoño de 2002). "Artículos anteriores en el campo de las patentes de métodos comerciales: ¿cuándo un documento electrónico es una publicación impresa a los efectos de los artículos anteriores?". USPTO . Archivado desde el original el 21 de septiembre de 2012. Consultado el 15 de agosto de 2012 .
  86. ^ "Desmintiendo la Wayback Machine". Archivado desde el original el 29 de junio de 2010.
  87. ^ Bahr, Martín (2002). "The Wayback Machine y Google Cache: ¿eine Verletzung deutschen Urheberrechts?". JurPC (en alemán): 9. doi :10.7328/jurpcb/20021719. Archivado desde el original el 23 de agosto de 2009.
  88. ^ "Preguntas frecuentes sobre Internet Archive". Archivado desde el original el 17 de abril de 2014 . Consultado el 16 de abril de 2014 .
  89. ^ Bowman, Lisa M (24 de septiembre de 2002). «Net archive silences Scientology critic» (Archivo de la red silencia a crítico de la Cienciología). CNET News. Archivado desde el original el 15 de mayo de 2012. Consultado el 4 de enero de 2007 .
  90. ^ Jeff (23 de septiembre de 2002). "exclusiones de Wayback Machine" (Blog) . Foro Wayback Machine . Internet Archive. Archivado desde el original el 11 de febrero de 2007. Consultado el 4 de enero de 2007 . El autor y la fecha indican el inicio del hilo del foro .
  91. ^ Miller, Ernest. "Sherman, Set the Wayback Machine for Scientology". LawMeme . Facultad de Derecho de Yale. Archivado desde el original (Blog) el 16 de noviembre de 2012 . Consultado el 4 de enero de 2007 .
  92. ^ Dye, Jessica (2005). "Sitio web demandado por un polémico viaje al pasado de Internet". EContent . 28. 11 : 8–9.
  93. ^ Bangeman, Eric (31 de agosto de 2006). «Internet Archive resuelve demanda por Wayback Machine». Ars Technica . Archivado desde el original el 5 de noviembre de 2007. Consultado el 29 de noviembre de 2007 .
  94. ^ ab Internet Archive v. Shell , 505 F.Supp.2d 755 en justia.com, 1:2006cv01726 ( Tribunal de Distrito de Colorado , 31 de agosto de 2006) ("'25 de abril de 2007 Se anunció un acuerdo de conciliación'. Presentación 65, 30 de abril de 2007: '...por lo tanto, SE ORDENA que este asunto sea DESESTIMADO CON PERJUICIO...'").
  95. ^ ab Babcock, Lewis T. (13 de febrero de 2007). "Internet Archive v. Shell Civil Action No. 06cv01726LTBCBS" (PDF) . Archivado (PDF) del original el 25 de enero de 2014. Consultado el 25 de marzo de 2015. 1) Se CONCEDE la moción de Internet Archive para desestimar la contrademanda de Shell por conversión y hurto civil (Segunda Causa de Acción), 2) Se DENIEGA la moción de Internet Archive para desestimar la contrademanda de Shell por incumplimiento de contrato (Tercera Causa de Acción); 3) Se CONCEDE la moción de Internet Archive para desestimar la contrademanda de Shell por crimen organizado en virtud de RICO y COCCA (Cuarta Causa de Acción).
  96. ^ Claburn, Thomas (16 de marzo de 2007). "Mujer de Colorado demanda a los rastreadores web para que cumplan sus contratos". Nueva York, Nueva York, EE. UU.: InformationWeek , UBM Tech, UBM LLC. Archivado desde el original el 4 de septiembre de 2014. Consultado el 25 de marzo de 2015. Las computadoras pueden celebrar contratos en nombre de las personas. La Ley Uniforme de Transacciones Electrónicas (UETA) dice que "un contrato puede formarse mediante la interacción de agentes electrónicos de las partes, incluso si ningún individuo estaba al tanto o revisó las acciones de los agentes electrónicos o los términos y acuerdos resultantes".
  97. ^ Samson, Martin H. (2007). "Internet Archive v. Suzanne Shell". Biblioteca de Derecho de Internet y Decisiones de Tribunales. Archivado desde el original el 3 de agosto de 2014. Consultado el 25 de marzo de 2015. Más importante aún, sostuvo el tribunal, la mera copia por parte de Internet Archive del sitio de Shell y su exhibición en su base de datos no constituyó el ejercicio requerido de dominio y control sobre la propiedad de la demandada. Es importante destacar que, señaló el tribunal, la demandada en todo momento fue propietaria y operó su propio sitio. Dijo el Tribunal: 'Shell no ha alegado hechos que demuestren que Internet Archive ejerció dominio o control sobre su sitio web, ya que la demanda de Shell establece explícitamente que ella continuó siendo propietaria y operando el sitio web mientras estaba archivado en Wayback Machine. Shell no identifica ninguna autoridad que respalde la noción de que copiar documentos es en sí mismo una privación de uso suficiente para respaldar la conversión. Por el contrario, numerosos circuitos han determinado que no lo es.'
  98. ^ brewster (25 de abril de 2007). "Internet Archive y Suzanne Shell llegan a un acuerdo sobre la demanda". Internet Archive . Denver, CO, EE. UU. Archivado desde el original el 5 de diciembre de 2010 . Consultado el 25 de marzo de 2015 . Ambas partes lamentan sinceramente cualquier confusión que la demanda pueda haber causado a la otra. Ni Internet Archive ni la Sra. Shell toleran ninguna conducta que pueda haber causado daño a cualquiera de las partes como resultado de la atención pública a esta demanda. Las partes no han incurrido en tal conducta y solicitan que la respuesta pública a la resolución amistosa de este litigio sea coherente con sus deseos de que no se cause más daño o confusión a ninguna de las partes.
  99. ^ Stobbe, Richard (5 de diciembre de 2014). «¿Implicaciones de copyright de un «derecho al olvido»? O cómo acabar con Internet Archive». Mondaq . Archivado desde el original el 18 de noviembre de 2018 . Consultado el 8 de marzo de 2019 .
  100. ^ McVeigh, Glennys (16 de octubre de 2014). Philpott, James; Weissman, Adam; Bucholz, Ren; Kettles, Brent; Pearl, Aaron (eds.). "Davydiuk v. Internet Archive Canada, 2014 FC 944". CanLII . Federación de Sociedades de Abogados de Canadá . Archivado desde el original el 18 de diciembre de 2020. Consultado el 8 de marzo de 2019 .
  101. ^ Southcott, Richard F. (30 de noviembre de 2016). Philpott, John; Alton, Alex; Bucholz, Ren (eds.). "Davydiuk v. Internet Archive Canada and Internet Archive, 2016 FC 1313 (CanLII)". CanLII . Ottawa, Ontario: Federación de Sociedades de Abogados de Canadá . Archivado desde el original el 29 de junio de 2019. Consultado el 8 de marzo de 2019 .
  102. ^ Cox, Joseph (22 de mayo de 2018). «Wayback Machine está eliminando pruebas de malware vendido a acosadores». Vice . Archivado desde el original el 24 de enero de 2022. Consultado el 24 de enero de 2022 .
  103. ^ Conger, Kate (8 de diciembre de 2016). "Respaldando la historia de Internet en Canadá para salvarla de Trump". TechCrunch . Archivado desde el original el 27 de diciembre de 2016. Consultado el 14 de mayo de 2017 .
  104. ^ "Dónde encontrar lo que ha desaparecido en Internet y mucho más: Internet Archive". Public Radio International. 23 de febrero de 2017. Archivado desde el original el 28 de marzo de 2017. Consultado el 14 de mayo de 2017 .
  105. ^ "La censura en línea en China". GreatFire . 22 de octubre de 2023 . Consultado el 22 de octubre de 2023 .
  106. ^ Chirgwin, Richard (1 de septiembre de 2015). "No hay vuelta atrás en Rusia: Putin bloquea Archive.org". The Register . Archivado desde el original el 7 de octubre de 2016. Consultado el 14 de mayo de 2017 .
  107. ^ "Rusia no irá a Wayback y bloquea Internet Archive". Digital Trends. 26 de junio de 2015. Archivado desde el original el 17 de abril de 2016. Consultado el 14 de mayo de 2017 .
  108. ^ "В России разблокирован крупнейший интернет-архив". Российская газета (en ruso). 18 de abril de 2016. Archivado desde el original el 5 de abril de 2019 . Consultado el 18 de octubre de 2020 .
  109. ^ El equipo de VirusTotal (25 de marzo de 2015). "207.241.226.190 Información de la dirección IP". virustotal.com . Dublín, Irlanda: VirusTotal . Archivado desde el original el 14 de julio de 2014 . Consultado el 25 de marzo de 2015 . 2015-03-25: Las últimas URL alojadas en esta dirección IP detectadas por al menos un escáner de URL o un conjunto de datos de URL malintencionados. ... 2/62 2015-03-25 16:14:12 [URL completa redactada]/Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [URL completa redactada]/CBLightSetup.exe
  110. ^ "Página de diagnóstico de navegación segura para archive.org". google.com/safebrowsing . Mountain View, CA, EE. UU. 25 de marzo de 2015. Archivado desde el original el 6 de abril de 2015 . Consultado el 25 de marzo de 2015 . 2015-03-25: Parte de este sitio fue incluido en la lista de actividades sospechosas 138 veces durante los últimos 90 días. ... ¿Qué sucedió cuando Google visitó este sitio? ... De las 42410 páginas que probamos en el sitio durante los últimos 90 días, 450 páginas resultaron en la descarga e instalación de software malicioso sin el consentimiento del usuario. La última vez que Google visitó este sitio fue el 2015-03-25, y la última vez que se encontró contenido sospechoso en este sitio fue el 2015-03-25. ... El software malicioso incluye 169 troyanos, 126 virus y 43 puertas traseras.
  111. ^ "Ayúdenos a mantener el archivo libre, accesible y privado para el lector | Blogs de Internet Archive". 29 de noviembre de 2016. Archivado desde el original el 21 de mayo de 2017. Consultado el 14 de mayo de 2017 .
  112. ^ Sakr, Sharif (7 de noviembre de 2013). «El archivo web de Wayback Machine sobrevive a un incendio destructivo pero necesita ayuda para recuperarse». Archivado desde el original el 9 de noviembre de 2020. Consultado el 3 de abril de 2022 .
  113. ^ "Internet Archive: Los cambios propuestos a la DMCA nos obligarían a "censurar la Web"". Consumerist. 7 de junio de 2016. Archivado desde el original el 11 de noviembre de 2016 . Consultado el 14 de mayo de 2017 .
  114. ^ Herb, Ulrich (6 de diciembre de 2016). "Die Trump-Angst Grassiert" [El miedo a Trump es rampante] (en alemán). Heise en línea. Archivado desde el original el 7 de diciembre de 2016 . Consultado el 14 de mayo de 2017 . Die Betreiber des Archives fürchten neben Zensur und Manipulation der digitalen Aufzeichnungen demnach auch die Überwachung der Archive-Nutzer. [Los operadores del archivo temen no sólo la censura y la manipulación de las grabaciones digitales, sino también la vigilancia de los usuarios del archivo].
  115. ^ LaFrance, Adrienne (14 de octubre de 2015). «La era oscura de Internet». The Atlantic . Archivado desde el original el 7 de mayo de 2017. Consultado el 14 de mayo de 2017 .
  116. ^ "Todo Internet será archivado en Canadá para protegerlo de Trump". Motherboard. 29 de noviembre de 2016. Archivado desde el original el 16 de mayo de 2017. Consultado el 14 de mayo de 2017 .
  117. ^ LaFrance, Adrienne (3 de junio de 2016). «El miedo humano al conocimiento total». The Atlantic . Archivado desde el original el 2 de diciembre de 2016. Consultado el 14 de mayo de 2017 .
  118. ^ Goodin, Dan (9 de octubre de 2024). «Archive.org, un repositorio de la historia de Internet, sufre una filtración de datos». Ars Technica . Archivado desde el original el 10 de octubre de 2024. Consultado el 10 de octubre de 2024 .
  119. ^ Warren, Tom (14 de octubre de 2024). «Internet Archive vuelve a ser un servicio de solo lectura tras los ciberataques». The Verge . Consultado el 14 de octubre de 2024 .

Enlaces externos