stringtranslate.com

archivo.hoy

archive.today (o archive.is ) es un sitio web de archivo web fundado en 2012 que guarda instantáneas a pedido y es compatible con sitios con mucho JavaScript , como Google Maps y Twitter . [3] archive.today registra dos instantáneas: una replica la página web original, incluidos los enlaces activos funcionales; el otro es una captura de pantalla de la página. [4]

La identidad de su operador no es evidente. [5]

Historia

Archive.today se fundó en 2012. El sitio originalmente se denominó archive.today, pero cambió el espejo principal a archive.is en mayo de 2015. [6] Comenzó a desaprobar el dominio archive.is en favor de otros espejos en enero 2019. [7]

En 2021, archive.today había guardado alrededor de 500 millones de páginas. [5]

Características

Funcionalidad

Archive.today puede capturar páginas individuales en respuesta a solicitudes explícitas de los usuarios. [8] [9] [10] Desde sus inicios, ha admitido el rastreo de páginas con URL que contienen el ahora obsoleto fragmento hash-bang ( #! ). [11]

Archive.today registra solo texto e imágenes, excluyendo XML , RTF , hojas de cálculo ( xls u ods ) y otro contenido no estático . Sin embargo, los vídeos de determinados sitios, como X (anteriormente Twitter) , se guardan. [12] Realiza un seguimiento del historial de instantáneas guardadas y solicita confirmación antes de agregar una nueva instantánea de una página ya guardada. [13] [14]

Las páginas se capturan con un ancho de navegador de 1.024 píxeles. CSS se convierte a CSS en línea , eliminando el diseño web responsivo y selectores como :hovery :active. El contenido generado con JavaScript durante el proceso de rastreo aparece congelado. [15] Los nombres de las clases HTML se conservan dentro del old-class atributo . Cuando se selecciona texto , un subprograma de JavaScript genera un fragmento de URL que se ve en la barra de direcciones del navegador y que resalta automáticamente esa parte del texto cuando se visita nuevamente.

Las páginas web se pueden duplicar desde archive.today a web.archive.org como copia de seguridad de segundo nivel , pero archive.today no guarda sus instantáneas en formato WARC. También es posible lo contrario (de web.archive.org a archive.today), [16] pero la copia suele llevar más tiempo que una captura directa. Históricamente, los propietarios de sitios web tenían la opción de excluirse de Wayback Machine mediante el uso del estándar de exclusión de robots (robots.txt), y estas exclusiones también se aplicaban de forma retroactiva. [17] Archive.today no obedece a robots.txt porque actúa "como un agente directo del usuario humano". [10] A partir de 2019, Wayback Machine ya no obedece a robots.txt.

La barra de herramientas de investigación permite operadores avanzados de palabras clave, utilizando *como comodín . Un par de comillas dirigen la búsqueda a una secuencia exacta de palabras clave presentes en el título o en el cuerpo de la página web, mientras que el operador interno la restringe a un dominio de Internet específico. [18]

Una vez archivada una página web, ningún usuario de Internet puede eliminarla directamente. [19] Es posible eliminar anuncios, ventanas emergentes o ampliar enlaces de páginas archivadas pidiéndole al propietario que lo haga en su blog. [20]

Al guardar una lista dinámica , el cuadro de búsqueda de archive.today muestra solo un resultado que vincula la sección anterior y siguiente de la lista (por ejemplo, 20 enlaces por página). [21] Las otras páginas web guardadas se filtran y, en ocasiones, se pueden encontrar por una de sus apariciones. [13] [ se necesita aclaración ]

La función de búsqueda está respaldada por Google CustomSearch. Si no arroja resultados, archive.today intenta utilizar Yandex Search . [22]

Al guardar una página, se muestra una lista de URL para elementos de página individuales y sus tamaños de contenido, estados HTTP y tipos MIME . Esta lista solo se puede ver durante el proceso de rastreo.

Se pueden descargar páginas archivadas como un archivo ZIP, excepto las páginas archivadas desde el 29 de noviembre de 2019, cuando archive.today cambió su motor de navegador de PhantomJS a Chromium . [23]

En julio de 2013, Archive.today comenzó a admitir la API del Proyecto Memento . [24] [25]

Disponibilidad mundial

Australia y Nueva Zelanda

En marzo de 2019, el sitio fue bloqueado durante seis meses por varios proveedores de Internet en Australia y Nueva Zelanda después del tiroteo en la mezquita de Christchurch en un intento de limitar la distribución de las imágenes del ataque. [26] [27]

Porcelana

Según GreatFire .org, archive.today ha estado bloqueado en China continental desde marzo de 2016, [28] archive.li desde septiembre de 2017, [29] archive.fo desde julio de 2018, [30] así como archive.ph desde diciembre. 2019. [31]

Finlandia

El 21 de julio de 2015, los operadores bloquearon el acceso al servicio desde todas las direcciones IP finlandesas , afirmando en Twitter que lo hicieron para evitar que se agravara una disputa que supuestamente tenían con el gobierno finlandés. [32]

Rusia

En 2016, la agencia de comunicaciones rusa Roskomnadzor comenzó a bloquear el acceso a archive.is desde Rusia. [33] [34]

Disponibilidad de DNS de Cloudflare

Desde mayo de 2018 [35] [36] El servicio DNS 1.1.1.1 de Cloudflare no resuelve las direcciones web de archive.today, lo que lo hace inaccesible para los usuarios del servicio DNS de Cloudflare. Ambas organizaciones afirmaron que la otra era responsable del problema. El personal de Cloudflare declaró que el problema estaba en la infraestructura DNS de archive.today, ya que sus servidores de nombres autorizados devuelven registros no válidos cuando los sistemas de red de Cloudflare realizaron solicitudes a archive.today. archive.today respondió que el problema se debía a que las solicitudes de Cloudflare no cumplían con los estándares DNS, ya que Cloudflare no envía información de la subred del cliente EDNS en sus solicitudes DNS. [37] [38]

Ver también

Referencias

  1. ^ @archiveis (30 de octubre de 2019). "una lista actualizada de todos los dominios Tor y dominios Clear Net" ( Tweet ) - vía Twitter .
  2. ^ Blog Archive.is (18 de febrero de 2014). "¿Cuándo se lanzó originalmente el sitio Archive-is?". Tumblr . Archivado desde el original el 20 de marzo de 2021 . Consultado el 10 de abril de 2021 .
  3. ^ Brinkmann, Martín (22 de abril de 2015). "Cree archivos de páginas web disponibles públicamente con Archive.is". Ghacks . Archivado desde el original el 12 de abril de 2019 . Consultado el 13 de junio de 2015 .
  4. ^ Brunelle, Justin F.; Kelly, Mat; Weigle, Michele C.; Nelson, Michael L. (25 de enero de 2015). "El impacto de JavaScript en la capacidad de archivado" (PDF) . Revista Internacional de Bibliotecas Digitales . 17 (2): 95-117. doi :10.1007/s00799-015-0140-8. S2CID  8433375. Archivado (PDF) desde el original el 27 de mayo de 2019.
  5. ^ ab Patokallio, Jani (5 de agosto de 2023). "archive.today: Tras la pista del misterioso archivero guerrillero de Internet". girovago . Archivado desde el original el 13 de agosto de 2023 . Consultado el 1 de enero de 2024 .
  6. ^ "¿Por qué volviste a cambiar la URL de archive-today a archive-is?". Blog de Archive.is . 3 de mayo de 2015. Archivado desde el original el 1 de junio de 2015 . Consultado el 6 de enero de 2019 .
  7. ^ @archiveis (4 de enero de 2019). "Por favor, no utilice el espejo archive.IS para vincular, use otros espejos [.TODAY .FO .LI .VN .MD .PH]. .IS podría dejar de funcionar pronto" ( Tweet ). Archivado desde el original el 6 de enero de 2019, vía Twitter .
  8. ^ Dascalescu, Dan (18 de febrero de 2013). "Archivo de páginas web: Wiki de Dan Dascalescu (revisión)". Wiki.dandascalescu.com. Archivado desde el original el 22 de septiembre de 2013 . Consultado el 3 de octubre de 2013 .
  9. ^ Koebler, Jason (29 de octubre de 2014). "Estimado GamerGate: por favor deja de robarnos nuestra mierda". Tarjeta madre . Archivado desde el original el 27 de mayo de 2019 . Consultado el 22 de marzo de 2017 . No hay forma de que un sitio web se proteja de que un usuario de Archive.today refleje el sitio.
  10. ^ ab "Preguntas frecuentes sobre Archive.today". archivo.hoy . Consultado el 15 de febrero de 2019 .
  11. ^ "Página de inicio de Archive.is en 2013". Archivado desde el original el 12 de enero de 2013.
  12. ^ "Blog de Archive.today". Archivado desde el original el 7 de septiembre de 2021.
  13. ^ ab Archivar sitios web con Archive.is, archivado desde el original el 27 de enero de 2022 , recuperado 27 de enero de 2022
  14. ^ "Ejemplo de historial de instantáneas en archive.is".
  15. ^ Animación de carga generada por JavaScript del video de Dailymotion que aparece en estado congelado
  16. ^ "Ejemplo: Página guardada desde Web Archive a Archive.is" (en español). Archivado desde el original el 20 de mayo de 2013 . Consultado el 23 de octubre de 2019 .
  17. ^ "Preguntas frecuentes: algunos sitios no están disponibles debido a Robots.txt u otras exclusiones. ¿Qué significa eso?". Archivo de Internet Wayback Machine . Archivado desde el original el 15 de abril de 2011.
  18. ^ Por ejemplo, la cadena en el sitio: https://en.wikipedia.org "Copa Mundial" devuelve las instantáneas relacionadas "Copa Mundial"/
  19. ^ "Algunas preguntas frecuentes" (blog) . archivo.es . 24 de enero de 2013. Archivado desde el original el 26 de septiembre de 2013 . Consultado el 12 de noviembre de 2018 .
  20. ^ "Ejemplo de solicitud de usuario en el blog Archive.is". Blog de Archive.es . Archivado desde el original el 29 de abril de 2022 . Consultado el 7 de abril de 2022 .
  21. ^ Ejemplo de lista dinámica: "au:"tomás de aquino"". MundoCat . Archivado desde el original el 23 de marzo de 2019 . Consultado el 15 de diciembre de 2018 .
  22. ^ "Me acabo de dar cuenta de que hoy puedo buscar palabras clave en la barra de búsqueda para archivar. ¿Fue esta una función agregada recientemente?". Blog de Archive.es . 18 de enero de 2022. Archivado desde el original el 27 de enero de 2022 . Consultado el 27 de enero de 2022 .
  23. ^ "El botón" descargar zip "ha estado dando el error" No encontrado "desde hace bastante tiempo". Blog de Archive.es . 17 de julio de 2020. Archivado desde el original el 3 de octubre de 2020.
  24. ^ Nelson, Michael L. (9 de julio de 2013). "Archive.is admite Memento". Actualizaciones de Investigación y Docencia . Grupo de investigación de bibliotecas digitales y ciencia web de la Universidad Old Dominion . Archivado desde el original el 27 de julio de 2013 . Consultado el 17 de septiembre de 2013 .
  25. ^ "archivo.es". Información del protocolo Memento . Grupo de desarrollo Memento. Archivado desde el original el 15 de septiembre de 2013 . Consultado el 17 de septiembre de 2013 .
  26. ^ "Los ISP de UA y Nueva Zelanda comienzan a censurar Internet sin precedentes legales". Acceso privado a Internet . 19 de marzo de 2019. Archivado desde el original el 28 de abril de 2023 . Consultado el 20 de marzo de 2019 .
  27. ^ "Los ISP de Nueva Zelanda dicen que están bloqueando sitios que no eliminan el video de la filmación de Christchurch". Gizmodo Australia . 19 de marzo de 2019. Archivado desde el original el 18 de mayo de 2019 . Consultado el 20 de marzo de 2019 .
  28. ^ "archive.is está 100% bloqueado en China". Analizador GreatFire . 12 de agosto de 2018. Archivado desde el original el 12 de agosto de 2018.
  29. ^ "archive.li está 100% bloqueado en China". Gran analizador de incendios . 12 de agosto de 2018. Archivado desde el original el 12 de agosto de 2018.
  30. ^ "archive.fo está 100% bloqueado en China". Gran analizador de incendios . 12 de agosto de 2018. Archivado desde el original el 12 de agosto de 2018.
  31. ^ "archive.ph está 100% bloqueado en China". es.greatfire.org . Archivado desde el original el 29 de abril de 2022 . Consultado el 7 de abril de 2022 .
  32. ^ Lapintie, Lassi (22 de julio de 2015). "Suomalaisilta estettiin haktivistien suosimalla verkkosivulla käynti" [Bloqueado el acceso de los finlandeses a un sitio web utilizado por hacktivistas]. Iltalehti (en finlandés). Archivado desde el original el 27 de mayo de 2019 . Consultado el 4 de marzo de 2016 .
  33. ^ Elistratov, Vladimir (29 de enero de 2016). "Roskomnadzor zablokiroval servis archive.is, khranyashchiy kopii veb-saytov" Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов. TJournal (en ruso). Archivado desde el original el 30 de agosto de 2017 . Consultado el 30 de enero de 2016 .
  34. ^ Cushing, Tim (4 de febrero de 2016). "Rusia bloquea otro sitio de archivo porque podría contener páginas antiguas sobre drogas". Techdirt . Archivado desde el original el 23 de marzo de 2019 . Consultado el 26 de febrero de 2016 .
  35. ^ "Archive.is: error 1001". Comunidad Cloudflare . 15 de mayo de 2018. Archivado desde el original el 2 de diciembre de 2021 . Consultado el 2 de diciembre de 2021 .
  36. ^ "Archive.today y los sitios relacionados vuelven a fallar". Comunidad Cloudflare . 3 de marzo de 2024. Archivado desde el original el 3 de abril de 2024 . Consultado el 20 de marzo de 2024 .
  37. ^ @archiveis (16 de julio de 2018). ""Tener que hacer" no es tan directo aquí. La ausencia de EDNS y la falta de coincidencia masiva (no solo en AS/País, sino incluso a nivel de continente) de dónde provienen el DNS y las solicitudes HTTP relacionadas causan tantos problemas, por lo que considero que EDNS -Las solicitudes menos de Cloudflare se consideran no válidas" ( Tweet ). Archivado desde el original el 2 de agosto de 2023, vía Twitter .
  38. ^ "Comentario de Matthew Prince sobre Hacker News". Noticias de piratas informáticos . 4 de mayo de 2019. Archivado desde el original el 13 de mayo de 2022 . Consultado el 4 de octubre de 2021 .

enlaces externos