stringtranslate.com

archivo.hoy

archive.today (anteriormente archive.is ) es un sitio web de archivo web fundado en 2012 que guarda instantáneas a pedido y tiene soporte para sitios con mucho JavaScript como Google Maps y X. [3] archive.today registra dos instantáneas: una replica la página web original, incluidos los enlaces activos funcionales; la otra es una captura de pantalla de la página. [4]

Se desconoce la identidad de su operador. [5]

Historia

Archive.today se fundó en 2012. El sitio originalmente se denominó archive.today, pero cambió el espejo principal a archive.is en mayo de 2015. [6] Comenzó a descontinuar el dominio archive.is a favor de otros espejos en enero de 2019. [7]

En 2021, archive.today había guardado alrededor de 500 millones de páginas. [5]

Características

Funcionalidad

Archive.today puede capturar páginas individuales en respuesta a solicitudes explícitas de los usuarios. [8] [9] [10] Desde sus inicios, ha admitido el rastreo de páginas con URL que contienen el fragmento hash-bang ( #! ), ahora obsoleto . [11]

Archive.today solo registra texto e imágenes, excluyendo XML , RTF , hojas de cálculo ( xls u ods ) y otro contenido no estático . Sin embargo, los videos de ciertos sitios, como X (anteriormente Twitter) , se guardan. [12] Realiza un seguimiento del historial de capturas guardadas, solicitando confirmación antes de agregar una nueva captura de una página ya guardada. [13] [14]

Las páginas se capturan con un ancho de navegador de 1024 píxeles. El CSS se convierte a CSS en línea , eliminando el diseño web responsivo y los selectores como :hovery :active. El contenido generado con JavaScript durante el proceso de rastreo aparece en un estado congelado. [15] Los nombres de clase HTML se conservan dentro del old-class atributo . Cuando se selecciona texto , un subprograma de JavaScript genera un fragmento de URL que se ve en la barra de direcciones del navegador y que resalta automáticamente esa parte del texto cuando se visita nuevamente.

Las páginas web se pueden duplicar de archive.today a web.archive.org como copia de seguridad de segundo nivel , pero archive.today no guarda sus instantáneas en formato WARC. También es posible hacer lo inverso (de web.archive.org a archive.today), [16] pero la copia suele tardar más que una captura directa. Históricamente, los propietarios de sitios web tenían la opción de optar por no participar en Wayback Machine mediante el uso del estándar de exclusión de robots (robots.txt), y estas exclusiones también se aplicaban de forma retroactiva. [17] Archive.today no obedece a robots.txt porque actúa "como un agente directo del usuario humano". [10] A partir de 2019, Wayback Machine ya no obedece a robots.txt.

La barra de búsqueda permite utilizar operadores avanzados de palabras clave, utilizando *como comodín el carácter . Un par de comillas dirigen la búsqueda a una secuencia exacta de palabras clave presentes en el título o en el cuerpo de la página web, mientras que el operador insite la restringe a un dominio de Internet específico. [18]

Una vez que una página web se archiva, ningún usuario de Internet puede eliminarla directamente. [19] Es posible eliminar anuncios, ventanas emergentes o enlaces expandibles de páginas archivadas pidiéndole al propietario que lo haga en su blog. [20]

Al guardar una lista dinámica , el cuadro de búsqueda de archive.today muestra solo un resultado que vincula la sección anterior y la siguiente de la lista (por ejemplo, 20 vínculos por página). [21] Las demás páginas web guardadas se filtran y, a veces, se pueden encontrar por una de sus ocurrencias. [13] [ aclaración necesaria ]

La función de búsqueda está respaldada por Google CustomSearch. Si no arroja resultados, archive.today intenta utilizar Yandex Search . [22]

Al guardar una página, se muestra una lista de URL de elementos individuales de la página y sus tamaños de contenido, estados HTTP y tipos MIME . Esta lista solo se puede ver durante el proceso de rastreo.

Se pueden descargar páginas archivadas como un archivo ZIP, excepto las páginas archivadas desde el 29 de noviembre de 2019, cuando archive.today cambió su motor de navegador de PhantomJS a Chromium . [23]

En julio de 2013, Archive.today comenzó a brindar soporte a la API del Proyecto Memento . [24] [25]

Disponibilidad mundial

Australia y Nueva Zelanda

En marzo de 2019, el sitio fue bloqueado durante seis meses por varios proveedores de Internet en Australia y Nueva Zelanda a raíz de los tiroteos en la mezquita de Christchurch, en un intento de limitar la distribución de las imágenes del ataque. [26] [27]

Porcelana

Según GreatFire.org , archive.today ha estado bloqueado en China continental desde marzo de 2016, [28] archive.li desde septiembre de 2017, [29] archive.fo desde julio de 2018, [30] así como archive.ph desde diciembre de 2019. [31]

Finlandia

El 21 de julio de 2015, los operadores bloquearon el acceso al servicio desde todas las direcciones IP finlandesas , declarando en Twitter que lo hicieron para evitar que se intensificara una disputa que supuestamente tenían con el gobierno finlandés. [32]

Rusia

En 2016, la agencia de comunicaciones rusa Roskomnadzor comenzó a bloquear el acceso a archive.is desde Rusia. [33] [34]

Disponibilidad de DNS de Cloudflare

Desde mayo de 2018 [35] [36] el servicio DNS 1.1.1.1 de Cloudflare no resolvía las direcciones web de archive.today, lo que lo hacía inaccesible para los usuarios del servicio DNS de Cloudflare. Ambas organizaciones afirmaron que la otra era responsable del problema. El personal de Cloudflare afirmó que el problema estaba en la infraestructura DNS de archive.today, ya que sus servidores de nombres autorizados devuelven registros no válidos cuando los sistemas de red de Cloudflare realizaban solicitudes a archive.today. archive.today respondió que el problema se debía a que las solicitudes de Cloudflare no cumplían con los estándares DNS, ya que Cloudflare no envía información de subred de cliente EDNS en sus solicitudes DNS. [37] [38]

Véase también

Referencias

  1. ^ @archiveis (30 de octubre de 2019). "una lista actual de todos los dominios tor y dominios clear net" ( Tweet ) – vía Twitter .
  2. ^ Blog Archive.is (18 de febrero de 2014). "¿Cuándo se lanzó originalmente el sitio Archive-is?". Tumblr . Archivado desde el original el 20 de marzo de 2021. Consultado el 10 de abril de 2021 .
  3. ^ Brinkmann, Martin (22 de abril de 2015). «Crear archivos de páginas web disponibles públicamente con Archive.is». Ghacks . Archivado desde el original el 12 de abril de 2019. Consultado el 13 de junio de 2015 .
  4. ^ Brunelle, Justin F.; Kelly, Mat; Weigle, Michele C.; Nelson, Michael L. (25 de enero de 2015). "El impacto de JavaScript en la archivabilidad" (PDF) . Revista internacional de bibliotecas digitales . 17 (2): 95–117. doi :10.1007/s00799-015-0140-8. S2CID  8433375. Archivado (PDF) desde el original el 27 de mayo de 2019.
  5. ^ ab Patokallio, Jani (5 de agosto de 2023). «archive.today: Tras la pista del misterioso archivista guerrillero de Internet». Gyrovague . Archivado desde el original el 13 de agosto de 2023. Consultado el 1 de enero de 2024 .
  6. ^ "¿Por qué cambiaste la URL de archive-today a archive-is?". Blog Archive.is . 3 de mayo de 2015. Archivado desde el original el 1 de junio de 2015. Consultado el 6 de enero de 2019 .
  7. ^ @archiveis (4 de enero de 2019). "No utilice el servidor de réplica archive.IS para crear enlaces, utilice otros servidores de réplica [.TODAY .FO .LI .VN .MD .PH]. .IS podría dejar de funcionar pronto" ( Tweet ). Archivado desde el original el 6 de enero de 2019 – vía Twitter .
  8. ^ Dascalescu, Dan (18 de febrero de 2013). «Archivado de páginas web: la wiki de Dan Dascalescu (revisión)». Wiki.dandascalescu.com. Archivado desde el original el 22 de septiembre de 2013. Consultado el 3 de octubre de 2013 .
  9. ^ Koebler, Jason (29 de octubre de 2014). "Estimado GamerGate: Por favor, dejen de robarnos nuestras cosas". Motherboard . Archivado desde el original el 27 de mayo de 2019. Consultado el 22 de marzo de 2017. No hay forma de que un sitio web se proteja de que un usuario de Archive.today refleje el sitio.
  10. ^ ab "Preguntas frecuentes de Archive.today". archive.today . Consultado el 15 de febrero de 2019 .
  11. ^ "Página de inicio de Archive.is en 2013". Archivado desde el original el 12 de enero de 2013.
  12. ^ "Blog Archive.today". Archivado desde el original el 7 de septiembre de 2021.
  13. ^ ab Archivado de sitios web con Archive.is, 15 de abril de 2016, archivado del original el 27 de enero de 2022 , consultado el 27 de enero de 2022
  14. ^ "Ejemplo de historial de instantáneas en archive.is".
  15. ^ Animación de carga generada con JavaScript de un video de Dailymotion que aparece en estado congelado
  16. ^ «Ejemplo: Página guardada desde Web Archive a Archive.is». Archivado desde el original el 20 de mayo de 2013. Consultado el 23 de octubre de 2019 .
  17. ^ "Preguntas frecuentes: algunos sitios no están disponibles debido a Robots.txt u otras exclusiones. ¿Qué significa eso?". Internet Archive Wayback Machine . Archivado desde el original el 15 de abril de 2011.
  18. ^ Por ejemplo, la cadena insite: https://en.wikipedia.org "World Cup" devuelve las instantáneas relacionadas con "World+Cup"/
  19. ^ "Algunas preguntas frecuentes" (blog) . archive.is . 24 de enero de 2013. Archivado desde el original el 26 de septiembre de 2013 . Consultado el 12 de noviembre de 2018 .
  20. ^ "Ejemplo de solicitud de usuario en el blog Archive.is". Blog Archive.is . Archivado desde el original el 29 de abril de 2022. Consultado el 7 de abril de 2022 .
  21. ^ Ejemplo de lista dinámica: "au:"thomas aquinas"". WorldCat . Archivado desde el original el 23 de marzo de 2019 . Consultado el 15 de diciembre de 2018 .
  22. ^ "Me acabo de dar cuenta de que puedo buscar palabras clave en la barra de búsqueda del archivo de hoy. ¿Se trata de una función que se agregó recientemente?". Blog de Archive.is . 18 de enero de 2022. Archivado desde el original el 27 de enero de 2022. Consultado el 27 de enero de 2022 .
  23. ^ "El botón "Descargar archivo zip" ha estado dando un error de "No encontrado" durante bastante tiempo". Blog de Archive.is . 17 de julio de 2020. Archivado desde el original el 3 de octubre de 2020.
  24. ^ Nelson, Michael L. (9 de julio de 2013). «Archive.is apoya a Memento». Actualizaciones de investigación y docencia . Grupo de investigación en ciencias web y bibliotecas digitales de la Universidad Old Dominion . Archivado desde el original el 27 de julio de 2013. Consultado el 17 de septiembre de 2013 .
  25. ^ "archive.is". Información del Protocolo Memento . Memento Development Group. Archivado desde el original el 15 de septiembre de 2013 . Consultado el 17 de septiembre de 2013 .
  26. ^ "Los ISP de Australia y Nueva Zelanda comienzan a censurar Internet sin precedentes legales". Private Internet Access . 19 de marzo de 2019. Archivado desde el original el 28 de abril de 2023 . Consultado el 20 de marzo de 2019 .
  27. ^ "Los ISP de Nueva Zelanda dicen que están bloqueando sitios que no eliminan el video del tiroteo de Christchurch". Gizmodo Australia . 19 de marzo de 2019. Archivado desde el original el 18 de mayo de 2019 . Consultado el 20 de marzo de 2019 .
  28. ^ "archive.is está 100% bloqueado en China". GreatFire Analyzer . 12 de agosto de 2018. Archivado desde el original el 12 de agosto de 2018.
  29. ^ "archive.li está 100% bloqueado en China". Great Fire Analyzer . 12 de agosto de 2018. Archivado desde el original el 12 de agosto de 2018.
  30. ^ "archive.fo está 100% bloqueado en China". Great Fire Analyzer . 12 de agosto de 2018. Archivado desde el original el 12 de agosto de 2018.
  31. ^ "archive.ph está 100% bloqueado en China". es.greatfire.org . Archivado desde el original el 29 de abril de 2022 . Consultado el 7 de abril de 2022 .
  32. ^ Lapintie, Lassi (22 de julio de 2015). "Suomalaisilta estettiin haktivistien suosimalla verkkosivulla käynti" [Bloqueado el acceso de los finlandeses a un sitio web utilizado por hacktivistas]. Iltalehti (en finlandés). Archivado desde el original el 27 de mayo de 2019 . Consultado el 4 de marzo de 2016 .
  33. ^ Elistratov, Vladimir (29 de enero de 2016). "Roskomnadzor zablokiroval servis archive.is, khranyashchiy kopii veb-saytov" Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов. TJournal (en ruso). Archivado desde el original el 30 de agosto de 2017 . Consultado el 30 de enero de 2016 .
  34. ^ Cushing, Tim (4 de febrero de 2016). «Rusia bloquea otro sitio de archivo porque podría contener páginas antiguas sobre drogas». Techdirt . Archivado desde el original el 23 de marzo de 2019. Consultado el 26 de febrero de 2016 .
  35. ^ "Archive.is – Error 1001". Comunidad Cloudflare . 15 de mayo de 2018. Archivado desde el original el 2 de diciembre de 2021 . Consultado el 2 de diciembre de 2021 .
  36. ^ "Archive.today y sitios relacionados vuelven a fallar". Comunidad Cloudflare . 3 de marzo de 2024. Archivado desde el original el 3 de abril de 2024. Consultado el 20 de marzo de 2024 .
  37. ^ @archiveis (16 de julio de 2018). "'Tener que hacerlo' no es tan directo aquí. La ausencia de EDNS y la falta de coincidencia masiva (no solo en AS/país, sino incluso a nivel de continente) de dónde provienen las solicitudes DNS y HTTP relacionadas causan tantos problemas, por lo que considero que las solicitudes sin EDNS de Cloudflare no son válidas" ( Tweet ). Archivado desde el original el 2 de agosto de 2023 – vía Twitter .
  38. ^ "Comentario de Matthew Prince en Hacker News". Hacker News . 4 de mayo de 2019. Archivado desde el original el 13 de mayo de 2022 . Consultado el 4 de octubre de 2021 .

Enlaces externos