archivo.hoy

archive.today (o archive.is ) es un sitio de archivo web , fundado en 2012, que guarda instantáneas a pedido y es compatible con sitios con mucho JavaScript , como Google Maps , y aplicaciones web progresivas como X (anteriormente Twitter) . ^[3] archive.today registra dos instantáneas: una replica la página web original, incluidos los enlaces activos funcionales; el otro es una captura de pantalla de la página. ^[4]

El sitio web no proporciona información sobre la identidad del operador. ^[5]

Historia

Archive.today se fundó en 2012. El sitio originalmente se denominó archive.today, pero en mayo de 2015 cambió el espejo principal a archive.is. ^[6]

En enero de 2019, comenzó a desaprobar el dominio archive.is en favor de otras réplicas. ^[7]

Características

Funcionalidad

Archive.today puede capturar páginas individuales en respuesta a solicitudes explícitas de los usuarios. ^[8]^[9]^[10] Desde sus inicios, ha admitido el rastreo de páginas con URL que contienen el fragmento hash-bang ahora obsoleto ( #! ). ^[11]

Archive.today registra solo texto e imágenes, excluyendo XML , RTF , hojas de cálculo ( xls u ods ) y otro contenido no estático . Sin embargo, los vídeos de determinados sitios, como Twitter , se guardan. ^[12] Realiza un seguimiento del historial de instantáneas guardadas y solicita confirmación antes de agregar una nueva instantánea de una página ya guardada. ^[13]^[14]

Las páginas se capturan con un ancho de navegador de 1.024 píxeles. CSS se convierte a CSS en línea , eliminando el diseño web responsivo y selectores como :hovery :active. El contenido generado con JavaScript durante el proceso de rastreo aparece congelado. ^{[15] Los nombres}de las clases HTML se conservan dentro del old-class atributo . Cuando se selecciona texto , un subprograma de JavaScript genera un fragmento de URL que se ve en la barra de direcciones del navegador y que resalta automáticamente esa parte del texto cuando se visita nuevamente.

Las páginas web no se pueden duplicar de archive.today a web.archive.org como copia de seguridad de segundo nivel , ya que archive.today excluye Wayback Machine y no guarda sus instantáneas en formato WARC. Es posible lo contrario (de web.archive.org a archive.today), ^[16] pero la copia suele llevar más tiempo que una captura directa. Algunos sitios web se eliminan de los listados de Internet Archive de forma retroactiva o se bloquea su guardado debido a su archivo robots.txt , pero archive.today no lo utiliza. ^[10]

La barra de herramientas de investigación permite operadores avanzados de palabras clave, utilizando *como comodín . Un par de comillas dirigen la búsqueda a una secuencia exacta de palabras clave presentes en el título o en el cuerpo de la página web, mientras que el operador interno la restringe a un dominio de Internet específico. ^[17]

Una vez archivada una página web, ningún usuario de Internet puede eliminarla directamente. ^[18] Es posible eliminar anuncios, ventanas emergentes o ampliar enlaces de páginas archivadas pidiéndole al propietario que lo haga en su blog. ^[19]

Al guardar una lista dinámica , el cuadro de búsqueda de archive.today muestra solo un resultado que vincula la sección anterior y siguiente de la lista (por ejemplo, 20 enlaces por página). ^[20] Las otras páginas web guardadas se filtran y, en ocasiones, se pueden encontrar por una de sus apariciones. ^[13]^{[ se necesita aclaración ]}

La función de búsqueda está respaldada por Google CustomSearch. Si no arroja resultados, archive.today intenta utilizar Yandex Search . ^[21]

Al guardar una página, se muestra una lista de URL para elementos de página individuales y sus tamaños de contenido, estados HTTP y tipos MIME . Esta lista solo se puede ver durante el proceso de rastreo.

Se pueden descargar páginas archivadas como un archivo ZIP, excepto las páginas archivadas desde el 29 de noviembre de 2019, ^[actualizar]cuando archive.today cambió su motor de navegador de PhantomJS a Chromium . ^[22]

En julio de 2013, Archive.today comenzó a admitir la API del Proyecto Memento . ^[23]^[24]

Disponibilidad mundial

Australia

En marzo de 2019, el sitio fue bloqueado durante seis meses por varios proveedores de Internet australianos después del tiroteo en la mezquita de Christchurch en un intento de limitar la distribución de las imágenes del ataque. ^[25]^[26] Desde entonces ha sido desbloqueado.

Porcelana

Según GreatFire .org, archive.today ha estado bloqueado en China continental desde marzo de 2016, ^[27] archive.li desde septiembre de 2017, ^[28] archive.fo desde julio de 2018, ^[29] así como archive.ph desde diciembre. 2019. ^[30]^[actualizar]^[actualizar]^[actualizar]^[actualizar]

Finlandia

El 21 de julio de 2015, los operadores bloquearon el acceso al servicio desde todas las direcciones IP finlandesas , afirmando en Twitter que lo hicieron para evitar que se agravara una disputa que supuestamente tenían con el gobierno finlandés. ^[31]

Rusia

En Rusia , sólo es posible el acceso HTTP; Las conexiones HTTPS están bloqueadas. ^[32]^[33] HTTP no está cifrado, a diferencia de HTTPS, por lo tanto, los agentes que escuchan en la red pueden leer y modificar en tránsito toda la comunicación, incluida la URL de la página solicitada, el contenido devuelto y las cadenas que identifican al remitente. dispositivo (como el User-Agent y las cookies).

Disponibilidad de DNS de Cloudflare

Entre mayo de 2018 ^[34] y mayo de 2022, ^{[35] el servicio} DNS 1.1.1.1 de Cloudflare no resolvió las direcciones web de archive.today, lo que lo hizo inaccesible para los usuarios del servicio DNS de Cloudflare. Ambas organizaciones afirmaron que la otra era responsable del problema. El personal de Cloudflare declaró que el problema estaba en la infraestructura DNS de archive.today, ya que sus servidores de nombres autorizados devuelven registros no válidos cuando los sistemas de red de Cloudflare realizaron solicitudes a archive.today. archive.today respondió que el problema se debía a que las solicitudes de Cloudflare no cumplían con los estándares DNS, ya que Cloudflare no envía información de la subred del cliente EDNS en sus solicitudes DNS. ^[36]^[37] La cuestión se resolvió posteriormente. ^[^{cita necesaria}^]^[^{necesita actualización}^]

Ver también

Referencias

^ @archiveis (29 de octubre de 2019). "una lista actualizada de todos los dominios tor y dominios net claros" (Tweet) - vía Twitter .
^ Blog Archive.is (18 de febrero de 2014). "¿Cuándo se lanzó originalmente el sitio Archive-is?". Tumblr . Archivado desde el original el 20 de marzo de 2021 . Consultado el 10 de abril de 2021 .
^ Brinkmann, Martín (22 de abril de 2015). "Cree archivos de páginas web disponibles públicamente con Archive.is". Ghacks . Archivado desde el original el 12 de abril de 2019 . Consultado el 13 de junio de 2015 .
^ Brunelle, Justin F.; Kelly, Mat; Weigle, Michele C.; Nelson, Michael L. (25 de enero de 2015). "El impacto de JavaScript en la capacidad de archivado" (PDF) . Revista Internacional de Bibliotecas Digitales . 17 (2): 95-117. doi :10.1007/s00799-015-0140-8. S2CID 8433375. Archivado (PDF) desde el original el 27 de mayo de 2019.
^ Patokallio, Jani (5 de agosto de 2023). "archive.today: Tras la pista del misterioso archivero guerrillero de Internet". girovago . Consultado el 1 de enero de 2024 .
^ "¿Por qué volviste a cambiar la URL de archive-today a archive-is?". Blog de Archive.is . 3 de mayo de 2015. Archivado desde el original el 1 de junio de 2015 . Consultado el 6 de enero de 2019 .
^ @archiveis (4 de enero de 2019). "No utilice el espejo archive.IS para vincular, use otros espejos [.TODAY .FO .LI .VN .MD .PH]. .IS podría dejar de funcionar pronto" (Tweet). Archivado desde el original el 6 de enero de 2019, vía Twitter .
^ Dascalescu, Dan (18 de febrero de 2013). "Archivo de páginas web: Wiki de Dan Dascalescu (revisión)". Wiki.dandascalescu.com. Archivado desde el original el 22 de septiembre de 2013 . Consultado el 3 de octubre de 2013 .
^ Koebler, Jason (29 de octubre de 2014). "Estimado GamerGate: por favor deja de robarnos nuestra mierda". Tarjeta madre . Archivado desde el original el 27 de mayo de 2019 . Consultado el 22 de marzo de 2017 . No hay forma de que un sitio web se proteja de que un usuario de Archive.today refleje el sitio.
^ ab "Preguntas frecuentes sobre Archive.today". archivo.hoy . Consultado el 15 de febrero de 2019 .
^ "Página de inicio de Archive.is en 2013". Archivado desde el original el 12 de enero de 2013.
^ "Blog de Archive.today". Archivado desde el original el 7 de septiembre de 2021.
^ ab Archivar sitios web con Archive.is, archivado desde el original el 27 de enero de 2022 , recuperado 27 de enero de 2022
^ "Ejemplo de historial de instantáneas en archive.is".
^ Animación de carga generada por JavaScript del video de Dailymotion que aparece en estado congelado
^ "Ejemplo: Página guardada desde Web Archive a Archive.is" (en español). Archivado desde el original el 20 de mayo de 2013 . Consultado el 23 de octubre de 2019 .
^ Por ejemplo, la cadena en el sitio: https://en.wikipedia.org "Copa Mundial" devuelve las instantáneas relacionadas "Copa Mundial"/
^ "Algunas preguntas frecuentes" (blog) . archivo.es . 24 de enero de 2013. Archivado desde el original el 26 de septiembre de 2013 . Consultado el 12 de noviembre de 2018 .
^ "Ejemplo de solicitud de usuario en el blog Archive.is". Blog de Archive.es . Archivado desde el original el 29 de abril de 2022 . Consultado el 7 de abril de 2022 .
^ "Ejemplo de lista dinámica". WorldCat.org . Archivado desde el original el 23 de marzo de 2019 . Consultado el 15 de diciembre de 2018 .
^ "Me acabo de dar cuenta de que hoy puedo buscar palabras clave en la barra de búsqueda para archivar. ¿Fue esta una función agregada recientemente?". Blog de Archive.es . Archivado desde el original el 27 de enero de 2022 . Consultado el 27 de enero de 2022 .
^ "Blog de Archive.is". 17 de julio de 2020. Archivado desde el original el 3 de octubre de 2020.
^ Nelson, Michael L. (9 de julio de 2013). "Archive.is admite Memento". Actualizaciones de Investigación y Docencia . Grupo de investigación de bibliotecas digitales y ciencia web de la Universidad Old Dominion . Archivado desde el original el 27 de julio de 2013 . Consultado el 17 de septiembre de 2013 .
^ "archivo.es". Información del protocolo Memento . Grupo de desarrollo Memento. Archivado desde el original el 15 de septiembre de 2013 . Consultado el 17 de septiembre de 2013 .
^ "Los ISP de AU y Nueva Zelanda comienzan a censurar Internet sin precedentes legales". Acceso privado a Internet . 19 de marzo de 2019. Archivado desde el original el 28 de abril de 2023 . Consultado el 20 de marzo de 2019 .
^ "Los ISP de Nueva Zelanda dicen que están bloqueando sitios que no eliminan el video de la filmación de Christchurch". Gizmodo Australia . 19 de marzo de 2019. Archivado desde el original el 18 de mayo de 2019 . Consultado el 20 de marzo de 2019 .
^ "archive.is está 100% bloqueado en China". Analizador GreatFire . 12 de agosto de 2018. Archivado desde el original el 12 de agosto de 2018.
^ "archive.li está 100% bloqueado en China". Gran analizador de incendios . 12 de agosto de 2018. Archivado desde el original el 12 de agosto de 2018.
^ "archive.fo está 100% bloqueado en China". Gran analizador de incendios . 12 de agosto de 2018. Archivado desde el original el 12 de agosto de 2018.
^ "archive.ph está 100% bloqueado en China". es.greatfire.org . Archivado desde el original el 29 de abril de 2022 . Consultado el 7 de abril de 2022 .
^ Lapintie, Lassi (22 de julio de 2015). "Suomalaisilta estettiin haktivistien suosimalla verkkosivulla käynti" [Bloqueado el acceso de los finlandeses a un sitio web utilizado por hacktivistas]. Iltalehti (en finlandés). Archivado desde el original el 27 de mayo de 2019 . Consultado el 4 de marzo de 2016 .
^ Elistratov, Vladimir (29 de enero de 2016). "Roskomnadzor zablokiroval servis archive.is, khranyashchiy kopii veb-saytov" Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов. TJournal (en ruso). Archivado desde el original el 30 de agosto de 2017 . Consultado el 30 de enero de 2016 .
^ Cushing, Tim (4 de febrero de 2016). "Rusia bloquea otro sitio de archivo porque podría contener páginas antiguas sobre drogas". Techdirt . Archivado desde el original el 23 de marzo de 2019 . Consultado el 26 de febrero de 2016 .
^ "Archive.is: error 1001". Comunidad Cloudflare . 15 de mayo de 2018. Archivado desde el original el 2 de diciembre de 2021 . Consultado el 2 de diciembre de 2021 .
^ "Archive.today vuelve a funcionar en 1.1.1.1 (y archive.{ph,is,li,vn,fo,md})". Comunidad Cloudflare . 22 de mayo de 2022 . Consultado el 12 de marzo de 2023 .
^ @archiveis (16 de julio de 2018). ""Tener que hacer" no es tan directo aquí. La ausencia de EDNS y la falta de coincidencia masiva (no solo en AS/País, sino incluso a nivel de continente) de dónde provienen el DNS y las solicitudes HTTP relacionadas causan tantos problemas, por lo que considero que EDNS -Las solicitudes sin datos de Cloudflare se consideran no válidas" (Tweet) - a través de Twitter .
^ "Comentario de Matthew Prince sobre Hacker News". Noticias de piratas informáticos . 4 de mayo de 2019. Archivado desde el original el 13 de mayo de 2022 . Consultado el 4 de octubre de 2021 .

enlaces externos

Wikimedia Commons tiene medios relacionados con archive.today .

Página web oficial
Archive.is en Tumblr
archivo.hoy en Twitter
archive.today en archiveteam.org
archivo.ph/faq
"archive.today: Tras la pista del misterioso archivero guerrillero de Internet", Gyrovague , 5 de agosto de 2023