Las modificaciones realizadas después del 4 de diciembre de 2018 corresponden a la versión 2.5
El operador del bot es User:GreenC . La cuenta del bot es User:GreenC bot . El bot (software) es "WaybackMedic".
Detalles técnicos
Los cambios en las URL se verifican en el sitio remoto para garantizar que funcionen.
Comprobaciones de enlaces en tiempo real, sin base de datos de enlaces. Sin embargo, los enlaces se comprueban durante un período de 24 horas antes de la carga final de la diferencia.
Admite muchas API, incluidas las API de Internet Archive, Memento, WebCite y "Timemap" en servicios individuales.
Varias comprobaciones del código de estado del encabezado HTTP en la capa de aplicación (WaybackMedic)
Tiempo de espera adicional y reintentos integrados en las bibliotecas de transferencia web.
Comprobaciones adicionales a nivel de procedimiento operativo contra errores de red y otros errores: el bot está semisupervisado en áreas con problemas conocidos.
Varias comprobaciones redundantes de las API que utilizan varias fechas para garantizar que una página realmente no esté disponible
Acepta los resultados de la API pero luego los verifica mirando los encabezados de página y/o los contenidos
El bot está escrito principalmente en Nim (se compila en código fuente C) con utilidades de soporte en Awk . Las bibliotecas se crearon a medida, incluida una biblioteca de primitivas de cadenas para expresiones regulares, una biblioteca de análisis de plantillas wiki, una biblioteca OAuth (en awk), una biblioteca de interfaz API MediaWiki y un detector soft404.
Debido a la naturaleza de la tarea, ejecutar el bot incluye una gran cantidad de trabajo de supervisión, por lo que requiere capacitación del operador, aunque los pasos están documentados en el paquete fuente.
Correr
El bot acepta solicitudes en WP:URLREQ por dominio. Puedes solicitar un nombre de dominio para que el bot lo procese.
Editor pagado
GreenC , de acuerdo con las Condiciones de uso de la Fundación Wikimedia, revela que ha recibido un pago de Internet Archive por sus contribuciones a Wikipedia. Esta financiación se destina al desarrollo continuo de WaybackMedic y un módulo de InternetArchiveBot relacionado con los libros.
Fuentes generales
GitHub es un repositorio público antiguo. La versión más actual no es pública. El bot está escrito en Nim y GNU awk.