stringtranslate.com

podredumbre del enlace

Página no encontrada
Un enlace podrido suele generar un mensaje de error

El enlace podrido (también llamado muerte del enlace , rotura del enlace o deterioro de la referencia ) es el fenómeno en el que los hipervínculos tienden con el tiempo a dejar de apuntar al archivo , página web o servidor de destino original debido a que ese recurso se reubica en una nueva dirección o se convierte en permanentemente no disponible. Un vínculo que ya no apunta a su destino, a menudo llamado vínculo roto , inactivo o huérfano , es una forma específica de puntero colgante .

La tasa de deterioro de los enlaces es un tema de estudio e investigación debido a su importancia para la capacidad de Internet para preservar la información. Las estimaciones de esa tasa varían dramáticamente entre los estudios. Los profesionales de la información han advertido que la descomposición de los enlaces podría hacer que desaparezcan importantes datos de archivo, lo que podría afectar al sistema legal y a los académicos.

Predominio

Varios estudios han examinado la prevalencia de la descomposición de enlaces en la World Wide Web , en la literatura académica que utiliza URL para citar contenido web y en bibliotecas digitales .

Un estudio de 2002 sugirió que la descomposición de los enlaces dentro de las bibliotecas digitales es considerablemente más lenta que en la web, y encontró que alrededor del 3% de los objetos ya no eran accesibles después de un año [1] (lo que equivale a una vida media de casi 23 años).

Un estudio de 2003 encontró que en la Web, aproximadamente un enlace de cada 200 se rompía cada semana, [2] lo que sugiere una vida media de 138 semanas. Esta tasa fue confirmada en gran medida por un estudio de enlaces en Yahoo! de 2016-2017. Directorio (que había dejado de actualizarse en 2014 después de 21 años de desarrollo) que encontró que la vida media de los enlaces del directorio era de dos años. [3]

Un estudio de 2004 demostró que subconjuntos de enlaces web (como los que apuntan a tipos de archivos específicos o los alojados en instituciones académicas) podrían tener vidas medias dramáticamente diferentes. [4] Las URL seleccionadas para publicación parecen tener mayor longevidad que la URL promedio. Un estudio de 2015 realizado por Weblock analizó más de 180.000 enlaces de referencias en los corpus de texto completo de tres importantes editoriales de acceso abierto y encontró una vida media de aproximadamente 14 años, [5] confirmando en general un estudio de 2005 que encontró que la mitad de las URL citados en los artículos de la revista D-Lib estuvieron activos 10 años después de su publicación. [6] Otros estudios han encontrado tasas más altas de pudrición de enlaces en la literatura académica, pero generalmente sugieren una vida media de cuatro años o más. [7] [8] Un estudio de 2013 en BMC Bioinformatics analizó casi 15.000 enlaces en resúmenes del índice de citas Web of Science de Thomson Reuters y encontró que la vida útil media de las páginas web era de 9,3 años, y solo el 62% estaban archivadas. [9] Un estudio de 2021 sobre enlaces externos en artículos del New York Times publicados entre 1996 y 2019 encontró una vida media de aproximadamente 15 años (con una variación significativa entre los temas de contenido), pero señaló que el 13% de los enlaces funcionales ya no conducen al original. contenido: un fenómeno llamado deriva de contenido . [10]

Un estudio de 2013 encontró que el 49% de los enlaces en las opiniones de la Corte Suprema de Estados Unidos están muertos. [11]

Un estudio de 2023 que analizó los paneles de control de COVID-19 de Estados Unidos encontró que el 23 % de los paneles estatales disponibles en febrero de 2021 ya no estaban disponibles en las URL anteriores en abril de 2023. [12]

Causas

La pudrición del enlace puede deberse a varios sucesos. Es posible que se elimine una página web de destino. El servidor que aloja la página de destino podría fallar, eliminarse del servicio o reubicarse en un nuevo nombre de dominio . Ya en 1999, se observó que con la cantidad de material que se puede almacenar en un disco duro, "un solo fallo de disco podría ser como el incendio de la biblioteca de Alejandría". [13] El registro de un nombre de dominio puede caducar o transferirse a otra parte. Algunas causas harán que el enlace no encuentre ningún destino y devuelva un error como HTTP 404 . Otras causas harán que un enlace apunte a contenido distinto al previsto por el autor del enlace.

Otras razones de los enlaces rotos incluyen:

Prevención y detección

Las estrategias para prevenir la descomposición de los enlaces pueden centrarse en colocar contenido donde la probabilidad de persistir sea mayor, crear enlaces que tengan menos probabilidades de romperse, tomar medidas para preservar los enlaces existentes o reparar enlaces cuyos objetivos hayan sido reubicados o eliminados. [ cita necesaria ]

La creación de URL que no cambien con el tiempo es el método fundamental para evitar que los enlaces se pudran. La planificación preventiva ha sido defendida por Tim Berners-Lee y otros pioneros de la web. [14]

Las estrategias relacionadas con la autoría de enlaces incluyen:

Las estrategias relacionadas con la protección de enlaces existentes incluyen:

La detección de enlaces rotos se puede realizar de forma manual o automática. Los métodos automatizados incluyen complementos para sistemas de gestión de contenido , así como verificadores de enlaces rotos independientes, como Link Sleuth de Xenu . Es posible que la verificación automática no detecte enlaces que devuelvan un suave 404 o enlaces que devuelvan una respuesta 200 OK pero apunten a contenido que ha cambiado. [24]

Ver también

Otras lecturas

Referencias

  1. ^ Nelson, Michael L.; Allen, B. Danette (2002). "Persistencia y disponibilidad de objetos en bibliotecas digitales". Revista D-Lib . 8 (1). doi : 10.1045/enero de 2002-nelson . Archivado desde el original el 19 de julio de 2020 . Consultado el 24 de septiembre de 2019 .
  2. ^ Con grilletes, Dennis; Manasés, Mark; Najork, Marc; Viena, Janet (2003). "Un estudio a gran escala de la evolución de las páginas web". Actas de la duodécima conferencia internacional sobre la World Wide Web . Archivado desde el original el 9 de julio de 2011 . Consultado el 14 de septiembre de 2010 .
  3. ^ van der Graaf, Hans. "La vida media de un enlace es de dos años". Blog de ZOMDir . Archivado desde el original el 17 de octubre de 2017 . Consultado el 31 de enero de 2019 .
  4. ^ ab Koehler, Wallace (2004). "Continuó un estudio longitudinal de páginas web: una consideración de la persistencia de los documentos". Investigación de información . 9 (2). Archivado desde el original el 11 de septiembre de 2017 . Consultado el 31 de enero de 2019 .
  5. ^ "Informe Weblock de todos los tiempos". Agosto de 2015. Archivado desde el original el 4 de marzo de 2016 . Consultado el 12 de enero de 2016 .
  6. ^ ab McCown, Frank; Chan, Sheffan; Nelson, Michael L.; Bollen, Johan (2005). "La disponibilidad y persistencia de las referencias web en la revista D-Lib" (PDF) . Actas del V Taller Internacional de Archivo Web y Preservación Digital (IWAW'05) . Archivado desde el original (PDF) el 17 de julio de 2012 . Consultado el 12 de octubre de 2005 .
  7. ^ Spinellis, Diomidis (2003). "La decadencia y los fracasos de las referencias web". Comunicaciones de la ACM . 46 (1): 71–77. CiteSeerX 10.1.1.12.9599 . doi :10.1145/602421.602422. S2CID  17750450. Archivado desde el original el 23 de julio de 2020 . Consultado el 29 de septiembre de 2007 . 
  8. ^ Steve Lawrence ; David M. Pennock; Gary William Flake ; et al. (Marzo de 2001). "Persistencia de las referencias web en la investigación científica". Computadora . 34 (3): 26–31. CiteSeerX 10.1.1.97.9695 . doi : 10.1109/2.901164. ISSN  0018-9162. Wikidata  Q21012586. 
  9. ^ Hennessey, Jason; Xijin Ge, Steven (2013). "Un estudio interdisciplinario sobre la decadencia de enlaces y la eficacia de las técnicas de mitigación". Bioinformática BMC . 14 (Suplemento 14): T5. doi : 10.1186/1471-2105-14-S14-S5 . PMC 3851533 . PMID  24266891. 
  10. ^ "Qué significa lo efímero de la Web para sus hipervínculos". Revista de periodismo de Columbia . Archivado desde el original el 2021-08-02 . Consultado el 2 de agosto de 2021 .
  11. ^ Garber, Megan (23 de septiembre de 2013). "El 49% de los enlaces citados en las decisiones de la Corte Suprema están rotos". El Atlántico . Consultado el 10 de enero de 2024 .
  12. ^ ab Adams, Aaron M.; Chen, Xiang; Li, Wei Dong; Chuanrong, Zhang (27 de julio de 2023). "Normalizar la pandemia: explorar las cuestiones cartográficas en los paneles de control COVID-19 del gobierno estatal". Revista de Mapas . 19 (5): 1–9. doi : 10.1080/17445647.2023.2235385 .
  13. ^ McGranaghan, Mateo (1999). "La Web, Cartografía y Confianza". Perspectivas cartográficas (32): 3–5. doi : 10.14714/CP32.624 .
  14. ^ Berners-Lee, Tim (1998). "Los URI interesantes no cambian". Archivado desde el original el 2000-03-02 . Consultado el 31 de enero de 2019 .
  15. ^ ab Kille, Leighton Walter (8 de noviembre de 2014). "El creciente problema de la" putrefacción de enlaces "de Internet y las mejores prácticas para los medios y los editores en línea". Recurso para periodistas, Harvard Kennedy School. Archivado desde el original el 12 de enero de 2015 . Consultado el 16 de enero de 2015 .
  16. ^ Sicilia, Miguel-Ángel, et al. "Identificadores persistentes descentralizados: un modelo básico para controladores inmutables Archivado el 10 de mayo de 2023 en Wayback Machine ". Procedia informática 146 (2019): 123-130.
  17. ^ "Internet Archive: biblioteca digital de libros, películas, música y Wayback Machine gratuitos". 2001-03-10. Archivado desde el original el 26 de enero de 1997 . Consultado el 7 de octubre de 2013 .
  18. ^ Eysenbach, Gunther; Trudel, Mathieu (2005). "Seguimos, seguimos y seguimos ahí: utilizar el servicio WebCite para archivar permanentemente las páginas web citadas". Revista de investigación médica en Internet . 7 (5): e60. doi : 10.2196/jmir.7.5.e60 . PMC 1550686 . PMID  16403724. 
  19. ^ Zittrain, Jonathan; Alberto, Kendra; Lessig, Lawrence (12 de junio de 2014). "Perma: alcance y solución del problema de la descomposición de enlaces y referencias en citas legales" (PDF) . Gestión de Información Jurídica . 14 (2): 88–99. doi :10.1017/S1472669614000255. S2CID  232390360. Archivado (PDF) desde el original el 1 de noviembre de 2020 . Consultado el 10 de junio de 2020 .
  20. ^ "El Centro Berkman de la Universidad de Harvard lanza Amber, una herramienta de" ayuda mutua "para blogueros y propietarios de sitios web para ayudar a mantener la Web disponible | Centro Berkman". ciber.law.harvard.edu . Archivado desde el original el 2 de febrero de 2016 . Consultado el 28 de enero de 2016 .
  21. ^ "Arweave: un ecosistema impulsado por la comunidad". arweave.org . Archivado desde el original el 15 de marzo de 2023 . Consultado el 15 de marzo de 2023 .
  22. ^ Rønn-Jensen, Jesper (5 de octubre de 2007). "El software elimina los errores del usuario y Linkrot". Simplemente agregue agua.dk. Archivado desde el original el 11 de octubre de 2007 . Consultado el 5 de octubre de 2007 .
  23. ^ Mueller, John (14 de diciembre de 2007). "Para su información, sobre las últimas funciones de la barra Google". Blog central para webmasters de Google. Archivado desde el original el 13 de septiembre de 2008 . Consultado el 9 de julio de 2008 .
  24. ^ Bar-Yossef, Ziv; Broder, Andrei Z.; Kumar, Ravi; Tomkins, Andrés (2004). "Sic transit gloria telae: hacia una comprensión de la decadencia de la Web". Actas de la decimotercera conferencia internacional sobre la World Wide Web - WWW '04 . págs. 328–337. CiteSeerX 10.1.1.1.9406 . doi : 10.1145/988672.988716. ISBN  978-1581138443.

enlaces externos