arXiv (pronunciado " archivo "; la X representa la letra griega chi ⟨χ⟩) [1] es un depósito de acceso abierto de preimpresiones y posimpresiones electrónicas (conocidas como e-prints ) aprobadas para su publicación después de moderación, pero no revisión por pares. . Consiste en artículos científicos en los campos de las matemáticas , la física , la astronomía , la ingeniería eléctrica , la informática , la biología cuantitativa , la estadística , las finanzas matemáticas y la economía , a los que se puede acceder en línea. En muchos campos de las matemáticas y la física, casi todos los artículos científicos se autoarchivan en el repositorio arXiv antes de su publicación en una revista revisada por pares. Algunos editores también otorgan permiso a los autores para archivar la posimpresión revisada por pares . Iniciado el 14 de agosto de 1991, arXiv.org superó el hito del medio millón de artículos el 3 de octubre de 2008, [2] [3] había alcanzado el millón a finales de 2014 [4] [5] y los dos millones a finales de 2014. finales de 2021. [6] [7] En abril de 2021, la tasa de presentación es de aproximadamente 16.000 artículos por mes. [8]
arXiv fue posible gracias al formato de archivo compacto TeX , que permitió que los artículos científicos se transmitieran fácilmente a través de Internet y se presentaran en el lado del cliente . [11] Alrededor de 1990, Joanne Cohn comenzó a enviar por correo electrónico preimpresiones de física a sus colegas como archivos TeX, pero la cantidad de artículos enviados pronto llenó los buzones de correo al máximo. [12] Paul Ginsparg reconoció la necesidad de un almacenamiento central y en agosto de 1991 creó un buzón de repositorio central almacenado en el Laboratorio Nacional de Los Álamos (LANL) al que se podía acceder desde cualquier computadora. [13] Pronto se agregaron modos de acceso adicionales: FTP en 1991, Gopher en 1992 y World Wide Web en 1993. [5] [14] El término e-print se adoptó rápidamente para describir los artículos.
Comenzó como un archivo de física, llamado archivo de preimpresión LANL , pero pronto se expandió para incluir astronomía, matemáticas, informática, biología cuantitativa y, más recientemente, estadística. Su nombre de dominio original era xxx.lanl.gov. Debido a la falta de interés de LANL en la tecnología en rápida expansión, en 2001 Ginsparg cambió de institución a la Universidad de Cornell y cambió el nombre del repositorio a arXiv.org. [15] Ahora está alojado principalmente en Cornell, con cinco espejos en todo el mundo. [dieciséis]
arXiv fue uno de los primeros en adoptar y promover los preprints . [17] Su éxito al compartir preimpresiones fue uno de los factores precipitantes que llevaron al movimiento posterior en la publicación científica conocido como acceso abierto . [17] Los matemáticos y científicos suben periódicamente sus artículos a arXiv.org para acceder a ellos en todo el mundo [18] y, a veces, para realizar revisiones antes de publicarlos en revistas revisadas por pares . Ginsparg recibió una beca MacArthur en 2002 por su creación de arXiv. [19] El presupuesto anual de arXiv fue de aproximadamente 826 000 dólares entre 2013 y 2017, financiado conjuntamente por la Biblioteca de la Universidad de Cornell, la Fundación Simons (tanto en forma de donación como de subvención de desafío ) y los ingresos por cuotas anuales de las instituciones miembros. [20] Este modelo surgió en 2010, cuando Cornell buscó ampliar la financiación financiera del proyecto pidiendo a las instituciones que hicieran contribuciones voluntarias anuales basadas en la cantidad de uso de descargas por parte de cada institución. Cada institución miembro se compromete a un compromiso de financiación de cinco años para apoyar arXiv. Según la clasificación de uso institucional, las tarifas anuales se establecen en cuatro niveles, desde $1000 hasta $4400. El objetivo de Cornell es recaudar al menos 504.000 dólares al año a través de las cuotas de membresía generadas por aproximadamente 220 instituciones. [21]
En septiembre de 2011, la Biblioteca de la Universidad de Cornell asumió la responsabilidad administrativa y financiera general del funcionamiento y desarrollo de arXiv. Ginsparg fue citado en el Chronicle of Higher Education diciendo que "se suponía que sería un recorrido de tres horas , no una sentencia de cadena perpetua". [22] Sin embargo, Ginsparg permanece en el Consejo Asesor Científico de arXiv y en su Comité Asesor de Física. [23] [24]
En enero de 2022, arXiv comenzó a asignar DOI a artículos, en colaboración con DataCite . [25]
Cada artículo arXiv tiene un identificador único:
YYMM.NNNNN
, p.ej 1507.00123
,YYMM.NNNN
, p.ej 0704.0001
,arch-ive/YYMMNNN
para documentos más antiguos, por ejemplo hep-th/9901001
.Las diferentes versiones del mismo artículo se especifican mediante un número de versión al final. Por ejemplo, 1709.08980v1
. Si no se especifica ningún número de versión, el valor predeterminado es la última versión.
arXiv utiliza un sistema de categorías. Cada artículo está etiquetado con una o más categorías. Algunas categorías tienen dos capas. Por ejemplo, q-fin.TR
está la categoría "Comercio y microestructura de mercado" dentro de "finanzas cuantitativas". Otras categorías tienen una capa. Por ejemplo, hep-ex
se trata de "experimentos de física de alta energía".
Aunque arXiv no es revisado por pares , un grupo de moderadores de cada área revisa los envíos ; pueden recategorizar cualquiera que se considere fuera de tema [26] o rechazar envíos que no sean artículos científicos o, a veces, por razones no reveladas. [27] Las listas de moderadores de muchas secciones de arXiv están disponibles públicamente, [28] pero los moderadores de la mayoría de las secciones de física permanecen sin listar.
Además, en 2004 se introdujo un sistema de "respaldo" como parte de un esfuerzo por garantizar que el contenido sea relevante y de interés para la investigación actual en las disciplinas especificadas. [29] Según el sistema, para las categorías que lo utilizan, un autor debe estar respaldado por un autor establecido de arXiv antes de que se le permita enviar artículos a esas categorías. A los patrocinadores no se les pide que revisen el artículo en busca de errores, sino que verifiquen si es apropiado para el área temática prevista. [26] Los nuevos autores de instituciones académicas reconocidas generalmente reciben un respaldo automático, lo que en la práctica significa que no necesitan lidiar con el sistema de respaldo en absoluto. Sin embargo, el sistema de respaldo ha generado críticas por supuestamente restringir la investigación científica. [30] [31]
La mayoría de las impresiones electrónicas también se envían a revistas para su publicación, pero algunos trabajos, incluidos algunos artículos muy influyentes, permanecen puramente como impresiones electrónicas y nunca se publican en una revista revisada por pares. Un ejemplo bien conocido de esto último es un resumen de una prueba de la conjetura de geometrización de Thurston , incluida la conjetura de Poincaré como caso particular, subido por Grigori Perelman en noviembre de 2002. [32] Perelman parece contento con renunciar a la tradicional revista revisada por pares proceso, afirmando: "Si alguien está interesado en mi forma de resolver el problema, está todo ahí [en arXiv]; déjelo ir y leer sobre ello". [33] A pesar de este método de publicación no tradicional, otros matemáticos reconocieron este trabajo ofreciendo la Medalla Fields y los Premios del Milenio Clay de Matemáticas a Perelman, los cuales rechazó. [34]
Si bien arXiv contiene algunas impresiones electrónicas dudosas, como aquellas que afirman refutar teoremas famosos o probar conjeturas famosas como el último teorema de Fermat utilizando únicamente matemáticas de la escuela secundaria, un artículo de 2002 que apareció en Notices of the American Mathematical Society las describió como " sorprendentemente raro". [35] arXiv generalmente reclasifica estos trabajos, por ejemplo en "Matemáticas generales", en lugar de eliminarlos; [36] Sin embargo, algunos autores han expresado su preocupación por la falta de transparencia en el proceso de selección de arXiv. [27]
Los artículos se pueden enviar en cualquiera de varios formatos, incluido LaTeX y PDF impreso desde un procesador de texto que no sea TeX o LaTeX. El software arXiv rechaza el envío si falla la generación del archivo PDF final , si algún archivo de imagen es demasiado grande o si el tamaño total del envío es demasiado grande. arXiv ahora permite almacenar y modificar un envío incompleto y solo finalizarlo cuando esté listo. La marca de tiempo en el artículo se establece cuando finaliza el envío.
La ruta de acceso estándar es a través del sitio web arXiv.org o uno de varios espejos. Otras organizaciones no asociadas también han creado otras interfaces y rutas de acceso.
Los metadatos para arXiv están disponibles a través de OAI-PMH , el estándar para repositorios de acceso abierto . [37] Por lo tanto, el contenido está indexado en todos los principales consumidores de dichos datos, como BASE , CORE y Unpaywall . A partir de 2020, el volcado de Unpaywall vincula más de 500.000 URL de arxiv como la versión de acceso abierto de un trabajo que se encuentra en los datos CrossRef de los editores, lo que convierte a arXiv en uno de los 10 principales servidores mundiales de acceso abierto ecológico .
Finalmente, los investigadores pueden seleccionar subcampos y recibir correos electrónicos diarios o canales RSS de todos los envíos realizados en ellos.
Los archivos en arXiv pueden tener varios estados de derechos de autor diferentes: [38]
Se pronuncia "archivo". La X representa la letra griega chi [ χ ].
El nuevo sistema de respaldo puede contribuir a una barrera eficaz, una brecha digital