DataNet , o Sustainable Digital Data Preservation and Access Network Partner , fue un programa de investigación de la Oficina de Ciberinfraestructura de la Fundación Nacional de Ciencias de Estados Unidos. La oficina anunció una solicitud de propuestas con este título el 28 de septiembre de 2007. [1] El párrafo inicial de su sinopsis describe el programa como:
La investigación y la educación en ciencia e ingeniería son cada vez más digitales y hacen un uso cada vez más intensivo de los datos. Los datos digitales no sólo son el resultado de la investigación, sino que también proporcionan información para nuevas hipótesis, lo que permite nuevos conocimientos científicos e impulsa la innovación. En eso reside uno de los principales desafíos de esta generación científica: cómo desarrollar nuevos métodos, estructuras de gestión y tecnologías para gestionar la diversidad, el tamaño y la complejidad de los conjuntos y flujos de datos actuales y futuros. Esta convocatoria aborda ese desafío mediante la creación de un conjunto de organizaciones de infraestructura de investigación de datos nacionales y mundiales ejemplares (denominadas DataNet Partners) que brinden oportunidades únicas a las comunidades de investigadores para avanzar en la investigación y el aprendizaje de la ciencia y/o la ingeniería.
La introducción de la convocatoria [2] continúa diciendo:
El Capítulo 3 (Datos, análisis de datos y visualización) de la Visión de ciberinfraestructura de la NSF para el descubrimiento del siglo XXI presenta una visión en la que “los datos digitales científicos y de ingeniería se depositan de forma rutinaria en forma bien documentada, son consultados y analizados de forma regular y sencilla tanto por especialistas como por no especialistas, son de libre acceso mientras están protegidos adecuadamente y se conservan de forma fiable”. El objetivo de esta convocatoria es catalizar el desarrollo de un sistema de recopilación de datos científicos y de ingeniería que sea abierto, extensible y evolutivo.
El plan inicial exigía una iniciativa de 100 millones de dólares: cinco premios de 20 millones de dólares cada uno durante cinco años con la posibilidad de seguir financiando. Los premios se otorgaron en dos rondas. En la primera ronda, para la que las propuestas completas debían presentarse el 21 de marzo de 2008, se otorgaron dos propuestas de DataNet. DataONE , [3] dirigida por William Michener en la Universidad de Nuevo México, cubre ecología, evolución y ciencias de la tierra. The Data Conservancy, [4] dirigida por Sayeed Choudhury de la Universidad Johns Hopkins , se centra en astronomía, ciencias de la tierra, ciencias de la vida y ciencias sociales.
Para la segunda ronda, las propuestas preliminares debían presentarse el 6 de octubre de 2008 y las propuestas completas el 16 de febrero de 2009. Las adjudicaciones de la segunda ronda se retrasaron mucho y la financiación se redujo sustancialmente de 20 millones de dólares por proyecto a 8 millones de dólares. [5] La financiación de tres proyectos de la segunda ronda comenzó en el otoño de 2011. SEAD: Sustainable Environment through Actionable Data, [6] dirigido por Margaret Hedstrom de la Universidad de Michigan , busca proporcionar software y servicios de curación de datos para la "larga cola" de productores de datos de pequeña y mediana escala en el dominio de la ciencia de la sostenibilidad . El Consorcio de la Federación DataNet, [7] dirigido por Reagan Moore de la Universidad de Carolina del Norte , utiliza el Sistema integrado de datos orientado a reglas (iRODS) para proporcionar una infraestructura de cuadrícula de datos para la ciencia y la ingeniería. Terra Populus , [8] dirigido por Steven Ruggles de la Universidad de Minnesota, se centra en herramientas para la integración de datos en los dominios de las ciencias sociales y los datos ambientales, lo que permite la interoperabilidad de los tres principales formatos de datos utilizados en estos dominios: microdatos, datos de área y datos raster.
Algunos de sus objetivos se incorporaron posteriormente al programa Bloques de construcción de infraestructura de datos . [9]