El Renaissance Computing Institute (RENCI) se lanzó en 2004 como una colaboración entre el estado de Carolina del Norte , la Universidad de Carolina del Norte en Chapel Hill (UNC-CH), la Universidad de Duke y la Universidad Estatal de Carolina del Norte . RENCI está estructurado organizacionalmente como un instituto de investigación dentro de la UNC-CH, y su campus principal está ubicado en Chapel Hill, Carolina del Norte , a unas pocas millas del campus de la UNC-CH. RENCI tiene centros de participación en la UNC-CH, la Universidad de Duke (Durham) y la Universidad Estatal de Carolina del Norte (Raleigh).
El director fundador de RENCI fue Daniel A. Reed; Stanley C. Ahalt es el director actual. RENCI emplea a más de 80 personas.
La misión actual de RENCI es: "desarrollar e implementar tecnologías avanzadas para permitir descubrimientos de investigación e innovaciones prácticas". [1] RENCI logra su misión al asociarse con investigadores académicos, formuladores de políticas gubernamentales y líderes de la industria para participar en la investigación y el desarrollo destinados a resolver desafíos críticos en varias áreas de enfoque: ciencia de datos y ciberinfraestructura; ciencias ambientales; y ciencias biomédicas y de la salud.
RENCI fue fundada en enero de 2004 por el Dr. Daniel A. Reed, con financiación del Estado de Carolina del Norte, UNC-CH, la Universidad Estatal de Carolina del Norte y la Universidad de Duke. [2] [3] El Dr. Reed se desempeñó anteriormente como director del Centro Nacional para Aplicaciones de Supercomputación (NCSA), arquitecto jefe de la iniciativa TeraGrid de la Fundación Nacional de Ciencias (NSF) y miembro del Comité Asesor de Tecnología de la Información del Presidente. En mayo de 2004, Alan Blatecky se unió a RENCI como subdirector. El Sr. Blatecky se desempeñó anteriormente como director ejecutivo del Centro de Supercomputación de San Diego y jefe de la iniciativa NSF Middleware.
La declaración de misión inicial de RENCI fue:
Servir como un instituto multidisciplinario que conecte la academia, el comercio y la sociedad para enriquecer y potenciar el potencial humano, crear asociaciones multiinstitucionales y desarrollar e implementar infraestructura computacional líder a nivel mundial.
En diciembre de 2005, RENCI recibió $5,9 millones en fondos del estado de Carolina del Norte para el año fiscal 2005-2006 y $11,8 millones en fondos recurrentes para "apoyo del personal, operaciones informáticas y equipos". Esta financiación fue fundamental para RENCI, ya que desarrolló una infraestructura estatal para crear una organización virtual y aprovechar esa infraestructura y la experiencia del personal de RENCI para participar en proyectos financiados por el gobierno federal de interés para el estado. El enfoque inicial de RENCI fue la aplicación de tecnologías cibernéticas y análisis avanzados a la planificación, mitigación y respuesta ante desastres costeros. Desde entonces, RENCI ha participado en diversas asociaciones en todo Carolina del Norte y en todo el país. Esas asociaciones han dado como resultado numerosas subvenciones federales, lo que ha proporcionado a la organización una fuente de ingresos adicional.
En 2007, la RENCI sufrió un cambio de liderazgo, con la salida del Dr. Reed y el nombramiento del Sr. Blatecky como director interino. Durante este período, la RENCI implementó su primer proceso de planificación estratégica. El proceso dio lugar a una declaración de misión revisada:
El Renaissance Computing Institute, una organización multiinstitucional, reúne expertos multidisciplinarios y capacidades tecnológicas avanzadas para abordar problemas de investigación urgentes y encontrar soluciones a problemas complejos que afectan la calidad de vida en Carolina del Norte, nuestra nación y el mundo.
En 2009, el Dr. Stanley C. Ahalt fue designado director. El Dr. Ahalt se desempeñó anteriormente como director ejecutivo del Centro de Supercomputación de Ohio (OSC) y fue profesor en el Departamento de Ingeniería Eléctrica e Informática de la Universidad Estatal de Ohio (OSU). Al llegar al RENCI, el Dr. Ahalt recibió un nombramiento conjunto como profesor en el departamento de informática de la UNC-CH.
Ashok Krishnamurthy, PhD, fue nombrado subdirector en febrero de 2013. El Dr. Krishnamurthy anteriormente fue director de investigación y desarrollo científico en OSC y profesor asociado en el Departamento de Ingeniería Informática y Eléctrica en OSU.
Bajo el liderazgo de los doctores Ahalt y Krishnamurthy, el RENCI amplió su personal, sus socios externos y la amplitud de sus actividades. Se han puesto en marcha varias asociaciones e iniciativas clave. La primera es una asociación con la Facultad de Medicina de la UNC-CH para un premio del Centro de Ciencias Clínicas y Traslacionales de los Institutos Nacionales de Salud (NIH), que condujo a la creación del Instituto de Ciencias Clínicas y Traslacionales de Carolina del Norte en 2008 (NC TraCS). Los doctores Ahalt y Krishnamurthy se desempeñan como director y codirector, respectivamente, del Servicio de Informática Biomédica dentro de NC TraCS. Una segunda actividad clave fue la fundación del Instituto de Software de Ciencias del Agua (WSSI), que fue cofundado por el RENCI y el Centro Nacional de Síntesis Socioambiental (SESYNC) en septiembre de 2012. Una tercera actividad clave fue la creación del Consorcio Nacional para la Ciencia de Datos (NCDS) en febrero de 2013. El NCDS tiene su sede en el RENCI e incluye miembros provenientes del mundo académico, la industria y el gobierno. Por último, una cuarta actividad clave fue la creación del Consorcio iRODS en marzo de 2013. El Consorcio iRODS también tiene su sede en RENCI e incluye una membresía internacional diversa.
RENCI tiene una serie de programas de investigación activos que apuntan al desarrollo y despliegue de capacidades avanzadas de computación y redes. Muchas de las tecnologías resultantes son de código abierto. Por ejemplo, el ExoGENI (Exo-Global Environment for Network Innovation) de código abierto se está desarrollando como parte de la iniciativa GENI financiada por la NSF. [4] [5] ExoGENI funciona como una plataforma de infraestructura en red como servicio (NIaaS) federada y basada en la nube para el aprovisionamiento dinámico de recursos de red, almacenamiento y computación. ADAMANT (Adaptive Data-Aware Multi-domain Application Network Topologies), también financiado por la NSF, se basa en ExoGENI. ADAMANT integra el sistema de flujo de trabajo científico Pegasus (gestión de flujo de trabajo) y HT Condor con la plataforma NIaaS de ExoGENI para orquestar la ejecución de flujos de trabajo científicos a gran escala sobre recursos distribuidos en la nube o de computación tradicional de alto rendimiento. iRODS (sistema integrado de datos orientado a reglas) fue desarrollado por los centros de entornos cibernéticos intensivos en datos (DICE) de la UNC-CH y la Universidad de California en San Diego, y actualmente lo mantiene RENCI. iRODS es una tecnología de middleware de código abierto diseñada para proporcionar un control basado en políticas sobre el acceso, el movimiento, el uso y el archivo de datos en sitios geográficos, tecnologías de almacenamiento dispares y múltiples grupos de usuarios, cada uno con diferentes políticas con respecto al acceso y el uso de los datos. [6] [7] [8] [9] RADII (infraestructura colaborativa centrada en datos consciente de los recursos; cita web) integra ORCA (arquitectura de control de recursos abiertos) de GENI con iRODS para proporcionar dinámicamente una infraestructura distribuida basada en la nube para colaboraciones de investigación basadas en datos multiinstitucionales. RADII logra esto a través de un software diseñado para modelar datos de investigación y mapear elementos de datos, cálculos y almacenamiento en la infraestructura física subyacente de iRODS. DataBridge tiene como objetivo proporcionar un sistema de red sociométrica multidimensional para compartir colecciones de datos de cola larga. [10] [11] [12] DataBridge es una herramienta de colaboración de código abierto que permite a los científicos explorar los conjuntos de datos disponibles y sus algoritmos relevantes y definir puentes semánticos para vincularse y acceder a diversos conjuntos de datos dentro de la red sociométrica.
Muchos de los proyectos de RENCI en Ciencias Ambientales se centran en la hidrología , las mareas de tormenta costeras y el modelado avanzado para ayudar en la preparación ante desastres. ADCIRC es un modelo de software de código abierto que aplica análisis avanzados a múltiples fuentes y tipos de datos (por ejemplo, conjuntos de datos hidrológicos, conjuntos de datos atmosféricos, datos de pronóstico de tormentas tropicales, datos del Sistema de Información Geográfica , etc.) para permitir la predicción en tiempo real y de alta resolución del impacto de las mareas de tormenta costeras y las inundaciones después de huracanes y eventos relacionados. [13] [14] En colaboración con investigadores del Centro de Resiliencia Costera de la UNC y el Centro Nacional de Huracanes , ADCIRC se está desarrollando como un sistema de pronóstico costero para ayudar con la planificación de desastres estatales y federales y el apoyo a la toma de decisiones. EarthCube es una iniciativa financiada por la NSF que tiene como objetivo "desarrollar un marco durante la próxima década para ayudar a los investigadores a comprender y predecir el sistema terrestre desde el Sol hasta el centro de la Tierra". [15] [16] EarthCube se está diseñando como una ciberinfraestructura dinámica abierta para permitir el intercambio de datos gobernado por la comunidad en las geociencias, incluidas las ciencias oceánicas , los estudios polares, las ciencias atmosféricas, el geoespacio, la informática y otros campos. HydroShare cuenta con el apoyo de CUAHSI (Consorcio de Universidades para el Avance de la Ciencia Hidrológica Inc.) financiado por la NSF y se está desarrollando como una ciberinfraestructura de colaboración abierta para la hidrología. [17] [18] [19] HydroShare permite a los científicos del agua identificar y recuperar conjuntos de datos relacionados con el agua y algoritmos y modelos asociados y luego analizar y calcular los datos utilizando un entorno informático distribuido que incluye la nube basada en cuadrícula y capacidades de computación y almacenamiento de alto rendimiento.
Un enfoque principal del trabajo de RENCI en las ciencias biomédicas y de la salud es la genómica clínica. RENCI trabaja con NC TraCS, el Lineberger Comprehensive Cancer Center en UNC-CH y la División de Informática de Investigación de Servicios de Tecnología de la Información de UNC para desarrollar e implementar tecnologías que respalden las tecnologías de secuenciación genómica de próxima generación, como la secuenciación del genoma completo (WGS) y la secuenciación del exoma completo (WES). Estas tecnologías incluyen el motor GMW (Genetic Medical Workflow), que fue financiado en parte por el NIH y proporciona captura, análisis, validación y generación de informes de extremo a extremo de datos WGS y WES. El motor GMW está diseñado como una arquitectura de código abierto que coordina flujos de trabajo, subflujos de trabajo, muestras, datos y personas para respaldar todos los aspectos de la investigación genómica y la aplicación clínica, desde la visita inicial del paciente hasta el informe guiado por el médico de los hallazgos genómicos. [20] MapSeq (Masively Parallel Sequencing) es una arquitectura orientada a servicios (SOA) basada en complementos de código abierto que proporciona una gestión y ejecución seguras de los complejos pasos analíticos y computacionales posteriores involucrados en la secuenciación genómica de alto rendimiento y otras aplicaciones intensivas en datos. [21] MaPSeq y su tecnología hermana de cosecha propia, GATE (Grid Access Triage Engine), están construidas sobre Apache Karaf y juntas proporcionan capacidades extensibles para el análisis posterior de datos genómicos y otros grandes conjuntos de datos, incluida la ejecución y gestión de la canalización del flujo de trabajo, la metaprogramación de trabajos del flujo de trabajo, el uso oportunista de los recursos informáticos, la transferencia segura de datos y el acceso del cliente basado en la web. CANVAS (CAroliNa Variant Annotation Store) y AnnoBot (Annotation Bot) trabajan juntos para proporcionar anotación y metadatos controlados por versiones para los datos de variantes genómicas con el fin de respaldar la interpretación clínica actualizada de las variantes genómicas y, de ese modo, guiar la toma de decisiones clínicas. [22] CANVAS está diseñado como una base de datos relacional PostgreSQL de código abierto que almacena datos de variantes genómicas con anotaciones y metadatos asociados. AnnoBot consta de módulos Python y código de controlador de software configurado para proporcionar monitoreo y recuperación automatizados de fuentes de datos externas para actualizaciones de anotaciones. CHAT (Convergent Haplotype Association Tagging) es un algoritmo de software que permite la identificación de variantes genómicas moderadamente penetrantes utilizando estructuras genéticas entre poblaciones. CHAT invoca un algoritmo basado en la teoría de grafos para determinar la fase del haplotipo de una población de individuos no relacionados mediante: la identificación de subconjuntos de individuos que comparten una región del genoma a través de la descendencia; y luego la generación de un haplotipo de consenso para la región compartida. [23] El SMW(Secure Medical Workspace) proporciona un entorno seguro para el acceso a datos confidenciales de pacientes para atención clínica o investigación clínica aprobada por la Junta de Revisión Institucional . [24] [25] La arquitectura SMW de código abierto utiliza tecnología de virtualización (es decir, VMWare ) y tecnología de protección contra fugas de datos (DLP) (es decir, WebSense ) para crear un espacio de trabajo virtual seguro junto con la capacidad de prevenir (o permitir con un desafío y auditoría por parte del personal de tecnología de la información) la eliminación física de datos de un entorno de almacenamiento central y seguro.
RENCI fue pionero en la creación de un instituto nacional, el WSSI, y de dos consorcios importantes, el Consorcio iRODS y el NCDS.
El WSSI, financiado por la NSF, se estableció en septiembre de 2012 como una colaboración entre RENCI y SESYNC. La misión del WSSI es "posibilitar y acelerar una nueva ciencia del agua transformadora transformando simultáneamente tanto la cultura del software como la cultura de investigación de la comunidad científica del agua". [26] [27] Cuando esté en pleno funcionamiento, el WSSI tiene como objetivo operar bajo el Modelo de Participación Comunitaria Abierta, que integrará múltiples iniciativas financiadas por la NSF (Centros de Síntesis, Observatorios Ambientales, Institutos de Sostenibilidad del Software, etc.) para destilar datos, ideas, teorías y métodos y, de ese modo, proporcionar información sintética para abordar los desafíos de la ciencia del agua que no se pueden abordar utilizando métodos disciplinarios tradicionales. Las actividades del WSSI se centran en el desarrollo de una comunidad abierta y la promoción del desarrollo de software de código abierto y ágil para acelerar la investigación transformadora de la ciencia del agua. Además de RENCI y SESYNC, los miembros actuales incluyen el Instituto de Medio Ambiente de la UNC-CH, la Universidad de Illinois en Urbana-Champaign , la Universidad de Michigan , la Universidad de Maryland , NCSA, RedHat , la Administración Nacional Oceánica y Atmosférica e IBM .
El NCDS fue establecido por RENCI en febrero de 2013 como una asociación pública/privada de universidades líderes, agencias gubernamentales y sin fines de lucro, y empresas dedicadas al avance de la ciencia de datos, que el NCDS define como "el estudio sistemático de la organización y el uso de datos digitales para acelerar el descubrimiento, mejorar los procesos críticos de toma de decisiones y permitir una economía impulsada por datos". [28] La misión del NCDS es "proporcionar la base necesaria para avanzar en la investigación, la educación y las oportunidades económicas en materia de ciencia de datos". El NCDS trabaja para lograr esta misión proporcionando liderazgo intelectual y organizando numerosos talleres, una beca de profesores académicos e industriales, una serie de cursos cortos de verano de Data Matters, eventos profesionales para estudiantes, charlas invitadas y reuniones cumbre. Además, el NCDS patrocina un Observatorio de Datos, que proporciona una infraestructura federada compartida para compartir y computar datos. El NCDS también se asocia con numerosos esfuerzos regionales en ciencia de datos, incluidos Datapalooza, Triangle Open Data Day, Pearl Hacks, Data4Decisions, Analytics Forward UnConference y otros. A partir de junio de 2015, el NCDS está compuesto por 15 organizaciones miembros, 8 de ellas con sede en Carolina del Norte y 4 empresas multinacionales con una fuerte presencia en el área de Research Triangle Park , Carolina del Norte.
El consorcio iRODS fue fundado por RENCI en marzo de 2013 y tiene su sede en RENCI, al igual que el equipo principal de desarrollo de iRODS. La misión del consorcio es "garantizar la sostenibilidad del sistema integrado de datos orientado a reglas (iRODS) y promover su adopción y evolución continua". [29] Para lograr su misión, el consorcio trabaja para desarrollar estándares para la tecnología iRODS de código abierto y su desarrollo futuro, promover avances para la tecnología y expandir la base de usuarios. El consorcio también apoya el desarrollo de una versión de iRODS de nivel de producción y de misión crítica (actualmente v4.1). El consorcio iRODS incluye una membresía diversa de organizaciones de usuarios de iRODS de todo el mundo. Los miembros actuales del consorcio incluyen a RENCI, los Centros DICE en UNC-CH y la Universidad de California, San Diego, DataDirect Networks , Seagate Technology , Wellcome Trust Sanger Institute , EMC Corporation (EMC2), IBM y el Centro de Datos de Ciencias Atmosféricas de la NASA.
35°56′22″N 79°01′08″W / 35.939561°N 79.018753°W / 35.939561; -79.018753