stringtranslate.com

e-Ciencia

La e-ciencia o eScience es una ciencia que requiere un uso intensivo de recursos computacionales y que se lleva a cabo en entornos de red altamente distribuidos, o una ciencia que utiliza conjuntos de datos inmensos que requieren computación en cuadrícula ; el término a veces incluye tecnologías que permiten la colaboración distribuida, como Access Grid . El término fue creado por John Taylor, Director General de la Oficina de Ciencia y Tecnología del Reino Unido en 1999 y se utilizó para describir una gran iniciativa de financiación que comenzó en noviembre de 2000. Desde entonces, la e-ciencia se ha interpretado de forma más amplia como "la aplicación de la tecnología informática a la realización de investigaciones científicas modernas, incluida la preparación, experimentación, recopilación de datos, difusión de resultados y almacenamiento y accesibilidad a largo plazo de todos los materiales generados a través del proceso científico. Estos pueden incluir el modelado y análisis de datos, cuadernos de laboratorio electrónicos/digitalizados, conjuntos de datos sin procesar y ajustados, producción de manuscritos y versiones preliminares, preimpresiones y publicaciones impresas y/o electrónicas". [1] En 2014, la serie de conferencias IEEE eScience condensó la definición a "eScience promueve la innovación en la investigación colaborativa, intensiva en computación o datos en todas las disciplinas, a lo largo del ciclo de vida de la investigación" en una de las definiciones de trabajo utilizadas por los organizadores. [2] La e-ciencia abarca "lo que a menudo se conoce como big data [que] ha revolucionado la ciencia... [como] el Gran Colisionador de Hadrones (LHC) en el CERN... [que] genera alrededor de 780 terabytes por año... los campos científicos modernos altamente intensivos en datos... que generan grandes cantidades de datos de e-ciencia incluyen: biología computacional , bioinformática , genómica" [1] y la huella digital humana para las ciencias sociales . [3]

El ganador del premio Turing, Jim Gray, imaginó la "ciencia intensiva en datos" o " e-ciencia " como un "cuarto paradigma" de la ciencia ( empírica , teórica , computacional y ahora basada en datos) y afirmó que "todo sobre la ciencia está cambiando debido al impacto de la tecnología de la información" y el diluvio de datos . [4] [5]

La e-ciencia revoluciona ambos pilares fundamentales del método científico : la investigación empírica , especialmente a través de los macrodatos digitales , y la teoría científica , especialmente a través de la construcción de modelos de simulación por ordenador . [6] [7] Estas ideas se reflejaron en la Oficina de Política Científica y Tecnológica de la Casa Blanca en febrero de 2013, que programó muchos de los productos de salida de la e-ciencia antes mencionados para requisitos de preservación y acceso según la directiva del memorando. [8] Las e-ciencias incluyen la física de partículas, las ciencias de la tierra y las simulaciones sociales .

Características y ejemplos

La mayor parte de las actividades de investigación en el campo de la e-ciencia se han centrado en el desarrollo de nuevas herramientas e infraestructuras computacionales para apoyar el descubrimiento científico. Debido a la complejidad del software y los requisitos de infraestructura de back-end, los proyectos de e-ciencia suelen implicar grandes equipos gestionados y desarrollados por laboratorios de investigación, grandes universidades o gobiernos. En la actualidad [ ¿cuándo? ] existe un gran interés por la e-ciencia en el Reino Unido, donde el programa de e-ciencia del Reino Unido proporciona una financiación significativa. En Europa, el desarrollo de capacidades informáticas para apoyar el Gran Colisionador de Hadrones del CERN ha llevado al desarrollo de infraestructuras de e-ciencia y Grid que también se utilizan en otras disciplinas.

Consorcios

Entre los ejemplos de infraestructuras de e-ciencia se incluyen la Worldwide LHC Computing Grid, una federación con varios socios, entre ellos la European Grid Infrastructure, la Open Science Grid y la Nordic DataGrid Facility.

Para respaldar las aplicaciones de e-ciencia, Open Science Grid combina interfaces con más de 100 clústeres a nivel nacional, 50 interfaces con cachés de almacenamiento distribuidos geográficamente y 8 redes de campus (Purdue, Wisconsin-Madison, Clemson, Nebraska-Lincoln, FermiGrid en FNAL, SUNY-Buffalo y Oklahoma en los Estados Unidos; y UNESP en Brasil). Las áreas científicas que se benefician de Open Science Grid incluyen:

Programa del Reino Unido

Tras su nombramiento como Director General de los Consejos de Investigación en 1999, John Taylor, con el apoyo del Ministro de Ciencia David Sainsbury y del Ministro de Hacienda Gordon Brown , presentó una solicitud al Tesoro de Su Majestad para financiar un programa de desarrollo de infraestructura electrónica para la ciencia que proporcionaría las bases para que la ciencia y la industria del Reino Unido fueran líderes mundiales en la economía del conocimiento que motivó la Estrategia de Lisboa para el crecimiento económico sostenible a la que se comprometió el gobierno del Reino Unido en marzo de 2000.

En noviembre de 2000, John Taylor anunció una dotación de 98 millones de libras para un programa nacional británico de e-ciencia. Se había previsto una contribución adicional de 20 millones de libras de la industria británica para fondos de contrapartida a los proyectos en los que participaba. De este presupuesto de 120 millones de libras a lo largo de tres años, 75 millones se destinarían a proyectos piloto de aplicación de la red en todas las áreas científicas, administrados por el Consejo de Investigación responsable de cada área, mientras que 35 millones serían administrados por el EPSRC como programa básico para desarrollar middleware de red "de fuerza industrial". La fase 2 del programa para 2004-2006 contó con el apoyo de otros 96 millones de libras para proyectos de aplicación y 27 millones para el programa básico del EPSRC. La fase 3 del programa para 2007-2009 contó con el apoyo de otros 14 millones de libras para el programa básico del EPSRC y una suma adicional para aplicaciones. La financiación adicional para las actividades de e-Ciencia del Reino Unido provino de fondos de la Unión Europea, de fondos del consejo de financiación universitaria SRIF para hardware, y de Jisc para redes y otra infraestructura.

El programa de e-Ciencia del Reino Unido comprendía una amplia gama de recursos, centros y personas, incluido el Centro Nacional de e-Ciencia (NeSC), que está gestionado por las Universidades de Glasgow y Edimburgo , con instalaciones en ambas ciudades. [9] Tony Hey dirigió el programa central desde 2001 hasta 2005. [10]

En el Reino Unido, los centros regionales de e-Ciencia apoyan a sus universidades y proyectos locales, entre ellos:

También hay varios centros de excelencia y centros de investigación.

Además de los centros, los proyectos piloto de aplicación de la red fueron financiados por el Consejo de Investigación responsable de cada área de financiación científica del Reino Unido.

El EPSRC financió 11 proyectos piloto de e-Ciencia en tres fases (por aproximadamente £3 millones cada uno en la primera fase):

El PPARC / STFC financió dos proyectos: GridPP (fase 1 por £17 millones, fase 2 por £5,9 millones, fase 3 por £30 millones y una cuarta fase que se extenderá entre 2011 y 2014) y Astrogrid (£14 millones en 3 fases).

Los £23 millones restantes de la financiación de la primera fase se dividieron entre los proyectos de solicitud financiados por BBSRC, MRC y NERC:

El programa de e-Ciencia financiado por el Reino Unido fue examinado tras su finalización en 2009 por un panel internacional dirigido por Daniel E. Atkins , director de la Oficina de Ciberinfraestructura de la Fundación Nacional de Ciencias de Estados Unidos . El informe concluyó que el programa había desarrollado un grupo de expertos cualificados, algunos servicios y había propiciado la cooperación entre el mundo académico y la industria, pero que estos logros se habían producido a nivel de proyecto y no mediante la generación de infraestructura o la transformación de disciplinas para adoptar la e-Ciencia como método normal de trabajo, y que no eran autosostenibles sin más inversiones.

Estados Unidos

Las iniciativas con sede en Estados Unidos, en las que el término ciberinfraestructura se utiliza habitualmente para definir los proyectos de e-ciencia, están financiadas principalmente por la oficina de ciberinfraestructura de la Fundación Nacional de Ciencias (NSF OCI) [11] y el Departamento de Energía (en particular, la Oficina de Ciencias). Tras la conclusión de TeraGrid en 2011, la Fundación Nacional de Ciencias creó y financió el programa ACCESS para ayudar a los investigadores y educadores, con o sin subvenciones de apoyo, a utilizar los sistemas y servicios informáticos avanzados del país.

Países Bajos

La investigación holandesa sobre eScience está coordinada por el Netherlands eScience Center en Ámsterdam, una iniciativa fundada por NWO y SURF.

Europa

Plan-Europe es una Plataforma de Centros Nacionales de Investigación de Datos y Ciencia Electrónica en Europa, creada durante la reunión constitutiva celebrada los días 29 y 30 de octubre de 2014 en Ámsterdam (Países Bajos) y basada en Términos de Referencia acordados. PLAN-E cuenta con un grupo central de miembros activos y se reúne dos veces al año. Puede encontrar más información en PLAN-E.

Suecia

Se han llevado a cabo dos proyectos de investigación académica en Suecia por parte de dos grupos diferentes de universidades, para ayudar a los investigadores a compartir y acceder a recursos y conocimientos informáticos científicos:

Comparación con la ciencia tradicional

La ciencia tradicional es representativa de dos tradiciones filosóficas distintas dentro de la historia de la ciencia, pero se sostiene que la e-ciencia requiere un cambio de paradigma y la incorporación de una tercera rama de las ciencias. "La idea de los datos abiertos no es nueva; de hecho, al estudiar la historia y la filosofía de la ciencia, se atribuye a Robert Boyle el mérito de enfatizar los conceptos de escepticismo , transparencia y reproducibilidad para la verificación independiente en las publicaciones académicas en la década de 1660. El método científico se dividió más tarde en dos ramas principales, los enfoques deductivo y empírico. Hoy, una revisión teórica del método científico debería incluir una nueva rama, que Victoria Stodden defiende, la del enfoque computacional, donde, al igual que los otros dos métodos, se revelan todos los pasos computacionales mediante los cuales los científicos extraen conclusiones. Esto se debe a que en los últimos 20 años, la gente ha estado lidiando con cómo manejar los cambios en la computación y la simulación de alto rendimiento ". [1] Como tal, la e-ciencia apunta a combinar tradiciones empíricas y teóricas, [3] mientras que las simulaciones por computadora pueden crear datos artificiales y los macrodatos en tiempo real pueden usarse para calibrar modelos de simulación teóricos. [7] Conceptualmente, la e-ciencia gira en torno al desarrollo de nuevos métodos para apoyar a los científicos en la realización de investigaciones científicas con el objetivo de hacer nuevos descubrimientos científicos mediante el análisis de grandes cantidades de datos accesibles a través de Internet utilizando grandes cantidades de recursos computacionales. Sin embargo, los descubrimientos de valor no pueden hacerse simplemente proporcionando herramientas computacionales, una ciberinfraestructura o realizando un conjunto predefinido de pasos para producir un resultado. Más bien, debe haber un aspecto original y creativo de la actividad que, por su naturaleza, no puede automatizarse. Esto ha dado lugar a diversas investigaciones que intentan definir las propiedades que las plataformas de e-Ciencia deben proporcionar para apoyar un nuevo paradigma de hacer ciencia, y nuevas reglas para cumplir con los requisitos de preservar y hacer disponibles los resultados de los datos computacionales de manera tal que sean reproducibles en pasos lógicos y rastreables, como un requisito intrínseco para el mantenimiento de la integridad científica moderna que permita una atenuación de la "tradición de Boyle en la era computacional". [1]

Modelado de procesos de e-ciencia

Una opinión [14] sostiene que, dado que una instancia de proceso de descubrimiento moderno cumple una función similar a una prueba matemática, debería tener propiedades similares, es decir, permitir que los resultados se reproduzcan de manera determinista cuando se vuelvan a ejecutar y que los resultados intermedios se puedan ver para facilitar el examen y la comprensión. En este caso, no basta con modelar simplemente la procedencia de los datos. Hay que modelar también la procedencia de las hipótesis y los resultados generados a partir del análisis de los datos, de modo de proporcionar evidencia que respalde los nuevos descubrimientos. Por lo tanto, se han propuesto y desarrollado flujos de trabajo científicos para ayudar a los científicos a realizar un seguimiento de la evolución de sus datos, resultados intermedios y resultados finales como un medio para documentar y realizar un seguimiento de la evolución de los descubrimientos dentro de una pieza de investigación científica.

Ciencia 2.0

Otras perspectivas incluyen la Ciencia 2.0, en la que se considera que la e-ciencia es un cambio desde la publicación de resultados finales por parte de grupos de colaboración bien definidos hacia un enfoque más abierto, que incluye el intercambio público de datos brutos, resultados experimentales preliminares e información relacionada. Para facilitar este cambio, la perspectiva de la Ciencia 2.0 se centra en proporcionar herramientas que simplifiquen la comunicación, la cooperación y la colaboración entre las partes interesadas. Este enfoque tiene el potencial de: acelerar el proceso de descubrimiento científico; superar los problemas asociados con la publicación académica y la revisión por pares; y eliminar las barreras de tiempo y costo, que limitan el proceso de generación de nuevos conocimientos.

Véase también

Referencias

  1. ^ abcd Bohle, S. "¿Qué es la ciencia electrónica y cómo debería gestionarse?" Nature.com, Spektrum der Wissenschaft (Scientific American), http://www.scilogs.com/scientific_and_medical_libraries/what-is-e-science-and-how-should-it-be-managed/.
  2. ^ IEEE International Conference on eScience, página de inicio, consultado el 18 de diciembre de 2014, https://escience-conference.org/
  3. ^ ab DT&SC 7-2: Ciencias sociales computacionales. https://www.youtube.com/watch?v=TEo0Au1brHs Del curso en línea DT&SC de la Universidad de California: https://canvas.instructure.com/courses/949415
  4. ^ Stewart Tansley; Kristin Michele Tolle (2009). El cuarto paradigma: descubrimiento científico basado en datos. Microsoft Research. ISBN 978-0-9825442-0-4.
  5. ^ Bell, G.; Hey, T.; Szalay, A. (2009). "CIENCIA DE LA COMPUTACIÓN: Más allá del diluvio de datos". Science . 323 (5919): 1297–1298. doi :10.1126/science.1170411. ISSN  0036-8075. PMID  19265007. S2CID  9743327.
  6. ^ DT&SC 7-1: Introducción a la e-ciencia: https://www.youtube.com/watch?v=9x3d75ZMuYU . Del curso en línea DT&SC de la Universidad de California: https://canvas.instructure.com/courses/949415
  7. ^ ab Hilbert, M. (2015). e-Science for Digital Development: ICT4ICT4D. Centro de Informática para el Desarrollo, SEED, Universidad de Manchester. «Copia archivada» (PDF) . Archivado desde el original (PDF) el 24 de septiembre de 2015. Consultado el 13 de agosto de 2015 .{{cite web}}: CS1 maint: copia archivada como título ( enlace )
  8. ^ Oficina Ejecutiva del Presidente, Oficina de Política Científica y Tecnológica, "Memorando para los jefes de departamentos y agencias ejecutivas: aumentar el acceso a los resultados de la investigación científica financiada por el gobierno federal". 22 de febrero de 2013, consultado el 7 de julio de 2013, https://obamawhitehouse.archives.gov/sites/default/files/microsites/ostp/ostp_public_access_memo_2013.pdf.
  9. ^ "Centro Nacional de Ciencia Electrónica". Sitio web oficial . Archivado desde el original el 16 de diciembre de 2008. Consultado el 29 de septiembre de 2011 .
  10. ^ Richard Poynder (12 de diciembre de 2006). "Una conversación con Tony Hey de Microsoft". Blog Open and Shut? . Consultado el 20 de septiembre de 2011. Resulta que en Estados Unidos eligieron otro nombre. Personalmente, creo que e-Science es un nombre mucho mejor que ciberinfraestructura.Transcripción completa Archivado el 25 de marzo de 2012 en Wayback Machine , actualizado el 15 de diciembre de 2006.
  11. ^ "Oficina de Ciberinfraestructura (OCI)" . Consultado el 19 de septiembre de 2011 .
  12. ^ "Centro Sueco de Investigación en Ciencia Electrónica (SeRC)".
  13. ^ "eSSENCE, la colaboración en e-ciencia".
  14. ^ Syed, J.; Ghanem, M.; Guo, Y. (2007). "Apoyo a los procesos de descubrimiento científico en Discovery Net". Concurrencia y computación: práctica y experiencia . 19 (2): 167. doi :10.1002/cpe.1049. S2CID  16212949.

Enlaces externos