stringtranslate.com

Objetivo (proyecto)

Target es el nombre de un proyecto de investigación colaborativo especializado en procesamiento y gestión de big data en el norte de los Países Bajos. [1] Se trata de una cooperación público-privada, iniciada en 2009 y apoyada por subvenciones gubernamentales. [2] Está dirigido por un consorcio de diez socios académicos y de la industria informática, coordinados por la Universidad de Groningen , e investiga la gestión de datos de proyectos científicos en el área de astronomía, ciencias biológicas, inteligencia artificial y diagnóstico médico.

En el proyecto Target cooperan varias divisiones de la Universidad de Groningen, su centro médico , IBM , Oracle , ASTRON y las empresas holandesas de TI Elkoog/ Heeii y Nspyre.

El centro de computación de Target está alojado en el Centro de Tecnología de la Información, el centro de computación de la Universidad de Groningen, y consta de más de 10 petabytes de almacenamiento [3] [4] basado en la tecnología de almacenamiento GPFS de IBM , [5] un alto -Clúster de computación de alto rendimiento y un clúster grid , que forma parte de la infraestructura Grid europea .

El centro de datos de Target está alojado en el Centro Donald Smits de Tecnología de la Información ubicado en la Universidad de Groningen , Países Bajos.

Historia

El proyecto se inició para transferir la experiencia de los astrónomos en el procesamiento masivo de datos a otras áreas de la ciencia. Target se basa en un entorno informático distribuido llamado Astro-WISE. [6] [7] El propio Astro-WISE se originó como una iniciativa del Grupo de Trabajo de Imágenes de Campo Amplio de OPTICON, que se creó para considerar un sistema de encuestas europeo estandarizado para facilitar la investigación, la reducción de datos y la extracción de datos utilizando datos de la nueva generación de cámaras de reconocimiento de campo amplio [8] El proyecto Target se lanzó en 2009 después de recibir 32 millones de euros [9] de financiación para un período de cinco años del Fondo Europeo de Desarrollo Regional , el Ministerio holandés de Asuntos Económicos ("Pieken in de Delta" proyecto), y las provincias de Groningen y Drenthe. El proyecto se ejecuta bajo los auspicios de la Alianza de las Provincias del Norte de los Países Bajos (SNN) y el municipio de Groningen.

Hallazgos tecnológicos

Al inicio del proyecto, uno de los objetivos era desarrollar un único sistema de procesamiento integrado, que constara de un sistema de archivos a escala de varios petabytes [10] y varios tipos diferentes de grid y clusters de computación. [11] Durante los primeros años se hizo evidente que los requisitos para las diferentes disciplinas de la e-Ciencia son diferentes. En algunas zonas se produce un esfuerzo masivo de transmisión de datos, como en Lofar . En astronomía, el número de objetos de datos puede ascender a miles de millones, con un número limitado de columnas de datos. [12] En genómica , el número de filas es pequeño, pero el número de columnas puede ser enorme, de cientos de miles. Otras áreas, como la recuperación visual de textos en el motor de búsqueda de manuscritos históricos de Monk, se encuentran en una posición intermedia con cientos de millones de filas y miles de dimensiones. Además, las aplicaciones genómicas a menudo requieren un estricto control de acceso, [13] mientras que otras disciplinas no tienen problemas de privacidad. En consecuencia, los diversos subproyectos dentro de Target adoptaron un enfoque pragmático sobre qué aspectos de la tecnología WISE y los componentes de la infraestructura de hardware de Target eran aplicables a su campo.

Proyectos

Target participa en una serie de proyectos científicos con uso intensivo de datos en astronomía, visualización de Big Data (colaboración con el centro eScience de Ámsterdam), [14] algoritmos de reconocimiento de texto escrito a mano , investigación médica sobre el envejecimiento saludable, desarrollo de herramientas de diagnóstico para la enfermedad de Parkinson y más. .

Archivo a largo plazo LOFAR

Target ha desarrollado y mantiene el Archivo a Largo Plazo LOFAR .

Gran parte de los datos del telescopio LOFAR se almacenan, se accede a ellos y se archivan en el archivo LOFAR a largo plazo, diseñado por ASTRON y Target. [15] [16] [17] Los datos se alojarán en el centro de datos de Target y en varios otros centros europeos.

Monje

Una captura de pantalla de una página del Archivo del Gabinete de la Reina de Holanda (KdK) en la que Monk encontró la palabra Groningen.

Monk es un sistema desarrollado por Schomaker y su grupo en el Instituto de Inteligencia Artificial (ALICE) de la Universidad de Groningen . Utiliza algoritmos de reconocimiento de patrones y aprendizaje automático para el reconocimiento de texto escrito a mano en una variedad de archivos existentes. [18] [19] [20] Actualmente, Monk ha ingerido varios libros de los Archivos Nacionales Holandeses, así como más de 70 colecciones históricas internacionales, que van desde manuscritos occidentales y medievales hasta manuscritos chinos. Los sistemas aplican aprendizaje automático continuo ("24 horas al día, 7 días a la semana") a través de Internet, lo que produce resultados fundamentales. [ vago ] [21] El sistema MONK emplea el recurso computacional y de almacenamiento de Target. Recientemente se convirtió en parte de una colaboración, dirigida por el Prof. Popovic del Departamento de Teología y Estudios Religiosos de la Universidad de Groningen, quien utilizará una combinación de datación por carbono, paleografía y técnicas de reconocimiento de texto/imagen para intentar identificar a los autores del Manuscritos populares de los Rollos del Mar Muerto . [22]

Líneas de vida

LifeLines es un proyecto de investigación médica a largo plazo dirigido por el Centro Médico Universitario de Groningen (UMCG) . Se recopilará una serie de datos de genotipo y fenotipo de 165.000 personas una vez cada cinco años durante un período total de treinta años. Los datos acumulados serán utilizados por investigadores y especialistas médicos para obtener información sobre los procesos relacionados con el envejecimiento y comprender por qué la degradación de la salud relacionada con la edad varía tanto. [23] Target proporciona a LifeLines la infraestructura para el almacenamiento, acceso y procesamiento de datos. Los datos de LifeLines, así como la infraestructura SURFsara y Target, se utilizaron en el proyecto Genoma de los Países Bajos, dirigido por un consorcio de UMCG , LUMC , Erasmus MC, UMCU y la Universidad Libre de Ámsterdam . Los resultados del proyecto que utiliza la secuenciación del genoma completo para deducir la estructura poblacional y la historia demográfica de la población holandesa se publicaron en junio en la revista Nature Genetics . [24] [25]

Vislumbres

Dirigido por K. Leenders, profesor de neurología en la UMCG , GLIMPS es un proyecto de investigación destinado a encontrar herramientas de diagnóstico más rápidas y fiables para la enfermedad de Parkinson. [26] GLIMPS explora las posibilidades de utilizar algoritmos complejos basados ​​en imágenes y exploraciones PET para la detección temprana del Parkinson. [ cita necesaria ] Para probar la eficacia de dichos algoritmos, GLIMPS está creando una gran base de datos de exploraciones PET realizadas por numerosos hospitales de los Países Bajos. Target es responsable de crear y mantener la base de datos GLIMPS, así como de garantizar el buen funcionamiento de los algoritmos basados ​​en imágenes en sus instalaciones informáticas.

Otros

Además, Target participa en la gestión de datos para otros proyectos astronómicos como el estudio astronómico KiDs/VIKING [27] [28] utilizando OmegaCAM, [29] [30] el instrumento MUSE [31] de ESO (montado en el Very Large Telescope ). y MICADO (para montar en el E-ELT ). Además, el enfoque datacéntrico para la gestión de datos impulsado por Target ha sido adoptado por la misión Euclid de la ESA . [32] La empresa derivada del proyecto, Target Holding BV, también gestiona una serie de proyectos comerciales con empresas privadas en el norte de los Países Bajos. [33]

La divulgación y la educación públicas también son parte del mandato del proyecto y Target ha organizado muchos eventos públicos. [34] El teatro Infoversum 3D [35] [36] es un derivado del proyecto Target y proporciona una instalación para la visualización y explicación de datos científicos para grupos grandes.

Referencias

  1. ^ "Nederlands project kan 1,5 petabytes verwerken en opslaan" [El proyecto de Países Bajos puede procesar y guardar 1,5 petabytes]. nu.nl (en holandés). 2 de septiembre de 2010.
  2. ^ Edelman, Pieter (2 de junio de 2009). "Miljoenensubsidie ​​voor Noord-Nederlands dataminingprogramma" [Millones en subsidio para el programa de minería de datos del norte de Países Bajos]. Bits y chips.
  3. ^ Witold, Kepinski (19 de noviembre de 2010). "Gronings ICT-project klaar voor petabytes data" [Proyecto TIC de Groningen listo para petabytes de datos]. Computable (en holandés).
  4. ^ Huisman, Zander (27 de mayo de 2011). "Aprycus breidt capaciteit Target-project uit" [Aprycus aumenta la capacidad del proyecto Target]. Computable (en holandés).
  5. ^ Estudios de casos de IBM, que muestran historias de clientes de IBM. "La Universidad de Groningen abre nuevos caminos en la investigación científica". www-03.ibm.com/software/businesscasestudies/us/en/corp?OpenDocument&Site=corp&cty=en_us .
  6. ^ Begeman, Kor; ANBelíkov; DR Boxhoorn; EAValentijn (enero de 2013). "El sistema de información centrado en datos Astro-WISE". Astronomía experimental . 35 (1–2): 1. arXiv : 1208.0447 . Código Bib : 2013ExA....35....1B. doi :10.1007/s10686-012-9311-4. S2CID  118620001.
  7. ^ Mwebaze, Johnson (2012). Linaje de datos extremos en el procesamiento de datos astronómicos ad-hoc (Doctor). Universidad de Groninga. ISBN 9789036757591.
  8. ^ Gilmore, Gerald (enero de 2001). "OPTICON: Red de coordinación de infrarrojos ópticos de la CE para astronomía". Organizaciones y Estrategias en Astronomía II . Biblioteca de Astrofísica y Ciencias Espaciales. vol. 2. págs. 83-102. arXiv : astro-ph/0105562 . Código Bib : 2001ASSL..266...83G. doi :10.1007/978-94-010-0666-8_6. ISBN 978-0-7923-7172-4. S2CID  34032027. {{cite book}}: |journal=ignorado ( ayuda )
  9. ^ Edelman, Peter (20 de julio de 2009). "Miljoenensubsidie ​​voor Noord Nederland Dataminingprogram" [Millones de subvenciones para el programa de minería de datos del norte de Países Bajos]. Bits and Chips (en holandés). pag. 45.
  10. ^ Jainista, R; Sarkar, P.; Subhraveti, D. (2013), "GPFS-SNC: un sistema de archivos de clúster empresarial para Big Data", IBM Journal of Research and Development , 57 (3/4): 5:1, 5:10, doi :10.1147/JRD .2013.2243531
  11. ^ Begeman, Kor; Begeman, KG; Belikov, AN; Boxhoorn, República Dominicana; Dijkstra, F.; Valentijn, EA; Vriend, WJ; Zhao, Z. (2010), "Fusión de tecnologías de red", Journal of Grid Computing , 8 (2): 199–221, doi : 10.1007/s10723-010-9147-y
  12. ^ Luri, X.; Palmer, M.; Arenou, F.; Masana, E.; De Bruijne, J.; Antiche, E.; Babusiaux, C.; Borrachero, R.; Sartoretti, P.; Julbe, F.; Isasi, Y.; Martínez, O.; Robin, AC; Reylé, C.; Jordi, C.; Carrasco, JM (2014). "Descripción general y estadísticas estelares del catálogo Gaia esperado utilizando el generador de objetos Gaia ". Astronomía y Astrofísica . 566 : A119. arXiv : 1404.5861 . Código Bib : 2014A&A...566A.119L. doi :10.1051/0004-6361/201423636. S2CID  119233012.
  13. ^ Malin, B.; Loukides, G.; Benítez, K.; Clayton, EW (2011). "Identificabilidad en biobancos: modelos, medidas y estrategias de mitigación". Genética Humana . 130 (3): 383–392. doi :10.1007/s00439-011-1042-5. PMC 3621020 . PMID  21739176. 
  14. ^ "Proyectos del Centro de Ciencias Electrónicas". esciencecenter.nl .
  15. ^ Belikov, AN; Begeman, K.; Boxhoorn, República Dominicana; Dijkstra, F.; Holties, H.; Meyer-Zhao, Z.; Alquiler, Georgia; Valentijn, EA; Vriend, WJ. (2011). "Sistema de información LOFAR". Proc. De ADASS XXI, ASP Conf. Serie . 461 : 693. arXiv : 1111.6443 . Código Bib : 2012ASPC..461..693B.
  16. ^ Begeman, K.; Boxhoorn, D.; Dijkstra, F.; Holties, HA; Vriend, W.-J (2011). "Objetivo del archivo a largo plazo LOFAR: arquitectura e implementación". Sistemas informáticos de generación futura . 27 (3): 319–328. doi : 10.1016/j.future.2010.08.010.
  17. ^ Holties, HA; van Diepen, G.; et al. (2012). "Análisis de datos en el archivo de largo plazo LOFAR". Serie de conferencias ASP . 461, Software y sistemas de análisis de datos astronómicos XXI: 536. Bibcode :2012ASPC..461..635H.
  18. ^ van der Zant, T; Schomaker, LRB; Zinger, S.; van Schie, H. (2009). "¿Dónde están los motores de búsqueda de documentos escritos a mano?". Reseñas científicas interdisciplinarias . 34 (2–3): 224–235. Código Bib : 2009ISRv...34..224V. doi :10.1179/174327909X441126. S2CID  57037481.
  19. ^ van der Zant, T; Schomaker, LRB; Valentijn, E.; BA Yanikoglu; K. Berkner (28 de enero de 2008). "Procesamiento de imágenes de documentos paralelo a gran escala". En Yanikoglu, Berrin A; Berkner, Kathrin (eds.). Reconocimiento y recuperación de documentos XV . vol. 6815. pág. 68150N. Código Bib : 2008SPIE.6815E..0SV. doi : 10.1117/12.765482. S2CID  40083465.
  20. ^ Schomaker, LRB; BA Yanikoglu; K. Berkner (28 de enero de 2008). "Minería de palabras en una colección manuscrita escasamente etiquetada". En Yanikoglu, Berrin A.; Berkner, Kathrin (eds.). Reconocimiento y recuperación de documentos XV . vol. 6815. págs. 6815–6823. Código Bib : 2008SPIE.6815E..0NS. doi : 10.1117/12.766329. S2CID  15863576.van der Zant, T; Schomaker, LRB; Haak, K. (2008). "Detección de palabras escritas a mano utilizando características de inspiración biológica". Transacciones IEEE sobre análisis de patrones e inteligencia artificial . 30 (11): 1945-1957. doi :10.1109/tpami.2008.144. PMID  18787243. S2CID  18702898.
  21. ^ van Oosten, JP; Schomaker, LRB (2014). "Separabilidad versus prototipicidad en la recuperación de imágenes y palabras escritas a mano" (PDF) . Reconocimiento de patrones . 47 (3): 1031–1038. Código Bib : 2014PatRe..47.1031V. doi :10.1016/j.patcog.2013.09.006. hdl :11370/ca3dd93d-fbd9-4ae3-bfac-90bb148ea1dd. S2CID  215715932.
  22. ^ Noticias RUG (11 de diciembre de 2014). "Prestigiosa subvención inicial del ERC para Mladen Popović". Rijksuniversiteit Groningen . Consultado el 19 de enero de 2015 .
  23. ^ Stolk, Ronald P; Rosmalen JG; Postma DS; de Boer RA; Navis G; Slaets JP; Ormel J; Wolffenbüttel BH (enero de 2008). "Factores de riesgo universales para enfermedades multifactoriales: LifeLines: un estudio poblacional de tres generaciones". Revista europea de epidemiología . 23 (1): 67–74. doi : 10.1007/s10654-007-9204-4 . PMID  18075776.
  24. ^ Francioli, Laurent; Menelaou, Andrónico; et al. (29 de junio de 2014). "Variación de la secuencia del genoma completo, estructura poblacional e historia demográfica de la población holandesa". Genética de la Naturaleza . 46 (8): 818–825. doi :10.1038/ng.3021. PMID  24974849. S2CID  14316238.
  25. ^ van Wijngaarden, Arend (30 de junio de 2014). "Genoom Nederlandse volk ontrafeld". Dagblad van het Noorden.
  26. ^ Teune, Laura Klaaske (2013). Patrones metabólicos de la glucosa en enfermedades cerebrales neurodegenerativas (Tesis totalmente interna (DIV)). Tesis Doctoral.
  27. ^ Jong, JT; JT de Jong; GAV Kleijn; KH Kuijken; EA Valentijn (2013). "La encuesta del kilogrado". Astronomía experimental . 35 (1–2): 25–44. arXiv : 1206.1254 . Código Bib : 2013ExA....35...25D. doi :10.1007/s10686-012-9306-1. S2CID  3082399.
  28. ^ Escuela de Investigación en Astronomía de los Países Bajos (NOVA). «Informe Anual NOVA 2011-2011-2012» (PDF) . nova-astronomía . ESTRELLA NUEVA.
  29. ^ Chelín, Govert (8 de junio de 2011). "El éxito directo se encontró con la supercámara" [Éxito inmediato con la supercámara]. De Volkskrant (en holandés).
  30. ^ "Superscherpe hemelfotos vanaf Chileense berg" [Fotos súper nítidas de los cielos desde la montaña chilena]. NRC Handelsblad (en holandés). 9 de junio de 2011.
  31. ^ Weilbacher, Peter; Peter M. Weilbacher; Olé Streicher; Tanya Urrutia; Aurélien Jarno; Arlette Pécontal-Rousset; Roland Tocino; Petra Böhm (septiembre de 2012). "Diseño y capacidades del software y canalización de reducción de datos MUSE". En Radziwill, Nicole M; Chiozzi, Gianluca (eds.). Software y Ciberinfraestructura para la Astronomía II . vol. 8451. págs. 84510B. Código Bib : 2012SPIE.8451E..0BW. doi :10.1117/12.925114. S2CID  120263291.
  32. ^ Pasiano, Fabio; Fabio Pasián; Juan Hoar; Marc Sauvage; Christophe Dabin; Mauricio Poncet; Oriana Mansutti (septiembre de 2012). "Segmento terrestre científico para la misión Euclid de la ESA". En Radziwill, Nicole M; Chiozzi, Gianluca (eds.). Software y Ciberinfraestructura para la Astronomía II . vol. 8451. pág. 845104. Código Bib : 2012SPIE.8451E..04P. doi : 10.1117/12.926026. S2CID  123008296.
  33. ^ Huisman, Zander (31 de enero de 2013). "Target-project Levert vier nieuwe bedrijven op" [El proyecto Target genera cuatro nuevas empresas]. Computable (en holandés).
  34. ^ Viento, Maike (12 de mayo de 2014). "Rapportage Big Data: De man met één been en vijf kinderen" [Informe Big Data: El hombre con una pierna y cinco hijos]. Dagblad van het Noorden (en holandés). pag. 2.
  35. ^ Viento, Maike (19 de junio de 2014). "Theater Infoversum open voor publiek" [Teatro Infoversum abierto al público]. Groninger Gezinsbode (en holandés). pag. 19.
  36. ^ "Infoversum". De Telegraaf (en holandés). 4 de julio de 2014.