Anduril (motor de flujo de trabajo)

Anduril es un marco de flujo de trabajo basado en componentes de código abierto para el análisis de datos científicos ^[2] desarrollado en el Laboratorio de Biología de Sistemas de la Universidad de Helsinki .

Anduril está diseñado para permitir un análisis de datos sistemático, flexible y eficiente, en particular en el campo de los experimentos de alto rendimiento en la investigación biomédica. El sistema de flujo de trabajo proporciona actualmente componentes para varios tipos de análisis, como secuenciación , expresión génica , SNP , ChIP-on-chip , hibridación genómica comparativa y análisis de microarrays de exones, así como citometría y análisis de imágenes celulares .

Arquitectura y características

Un flujo de trabajo es una serie de pasos de procesamiento conectados entre sí de modo que la salida de un paso se utiliza como entrada de otro. Los pasos de procesamiento implementan tareas de análisis de datos, como la importación de datos, las pruebas estadísticas y la generación de informes. En Anduril, los pasos de procesamiento se implementan utilizando componentes, que son códigos ejecutables reutilizables que se pueden escribir en cualquier lenguaje de programación. Los componentes se conectan entre sí en un flujo de trabajo, o una red de componentes, que se ejecuta mediante el motor de flujo de trabajo de Anduril. La configuración del flujo de trabajo se realiza utilizando un lenguaje de scripting simple pero potente, AndurilScript. La configuración y ejecución del flujo de trabajo se puede realizar desde Eclipse , una GUI multipropósito popular, o desde la línea de comandos.

El motor principal de Anduril está escrito en Java y los componentes están escritos en una variedad de lenguajes de programación, incluidos Java, R , MATLAB , Lua , Perl y Python . Los componentes también pueden tener dependencias de bibliotecas de terceros, como Bioconductor . Se proporcionan componentes para la obtención de imágenes de células y el análisis de microarrays, pero los usuarios pueden implementar componentes adicionales. El núcleo de Anduril se ha probado en Linux y Windows.

Anduril 1.0: lenguaje AndurilScript

Hola mundo en AndurilScript es simplemente

 std . echo ( "¡Hola mundo!" )

Los comentarios siguen la sintaxis de Java:

 // Un comentario simple /* Otro comentario simple */ /** Una descripción que se incluirá en la descripción del componente */

Los componentes se invocan asignando sus llamadas a instancias de componentes con nombre. Los nombres no se pueden reutilizar dentro de un único flujo de trabajo. Hay componentes especiales para archivos de entrada que incluyen archivos externos al script. Los tipos atómicos admitidos son entero, flotante, booleano y cadena, y la tipificación se realiza de forma implícita.

 in1 = INPUT ( ruta = "myFile.csv" ) constante1 = 1 componentInstance1 = MyComponent ( inputPort1 = in1 , inputParam1 = constante1 )

Los flujos de trabajo se construyen asignando salidas de instancias de componentes a las entradas de los componentes siguientes.

 componentInstance2 = OtroComponente ( entradaPuerto1 = componentInstance1.salidaPuerto1 )

Las instancias de componentes también se pueden envolver como funciones.

 función MyFunction ( InType1 in1 , ..., opcional InTypeM inM , ParType1 param1 , ..., ParTypeP paramP = defaultP ) -> ( OutType1 out1 , ..., OutTypeN outN ) { ... declaraciones ... devolver registro ( out1 = x1 , ..., outN = xN ) }

Además de las declaraciones estándar if-else y switch-case, AndurilScript también incluye bucles for.

 // Itera sobre 1, 2, ..., 10 array = record () for i : std . range ( 1 , 10 ) { array [ i ] = SomeComponent ( k = i ) }

Extensibilidad

Anduril se puede ampliar en varios niveles. Los usuarios pueden agregar nuevos componentes a los paquetes de componentes existentes. Sin embargo, si el nuevo componente o los nuevos componentes realizan tareas que no están relacionadas con los paquetes existentes, los usuarios también pueden crear nuevos paquetes.

Mapa de Moksis

Moksiskaan es un marco de integración de datos para la investigación del cáncer y la biología molecular . ^[3] El marco proporciona una base de datos relacional que representa un gráfico de entidades biológicas como genes, proteínas, fármacos, vías, enfermedades, procesos biológicos, componentes celulares y funciones moleculares. Además, existe un amplio conjunto de herramientas de análisis y acceso construidas sobre estos datos. La gran mayoría de estas herramientas se implementan como componentes y funciones de Anduril.

Moksiskaan se utiliza principalmente para interpretar listas de genes candidatos obtenidos a partir de estudios genómicos. Sus herramientas se pueden utilizar para generar gráficos de entidades biológicas relacionadas con los genes de entrada. La forma exacta de estos gráficos puede variar desde las predicciones de dianas farmacológicas hasta las series temporales de cascadas de señalización. Algunos de los objetivos de estas herramientas están estrechamente relacionados con IPA .

Véase también

Referencias

^ "anduril-dev/anduril/doc/ChangeLog.txt — Bitbucket". bitbucket.org . Consultado el 25 de marzo de 2021 .
^ Ovaska, K.; Laakso, M.; Haapa-Paananen, S.; Louhimo, R.; Chen, P.; Aittomäki, V.; Valo, E.; Núñez-Fontarnau, J.; Rantanen, V.; Karinen, S.; Nousiainen, K.; Lahesmaa-Korpinen, AM; Miettinen, M.; Saarinen, L.; Kohonen, P.; Wu, J.; Westermarck, J.; Hautaniemi, S. (2010). "El marco de integración de datos a gran escala proporciona una visión integral del glioblastoma multiforme". Medicina del genoma . 2 (9): 65. doi : 10.1186/gm186 . PMC 3092116 . PMID 20822536.
^ Laakso, M.; Hautaniemi, S. (2010). "Plataforma integradora para traducir conjuntos de genes a redes". Bioinformática . 26 (14): 1802–1803. doi : 10.1093/bioinformatics/btq277 . PMID 20507894.

Lectura adicional

Los científicos desarrollan una nueva base de datos que proporciona una visión completa del genoma del glioblastoma multiforme en Cancer Genome Atlas Research Briefs, marzo de 2011, por Catherine Evans.
Almeida, JS (2010). "Ecosistemas computacionales para la genómica médica basada en datos". Genome Medicine . 2 (9): 67. doi : 10.1186/gm188 . PMC 3092118 . PMID 20854645.
Sahu, B.; Laakso, M.; Ovaska, K.; Mirtti, T.; Lundin, J.; Rannikko, A.; Sankila, A.; Turunén, JP; Lundin, M.; Konsti, J.; Vesterinen, T.; Nordling, S.; Kallioniemi, O.; Hautaniemi, S.; Jänne, OA (2011). "Doble función de FoxA1 en la unión del receptor de andrógenos a la cromatina, la señalización de andrógenos y el cáncer de próstata". La Revista EMBO . 30 (19): 3962–3976. doi :10.1038/emboj.2011.328. PMC 3209787 . PMID 21915096.
Pihlajamaa, P.; Zhang, F.-P.; Saarinen, L.; Mikkonen, L.; Hautaniemi, S.; Janne, OA (2011). "El fitoestrógeno genisteína es un modulador del receptor de andrógenos específico de tejido". Endocrinología . 152 (11): 4395–4405. doi : 10.1210/en.2011-0221 . PMID 21878517.
Blom, H.; Rönnlund, D.; Scott, L.; Spicarova, Z.; Rantanen, V.; Widengren, J.; Aperia, A.; Brismar, H. (2011). "Análisis del vecino más cercano de los receptores de dopamina D1 y Na+-K+-ATPases en espinas dendríticas disecadas mediante microscopía STED". Microscopy Research and Technique . 75 (2): 220–228. doi :10.1002/jemt.21046. PMID 21809413. S2CID 206067902.
Ehlers, PI; Kivimäki, AS; Turpeinen, AM; Korpela, R.; Vapaatalo, H. (2011). "Efectos vasoprotectores y reductores de la presión arterial alta de los productos lácteos en la hipertensión experimental". British Journal of Nutrition . 106 (9): 1353–1363. doi : 10.1017/S0007114511001723 . PMID 21736845.
Maliniemi, P.; Carlsson, E.; Kaukola, A.; Ovaska, K.; Niiranen, K.; Saksela, O.; Jeskanen, L.; Hautaniemi, S.; Ranki, A. (2011). "Cambios en el número de copias de NAV3 y genes diana en cánceres de células basales y de células escamosas". Dermatología Experimental . 20 (11): 926–931. doi :10.1111/j.1600-0625.2011.01358.x. PMID 21995814. S2CID 26219786.
Chen, P.; Lepikhova, T.; Hu, Y.; Monni, O.; Hautaniemi, S. (2011). "Método integral de procesamiento de datos de matriz de exones para el análisis cuantitativo de variantes con empalme alternativo". Nucleic Acids Research . 39 (18): e123. doi :10.1093/nar/gkr513. PMC 3185423 . PMID 21745820.
Karinen S., Heikkinen T.; et al. (2011). "Flujo de trabajo de integración de datos para la búsqueda de genes que impulsan enfermedades y variantes genéticas". PLOS ONE . 6 (4): e18636. doi : 10.1371/journal.pone.0018636 . PMC 3075259 . PMID 21533266.
Heinonen M., Hemmes A.; et al. (2011). "Función de la proteína de unión al ARN HuR en el carcinoma ductal in situ de mama". The Journal of Pathology . 224 (4): 529–539. doi :10.1002/path.2889. PMC 3504799 . PMID 21480233.
Louhimo R., Hautaniemi S. (2011). "CNAmet: un paquete R para integrar datos de número de copias, metilación y expresión". Bioinformática . 27 (6): 887–888. doi : 10.1093/bioinformatics/btr019 . PMID 21228048.

Enlaces externos

Sitio web oficial de Anduril
Repositorio de código Anduril
Sitio web oficial de Moksiskaan
Implementación de AndurilScript de las 99 botellas de cerveza de Donald Knuth