Anduril (motor de flujo de trabajo)

Anduril es un marco de flujo de trabajo basado en componentes de código abierto para el análisis de datos científicos ^[2] desarrollado en el Laboratorio de Biología de Sistemas de la Universidad de Helsinki .

Anduril está diseñado para permitir un análisis de datos sistemático, flexible y eficiente, particularmente en el campo de experimentos de alto rendimiento en investigación biomédica. Actualmente, el sistema de flujo de trabajo proporciona componentes para varios tipos de análisis, como secuenciación , expresión genética , SNP , ChIP-on-chip , hibridación genómica comparativa y análisis de microarrays de exones, así como citometría y análisis de imágenes celulares .

Arquitectura y características

Un flujo de trabajo es una serie de pasos de procesamiento conectados entre sí de modo que la salida de un paso se utiliza como entrada de otro. Los pasos de procesamiento implementan tareas de análisis de datos, como la importación de datos, pruebas estadísticas y generación de informes. En Anduril, los pasos de procesamiento se implementan mediante componentes, que son código ejecutable reutilizable que se puede escribir en cualquier lenguaje de programación. Los componentes están conectados entre sí en un flujo de trabajo, o una red de componentes, que es ejecutado por el motor de flujo de trabajo Anduril. La configuración del flujo de trabajo se realiza utilizando un lenguaje de programación simple pero potente, AndurilScript. La configuración y ejecución del flujo de trabajo se puede realizar desde Eclipse , una popular GUI multipropósito, o desde la línea de comandos.

El motor central de Anduril está escrito en Java y los componentes están escritos en una variedad de lenguajes de programación, incluidos Java, R , MATLAB , Lua , Perl y Python . Los componentes también pueden depender de bibliotecas de terceros, como Bioconductor . Se proporcionan componentes para imágenes celulares y análisis de microarrays, pero los usuarios pueden implementar componentes adicionales. El núcleo de Anduril ha sido probado en Linux y Windows.

Anduril 1.0: lenguaje AndurilScript

Hola mundo en AndurilScript es simplemente

 estándar . echo ( "¡Hola mundo!" )

Los comentarios siguen la sintaxis de Java:

 // Un comentario simple /* Otro comentario simple */ /** Una descripción que se incluirá en la descripción del componente */

Los componentes se llaman asignando sus llamadas a instancias de componentes con nombre. Los nombres no se pueden reutilizar dentro de un único flujo de trabajo. Hay componentes especiales para archivos de entrada que incluyen archivos externos al script. Los tipos atómicos admitidos son entero, flotante, booleano y cadena, y la escritura se realiza de forma implícita.

 in1 = ENTRADA ( ruta = "myFile.csv" ) constante1 = 1 componenteInstancia1 = MiComponente ( entradaPuerto1 = in1 , entradaParam1 = constante1 )

Los flujos de trabajo se construyen asignando salidas de instancias de componentes a entradas de los siguientes componentes.

 InstanciaComponente2 = OtroComponente ( PuertoEntrada1 = InstanciaComponente1 . PuertoSalida1 )

Las instancias de componentes también se pueden empaquetar como funciones.

 función MiFunción ( InType1 in1 , ..., opcional InTypeM inM , ParType1 param1 , ..., ParTypeP paramP = defaultP ) -> ( OutType1 out1 , ..., OutTypeN outN ) { ... declaraciones ... devolver registro ( salida1 = x1 , ..., salidaN = xN ) }

Además de las declaraciones estándar if-else y switch-case, AndurilScript también incluye bucles for.

 // Itera sobre 1, 2, ..., 10 matriz = registro () para i : std . rango ( 1 , 10 ) { matriz [ i ] = Algún componente ( k = i ) }

Extensibilidad

Anduril se puede ampliar en múltiples niveles. Los usuarios pueden agregar nuevos componentes a los paquetes de componentes existentes. Sin embargo, si el nuevo componente o componentes realizan tareas que no están relacionadas con los paquetes existentes, los usuarios también pueden crear nuevos paquetes.

Moksiskaan

Moksiskaan es un marco de integración de datos para la investigación del cáncer y la biología molecular . ^[3] El marco proporciona una base de datos relacional que representa un gráfico de entidades biológicas como genes, proteínas, fármacos, vías, enfermedades, procesos biológicos, componentes celulares y funciones moleculares. Además, existe un amplio conjunto de herramientas de análisis y adhesión construidas sobre estos datos. La gran mayoría de estas herramientas se implementan como componentes y funciones de Anduril.

Moksiskaan se utiliza principalmente para interpretar listas de genes candidatos obtenidos de los estudios genómicos. Sus herramientas se pueden utilizar para generar gráficos de entidades biológicas relacionadas con los genes de entrada. La forma exacta de estos gráficos puede variar desde las predicciones del objetivo del fármaco hasta las series temporales de cascadas de señalización. Algunos de los objetivos de estas herramientas están estrechamente relacionados con la API .

Ver también

Referencias

^ "anduril-dev/anduril/doc/ChangeLog.txt — Bitbucket". bitbucket.org . Consultado el 25 de marzo de 2021 .
^ Ovaska, K.; Laakso, M.; Haapa-Paananen, S.; Louhimo, R.; Chen, P.; Aittomäki, V.; Valo, E.; Núñez-Fontarnau, J.; Rantanen, V.; Karinen, S.; Nousiainen, K.; Lahesmaa-Korpinen, AM; Miettinen, M.; Saarinen, L.; Kohonen, P.; Wu, J.; Westermarck, J.; Hautaniemi, S. (2010). "El marco de integración de datos a gran escala proporciona una visión integral del glioblastoma multiforme". Medicina del genoma . 2 (9): 65. doi : 10.1186/gm186 . PMC 3092116 . PMID 20822536.
^ Laakso, M.; Hautaniemi, S. (2010). "Plataforma integradora para traducir conjuntos de genes a redes". Bioinformática . 26 (14): 1802–1803. doi : 10.1093/bioinformática/btq277 . PMID 20507894.

Otras lecturas

Los científicos desarrollan una nueva base de datos que proporciona una visión completa del genoma del glioblastoma multiforme en Cancer Genome Atlas Research Briefs, marzo de 2011, de Catherine Evans.
Almeida, JS (2010). "Ecosistemas computacionales para genómica médica basada en datos". Medicina del genoma . 2 (9): 67. doi : 10.1186/gm188 . PMC 3092118 . PMID 20854645.
Sahu, B.; Laakso, M.; Ovaska, K.; Mirtti, T.; Lundin, J.; Rannikko, A.; Sankila, A.; Turunén, JP; Lundin, M.; Konsti, J.; Vesterinen, T.; Nordling, S.; Kallioniemi, O.; Hautaniemi, S.; Jänne, OA (2011). "Doble función de FoxA1 en la unión del receptor de andrógenos a la cromatina, la señalización de andrógenos y el cáncer de próstata". La Revista EMBO . 30 (19): 3962–3976. doi :10.1038/emboj.2011.328. PMC 3209787 . PMID 21915096.
Pihlajamaa, P.; Zhang, F.-P.; Saarinen, L.; Mikkonen, L.; Hautaniemi, S.; Janne, OA (2011). "El fitoestrógeno genisteína es un modulador del receptor de andrógenos específico de tejido". Endocrinología . 152 (11): 4395–4405. doi : 10.1210/en.2011-0221 . PMID 21878517.
Blom, H.; Rönnlund, D.; Scott, L.; Spicarova, Z.; Rantanen, V.; Widengren, J.; Aperia, A.; Brismar, H. (2011). "Análisis del vecino más cercano de receptores de dopamina D1 y Na + -K + -ATPasas en espinas dendríticas disecadas por microscopía STED". Investigación y Técnica de Microscopía . 75 (2): 220–228. doi :10.1002/jemt.21046. PMID 21809413. S2CID 206067902.
Ehlers, PI; Kivimäki, AS; Turpeinen, AM; Korpela, R.; Vapaatalo, H. (2011). "Efectos vasoprotectores y reductores de la presión arterial alta de los productos lácteos en la hipertensión experimental". Revista británica de nutrición . 106 (9): 1353-1363. doi : 10.1017/S0007114511001723 . PMID 21736845.
Maliniemi, P.; Carlsson, E.; Kaukola, A.; Ovaska, K.; Niiranen, K.; Saksela, O.; Jeskanen, L.; Hautaniemi, S.; Ranki, A. (2011). "Cambios en el número de copias de NAV3 y genes diana en cánceres de células basales y de células escamosas". Dermatología Experimental . 20 (11): 926–931. doi :10.1111/j.1600-0625.2011.01358.x. PMID 21995814. S2CID 26219786.
Chen, P.; Lepikhova, T.; Hu, Y.; Monni, O.; Hautaniemi, S. (2011). "Método integral de procesamiento de datos de matriz de exones para el análisis cuantitativo de variantes empalmadas alternativas". Investigación de ácidos nucleicos . 39 (18): e123. doi : 10.1093/nar/gkr513. PMC 3185423 . PMID 21745820.
Karinen S., Heikkinen T.; et al. (2011). "Flujo de trabajo de integración de datos para la búsqueda de genes y variantes genéticas que impulsan enfermedades". MÁS UNO . 6 (4): e18636. doi : 10.1371/journal.pone.0018636 . PMC 3075259 . PMID 21533266.
Heinonen M., Hemmes A.; et al. (2011). "Papel de la proteína de unión a ARN HuR en el carcinoma ductal in situ de mama". La Revista de Patología . 224 (4): 529–539. doi : 10.1002/ruta.2889. PMC 3504799 . PMID 21480233.
Louhimo R., Hautaniemi S. (2011). "CNAmet: un paquete R para integrar datos de expresión, metilación y número de copias". Bioinformática . 27 (6): 887–888. doi : 10.1093/bioinformática/btr019 . PMID 21228048.

enlaces externos

Sitio web oficial de Anduril
Repositorio de código Anduril
Sitio web oficial de Moksiskaan
Implementación de AndurilScript de 99 botellas de cerveza de Donald Knuth