stringtranslate.com

Piloto de oleoducto

Pipeline Pilot es un programa de software de escritorio vendido por Dassault Systèmes para procesar y analizar datos. Originalmente se utilizó por sus capacidades de análisis y ETL ( extracción, transformación y carga ) básicas, que se han ampliado con el tiempo.

El programa tiene la capacidad de diseñar flujos de trabajo de datos utilizando una interfaz gráfica de usuario. Es un software de programación visual y de flujo de datos y se ha utilizado en quimioinformática , QSAR , [1] [2] [3] secuenciación de próxima generación , [4] análisis de imágenes , [5] [6] y análisis de texto .

Historia

Pipeline Pilot fue creado por SciTegic . Posteriormente, BIOVIA adquirió SciTegic y Pipeline Pilot en 2004. BIOVIA fue adquirida por Dassault Systèmes en 2014.

El producto se amplió desde un enfoque inicial en la química para incluir capacidades generales de extracción, transformación y carga (ETL), analíticas y de procesamiento de datos.

Descripción general

Pipeline Pilot es parte de una clase de productos de software que proporcionan interfaces de usuario para manipular y analizar datos. Al igual que otros productos gráficos ETL, permite a los usuarios extraer datos de diferentes fuentes, como archivos CSV, archivos de texto y bases de datos.

La interfaz gráfica de usuario , llamada Pipeline Pilot Professional Client, permite a los usuarios arrastrar y soltar unidades de procesamiento de datos discretas llamadas "componentes". Los componentes pueden cargar, filtrar, unir o manipular datos. Los componentes también pueden crear modelos de regresión, entrenar redes neuronales o procesar conjuntos de datos en informes PDF. Pipeline Pilot implementa un paradigma de componentes . Los componentes se representan como nodos en un flujo de trabajo. En un sentido matemático, los componentes se modelan como nodos en un gráfico dirigido : las "tuberías" (bordes del gráfico) conectan componentes y mueven datos de un nodo a otro, donde se realizan operaciones con los datos.

Los usuarios pueden elegir entre componentes que vienen preinstalados o crear sus propios componentes en flujos de trabajo llamados "protocolos". Los protocolos son conjuntos de componentes vinculados. Los protocolos se pueden guardar, reutilizar y compartir. Los usuarios pueden mezclar y combinar los componentes que se proporcionan con el software de BIOVIA con sus propios componentes personalizados. Las conexiones entre dos componentes se denominan "tuberías" y en el software se visualizan como dos componentes conectados por una tubería. Los datos fluyen de izquierda a derecha a lo largo de las tuberías. Pipeline Pilot puede condensar visualmente una serie de manipulaciones de datos que involucran muchos componentes.

Colecciones de componentes

Pipeline Pilot presenta una serie de complementos llamados "colecciones". Las colecciones son grupos de funciones especializadas, como procesar información genética o analizar polímeros, que se ofrecen a los usuarios finales por una tarifa de licencia adicional. Actualmente, existen varias de estas colecciones. [7]

Guiones personalizados

Pipeline Pilot se utiliza a menudo cuando se procesan uno o más conjuntos de datos grandes (1TB+) y/o complejos. Al principio de su desarrollo, Pipeline Pilot creó un lenguaje de secuencias de comandos llamado "PilotScript" que permitía a los usuarios finales escribir secuencias de comandos de programación básicas que podrían incorporarse a un protocolo de Pipeline Pilot. Las versiones posteriores ampliaron el soporte para una variedad de lenguajes de programación, incluidos Python , .NET , Matlab , Perl , SQL , Java , VBScript y R. [8] El producto admite varias API para diferentes lenguajes de programación que se pueden ejecutar sin la interfaz gráfica de usuario del programa.

La sintaxis de PilotScript se basa en PLSQL . Se puede utilizar en componentes como el Manipulador personalizado (PilotScript) o el Filtro personalizado (PilotScript) . Como ejemplo, la siguiente secuencia de comandos se puede utilizar para agregar una propiedad denominada "Hola" a cada registro que pasa por un componente de secuencia de comandos personalizado en un protocolo Pipeline Pilot. El valor de la propiedad es la cadena "¡Hola mundo!".

Hola := "¡Hola mundo!" ;  

Referencias

  1. ^ Hassan, Moisés; Marrón, Robert D.; Varma-O'Brien, Shikha; Rogers, David (2007). "Análisis y aprendizaje de quimioinformática en un entorno de canalización de datos". ChemInform . 38 (12). doi : 10.1002/chin.200712278. ISSN  0931-7597.
  2. ^ Hu, sí; Lounkine, Eugen; Bajorath, Jürgen (2009). "Mejora del rendimiento de búsqueda de huellas dactilares de conectividad extendida mediante el filtrado de funciones orientadas a la actividad y la aplicación de una función de similitud dependiente de la densidad de bits". ChemMedChem . 4 (4): 540–548. doi :10.1002/cmdc.200800408. ISSN  1860-7179. PMID  19263458. S2CID  35868099.
  3. ^ Guerra, Wendy A. (2012). "Sistemas de flujo de trabajo científico: Pipeline Pilot y KNIME". Revista de diseño molecular asistido por computadora . 26 (7): 801–804. Código Bib : 2012JCAMD..26..801W. doi :10.1007/s10822-012-9577-7. ISSN  0920-654X. PMC 3414708 . PMID  22644661. 
  4. ^ "Accelrys ingresa al mercado de secuenciación de próxima generación con la colección NGS para Pipeline Pilot". Cable comercial. 23 de febrero de 2011 . Consultado el 15 de febrero de 2013 .
  5. ^ Rabal, Obdulia; Enlace, Wolfgang; G. Serelde, Beatriz; Bischoff, James R.; Oyarzabal, Julen (2010). "Un sistema integrado de un solo paso para extraer, analizar y anotar toda la información relevante del cribado celular de bibliotecas químicas basado en imágenes". Biosistemas moleculares . 6 (4): 711–20. doi :10.1039/b919830j. ISSN  1742-206X. PMID  20237649.
  6. ^ Paveley, Ross A.; Mansour, Nuha R.; Hallyburton, Irene; Bleicher, Leo S.; Benn, Alex E.; Mikic, Ivana; Guidi, Alessandra; Gilbert, Ian H.; Hopkins, Andrew L.; Bickle, Quentin D. (2012). "Detección de alto contenido de todo el organismo mediante clasificación bayesiana basada en imágenes y sin etiquetas para enfermedades parasitarias". PLOS Enfermedades tropicales desatendidas . 6 (7): e1762. doi : 10.1371/journal.pntd.0001762 . ISSN  1935-2735. PMC 3409125 . PMID  22860151. 
  7. ^ "Colecciones de componentes piloto de tuberías". Accelrys. Archivado desde el original el 15 de enero de 2013 . Consultado el 26 de enero de 2013 .
  8. ^ "Hoja de datos de recopilación de componentes de integración de Pipeline Pilot" (PDF) . Accelrys . Consultado el 8 de febrero de 2013 .