T-REX (servidor web)

T-REX (Tree and Reticulogram Reconstruction) ^[1]^[2] es un servidor web de libre acceso , desarrollado en el departamento de Ciencias de la Computación de la Université du Québec à Montréal , dedicado a la inferencia, validación y visualización de árboles filogenéticos y redes filogenéticas . El servidor web T-REX ^[1]^[2] permite a los usuarios realizar varios métodos populares de análisis filogenético, así como algunas nuevas aplicaciones filogenéticas para inferir, dibujar y validar árboles y redes filogenéticos.

Inferencia filogenética

Los métodos disponibles para inferir y validar árboles filogenéticos mediante distancias son: Neighbor join (NJ), Neighbor joining a gran escala NINJA, BioNJ, UNJ, ADDTREE, MW, FITCH y reconstrucción de orden circular. Para la máxima parsimonia: DNAPARS, PROTPARS, PARS y DOLLOP, todos ellos del paquete PHYLIP , y para la máxima verosimilitud: PhyML, ^[3] RAxML, ^[4] DNAML, DNAMLK, PROML y PROMLK, los cuatro últimos métodos son del paquete PHYLIP .

Dibujo de arbol

Están disponibles tipos de dibujo de árbol jerárquicos verticales, horizontales, radiales y axiales.

Los datos de entrada pueden estar en los tres formatos siguientes: formato Newick , formato PHYLIP y formato FASTA . Todos los resultados gráficos proporcionados por el servidor T-REX pueden guardarse en formato SVG (Scalable Vector Graphics) y luego abrirse y modificarse (por ejemplo, prepararlos para una publicación o presentación) en el editor de gráficos preferido del usuario.

Construcción de árboles

Una aplicación desarrollada para dibujar árboles filogenéticos que permite guardarlos en el formato Newick .

Inferencia de árboles a partir de matrices incompletas

Los siguientes métodos para reconstruir árboles filogenéticos a partir de una matriz de distancias que contiene valores faltantes, es decir, matrices incompletas, están disponibles: método de triángulos de Guénoche y Leclerc (2001), procedimiento ultramétrico para la estimación de valores faltantes de Landry, Lapointe y Kirsch (1996) seguido de NJ, procedimiento aditivo para la estimación de valores faltantes de Landry, Lapointe y Kirsch (1996) seguido de NJ, y el método de mínimos cuadrados ponderados modificados (MW*) de Makarenkov y Lapointe (2004). El método MW* asigna el peso de 1 a las entradas existentes, el peso de 0,5 a las entradas estimadas y el peso de 0 cuando la estimación de la entrada fue imposible. Las simulaciones descritas en (Makarenkov y Lapointe 2004) mostraron que el método MW* supera claramente a los procedimientos de triángulos, ultramétrico y aditivo.

Detección de transferencia horizontal de genes

El servidor T-REX incluye métodos completos y parciales de detección y validación de transferencia horizontal de genes . El programa HGT-Detection ^[5] tiene como objetivo determinar un escenario óptimo, es decir, de mínimo costo, de transferencia horizontal de genes mientras se procede a una conciliación gradual de las especies y los árboles genéticos dados.

Inferencia del reticulograma

El programa de reconstrucción de reticulogramas, es decir, redes reticuladas, primero construye un árbol filogenético de apoyo utilizando uno de los métodos de inferencia de árboles existentes. A continuación, se añade al árbol (o red a partir del paso 2) una rama de reticulación que minimiza la función objetivo de mínimos cuadrados o de mínimos cuadrados ponderados en cada paso del algoritmo. ^[6] Se han propuesto dos criterios estadísticos, Q1 y Q2, para medir la ganancia en el ajuste proporcionado por cada rama de reticulación.

La versión de servidor web de T-REX también ofrece la posibilidad de inferir el árbol de apoyo a partir de una matriz de distancias y luego añadir ramas de reticulación utilizando otra matriz de distancias. Este algoritmo puede ser útil para representar similitudes morfológicas o genéticas entre especies dadas o para identificar eventos de transferencia horizontal de genes utilizando la primera matriz de distancias para inferir el árbol de especies y la segunda matriz (que contiene las distancias relacionadas con los genes) para inferir las ramas de reticulación que representan transferencias horizontales de genes putativas ^[6] . ^[7]

Alineación de secuencias

MAFFT , MUSCLE (software de alineación) y ClustalW , que se encuentran entre las herramientas de alineación de secuencias múltiples más utilizadas , están disponibles con opciones de alineación por pares lenta y rápida.

Modelos de sustitución (transformación de secuencia a distancia)

Los siguientes modelos populares de sustitución de la evolución del ADN y de los aminoácidos, que permiten estimar distancias evolutivas a partir de datos de secuencia, se han incluido en T-REX: distancia no corregida, Jukes-Cantor (Jukes y Cantor 1969), K80 – 2 parámetros (Kimura 1980), T92 (Tamura 1992), Tajima-Nei (Tajima y Nei 1984), Jin-Nei gamma (Jin y Nei 1990), proteína Kimura (Kimura 1983), LogDet (Lockhart et al. 1994), F84 (Felsenstein 1981), WAG (Whelan y Goldman 2001), JTT (Jones et al. 1992) y LG (Le y Gascuel 2008).

Distancia topológica de Robinson y Foulds

Este programa calcula la distancia topológica de la métrica de Robinson-Foulds (RF) (Robinson y Foulds 1981), que es una medida popular de la similitud de los árboles, entre el primer árbol y todos los árboles siguientes especificados por el usuario. Los árboles se pueden proporcionar en los formatos de matriz de distancia o newick. Se lleva a cabo un algoritmo óptimo descrito en (Makarenkov y Leclerc 2000) para calcular la métrica RF.

Conversión de Newick a Matrix

Conversión de matriz de distancias a Newick y de matriz de distancias a formato Newick. Una aplicación interna permite al usuario convertir un árbol filogenético del formato Newick al formato de matriz de distancias y viceversa.

Generador de árboles aleatorios

Esta aplicación genera k árboles filogenéticos aleatorios con n hojas, es decir, especies o taxones, y una longitud de rama promedio l utilizando el procedimiento de generación de árboles aleatorios descrito por Kuhner y Felsenstein (1994), ^[8] donde las variables k , n y l son definidas por el usuario. Las longitudes de rama de los árboles siguen una distribución exponencial. Las longitudes de rama se multiplican por 1+ ax , donde la variable x se obtiene de una distribución exponencial (P( x > k ) = exp(- k )), y la constante a es un factor de ajuste que explica la intensidad de la desviación (como se describe en Guindon y Gascuel (2002), ^[9] el valor de a se estableció en 0,8). Los árboles aleatorios generados por este procedimiento tienen una profundidad de O(log ( n )).

Referencias

^ ab Boc A, Diallo Alpha B, Makarenkov V (junio de 2012). "T-REX: un servidor web para inferir, validar y visualizar árboles y redes filogenéticos". Nucleic Acids Res . 40 (número del servidor web): W573–W579. doi :10.1093/nar/gks485. PMC 3394261 . PMID 22675075.
^ ab Makarenkov V (julio de 2001). "T-REX: Reconstrucción y visualización de árboles filogenéticos y redes de reticulación". Bioinformática . 17 (7): 664–668. doi : 10.1093/bioinformatics/17.7.664 . PMID 11448889.
^ Guindon S, Delsuc F, Dufayard JF, Gascuel O (2009). Estimación de filogenias de máxima verosimilitud con PhyML . Métodos en biología molecular. Vol. 537. Humana Press. págs. 113–137. CiteSeerX 10.1.1.464.7907 . doi :10.1007/978-1-59745-251-9_6. ISBN . 978-1-58829-910-9. Número de identificación personal 19378142. Número de identificación personal 8438167.
^ Stamatakis A. (agosto de 2006). "RAxML-VI-HPC: análisis filogenéticos basados en máxima verosimilitud con miles de taxones y modelos mixtos". Bioinformática . 22 (21): 2688–2690. doi : 10.1093/bioinformatics/btl446 . PMID 16928733.
^ Boc A, Philippe H, Makarenkov V (enero de 2010). "Inferir y validar eventos de transferencia horizontal de genes utilizando disimilitud de bipartición". Syst. Biol . 59 (2): 195–211. doi : 10.1093/sysbio/syp103 . PMID 20525630.
^ ab Legendre P, Makarenkov V (abril de 2002). "Reconstrucción de redes biogeográficas y evolutivas mediante reticulogramas". Syst. Biol . 51 (2): 199–216. doi :10.1080/10635150252899725. PMID 12028728.
^ Makarenkov V, Legendre P (2004). "De un árbol filogenético a una red reticulada". J. Comput. Biol . 11 (1): 195–212. doi :10.1089/106652704773416966. PMID 15072696.
^ Kuhner MK, Felsenstein J (mayo de 1994). "Una comparación de simulación de algoritmos de filogenia bajo tasas evolutivas iguales y desiguales". Mol Biol Evol . 11 (3): 459–468. doi : 10.1093/oxfordjournals.molbev.a040126 . PMID 8015439.
^ Guindon S, Gascuel O (abril de 2002). "Estimación sesgada eficiente de distancias evolutivas cuando las tasas de sustitución varían entre sitios". Mol Biol Evol . 19 (4): 534–43. doi : 10.1093/oxfordjournals.molbev.a004109 . PMID 11919295.

Enlaces externos

Página oficial del servidor web T-REX